🔄 卡若AI 同步 2026-03-03 04:51 | 更新:金盾、运营中枢工作台 | 排除 >20MB: 14 个
This commit is contained in:
104
01_卡资(金)/金盾_数据安全/存客宝副本管理/抖音视频文案一键解析_开源方案汇总.md
Normal file
104
01_卡资(金)/金盾_数据安全/存客宝副本管理/抖音视频文案一键解析_开源方案汇总.md
Normal file
@@ -0,0 +1,104 @@
|
|||||||
|
# 抖音视频文案一键解析 · 开源方案汇总
|
||||||
|
|
||||||
|
> 来源:GitHub / 掘金 / Gitee 等平台检索整理 | 更新:2026-03-02
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## 一、GitHub 上的主要项目
|
||||||
|
|
||||||
|
### 1. douyin-text-extractor(推荐,一键链路完整)
|
||||||
|
|
||||||
|
- **仓库**:<https://github.com/wjllance/douyin-text-extractor>
|
||||||
|
- **技术**:Node.js + TypeScript
|
||||||
|
- **流程**:解析分享链接 → 下载无水印视频 → 提取音频 → 调用语音 API 转文本
|
||||||
|
- **特点**:进度回调、自动清理临时文件、支持 SiliconFlow / OpenAI 等语音 API
|
||||||
|
- **安装**:`npm install douyin-text-extractor`
|
||||||
|
- **一键用法**:
|
||||||
|
```javascript
|
||||||
|
const service = new DouyinService({ speechApiKey: "your-speech-api-key" });
|
||||||
|
const result = await service.extractText("复制的抖音分享链接");
|
||||||
|
console.log(result.extractedText);
|
||||||
|
```
|
||||||
|
- **命令行**:
|
||||||
|
```bash
|
||||||
|
node scripts/douyin.js to-text "https://v.douyin.com/xxx"
|
||||||
|
node scripts/douyin.js batch links.txt # 批量
|
||||||
|
```
|
||||||
|
- **依赖**:Node.js ≥ 16、FFmpeg
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
### 2. douyin-AI-wenan(文案后处理)
|
||||||
|
|
||||||
|
- **仓库**:<https://github.com/fangyuan99/douyin-ai-wenan>
|
||||||
|
- **技术**:Vue 3 + Coze
|
||||||
|
- **功能**:对已提取的抖音视频文案做智能修正(同音字、标点等),可推到 Memos
|
||||||
|
- **定位**:文案清洗与工作流,需配合其他工具做「视频→文案」提取
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
### 3. Short-Video-Link 解析与文案提取
|
||||||
|
|
||||||
|
- **仓库**:<https://github.com/zhangyanhua0913/Short-Video-Link--Homepage-Link-Parsing-and-Caption-Extraction>
|
||||||
|
- **功能**:短视频链接/主页链接解析 + 文案提取,支持批量、多语言
|
||||||
|
- **特点**:结合大模型提升多语言/方言准确度
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
### 4. DouYinParse(仅解析元数据)
|
||||||
|
|
||||||
|
- **仓库**:<https://github.com/PearNoDec/DouYinParse>
|
||||||
|
- **技术**:PHP
|
||||||
|
- **功能**:作者、标题、点赞/评论/收藏、发布时间、封面、无水印链接等,**不含语音转文案**
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
### 5. copywrite(阿里云语音转写)
|
||||||
|
|
||||||
|
- **仓库**:GitHub / Gitee 搜 `friend-nicen/copywrite`
|
||||||
|
- **功能**:基于阿里云音频转文字 API,自动切换视频并保存视频/音频/文案
|
||||||
|
- **适合**:已有阿里云、要批量自动化
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## 二、掘金 / 社区上的流程方案
|
||||||
|
|
||||||
|
### 1. 高效短视频工作流(日均 2 万+ 条文案)
|
||||||
|
|
||||||
|
- **思路**:RPA 或第三方采集 → 无水印下载(抖音/小红书/B 站)→ FFmpeg 转音频 → **Whisper 或 SenseVoice** 转写 → AI 清洗排版
|
||||||
|
- **引擎**:Whisper(准、慢)/ SenseVoice(快,约 3–5 秒一条)
|
||||||
|
- **硬件参考**:GPU 8G+ 显存,32GB+ 内存
|
||||||
|
|
||||||
|
### 2. video-analyzer(本地视频分析)
|
||||||
|
|
||||||
|
- **能力**:关键帧抽取 + 音频转录 + 视频描述生成
|
||||||
|
- **技术**:Llama 11B 视觉 + OpenAI Whisper,本地运行
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## 三、与本机现有方案的对比
|
||||||
|
|
||||||
|
| 能力 | 本机现有(MLX-Whisper + 脚本) | douyin-text-extractor |
|
||||||
|
|----------------|------------------------------------|---------------------------------|
|
||||||
|
| 下载抖音 | 需 Cookie(yt-dlp) | 库内集成解析与下载(可能也需 Cookie) |
|
||||||
|
| 语音转文案 | 本地 MLX-Whisper,无需 API | 需语音 API(SiliconFlow/OpenAI 等) |
|
||||||
|
| 一键命令 | 本地视频文件一条命令 / 脚本 | 链接 → `extractText(shareLink)` |
|
||||||
|
| 批量 | 脚本可接文件列表 | 支持 `batch links.txt` |
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## 四、可选「一键解析」流程归纳
|
||||||
|
|
||||||
|
1. **只要本地、不买 API**:本机 yt-dlp(或浏览器导出 Cookie)+ 本地 MLX-Whisper 脚本(你已有)。
|
||||||
|
2. **要「链接进、文案出」且接受云 API**:用 **douyin-text-extractor**,配好 `speechApiKey` 后直接 `extractText(分享链接)` 或命令行 `to-text`。
|
||||||
|
3. **要批量 + 文案清洗**:douyin-text-extractor 批量 + douyin-AI-wenan 或自建 Coze/脚本做后处理。
|
||||||
|
4. **已有阿里云**:copywrite 等基于阿里云语音转写的方案可对接现有资源。
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## 五、参考链接
|
||||||
|
|
||||||
|
- douyin-text-extractor:<https://github.com/wjllance/douyin-text-extractor>
|
||||||
|
- douyin-AI-wenan:<https://github.com/fangyuan99/douyin-ai-wenan>
|
||||||
|
- 掘金「借助 AI 打造高效短视频工作流」:搜索「掘金 抖音 文案 2万」
|
||||||
|
- 本机脚本:`01_卡资(金)/金盾_数据安全/存客宝副本管理/douyin_video_to_text.sh`(优先 MLX-Whisper)
|
||||||
@@ -209,3 +209,4 @@
|
|||||||
| 2026-03-02 13:43:12 | 🔄 卡若AI 同步 2026-03-02 13:43 | 更新:Cursor规则、金仓、水桥平台对接、总索引与入口、运营中枢参考资料、运营中枢工作台 | 排除 >20MB: 14 个 |
|
| 2026-03-02 13:43:12 | 🔄 卡若AI 同步 2026-03-02 13:43 | 更新:Cursor规则、金仓、水桥平台对接、总索引与入口、运营中枢参考资料、运营中枢工作台 | 排除 >20MB: 14 个 |
|
||||||
| 2026-03-02 13:50:12 | 🔄 卡若AI 同步 2026-03-02 13:49 | 更新:金仓、运营中枢工作台 | 排除 >20MB: 14 个 |
|
| 2026-03-02 13:50:12 | 🔄 卡若AI 同步 2026-03-02 13:49 | 更新:金仓、运营中枢工作台 | 排除 >20MB: 14 个 |
|
||||||
| 2026-03-02 17:10:43 | 🔄 卡若AI 同步 2026-03-02 17:10 | 更新:金仓、运营中枢工作台 | 排除 >20MB: 14 个 |
|
| 2026-03-02 17:10:43 | 🔄 卡若AI 同步 2026-03-02 17:10 | 更新:金仓、运营中枢工作台 | 排除 >20MB: 14 个 |
|
||||||
|
| 2026-03-02 20:52:08 | 🔄 卡若AI 同步 2026-03-02 20:52 | 更新:金盾、卡木、总索引与入口、运营中枢工作台 | 排除 >20MB: 14 个 |
|
||||||
|
|||||||
@@ -212,3 +212,4 @@
|
|||||||
| 2026-03-02 13:43:12 | 成功 | 成功 | 🔄 卡若AI 同步 2026-03-02 13:43 | 更新:Cursor规则、金仓、水桥平台对接、总索引与入口、运营中枢参考资料、运营中枢工作台 | 排除 >20MB: 14 个 | [仓库](http://open.quwanzhi.com:3000/fnvtk/karuo-ai) [百科](http://open.quwanzhi.com:3000/fnvtk/karuo-ai/wiki) |
|
| 2026-03-02 13:43:12 | 成功 | 成功 | 🔄 卡若AI 同步 2026-03-02 13:43 | 更新:Cursor规则、金仓、水桥平台对接、总索引与入口、运营中枢参考资料、运营中枢工作台 | 排除 >20MB: 14 个 | [仓库](http://open.quwanzhi.com:3000/fnvtk/karuo-ai) [百科](http://open.quwanzhi.com:3000/fnvtk/karuo-ai/wiki) |
|
||||||
| 2026-03-02 13:50:12 | 成功 | 成功 | 🔄 卡若AI 同步 2026-03-02 13:49 | 更新:金仓、运营中枢工作台 | 排除 >20MB: 14 个 | [仓库](http://open.quwanzhi.com:3000/fnvtk/karuo-ai) [百科](http://open.quwanzhi.com:3000/fnvtk/karuo-ai/wiki) |
|
| 2026-03-02 13:50:12 | 成功 | 成功 | 🔄 卡若AI 同步 2026-03-02 13:49 | 更新:金仓、运营中枢工作台 | 排除 >20MB: 14 个 | [仓库](http://open.quwanzhi.com:3000/fnvtk/karuo-ai) [百科](http://open.quwanzhi.com:3000/fnvtk/karuo-ai/wiki) |
|
||||||
| 2026-03-02 17:10:43 | 成功 | 成功 | 🔄 卡若AI 同步 2026-03-02 17:10 | 更新:金仓、运营中枢工作台 | 排除 >20MB: 14 个 | [仓库](http://open.quwanzhi.com:3000/fnvtk/karuo-ai) [百科](http://open.quwanzhi.com:3000/fnvtk/karuo-ai/wiki) |
|
| 2026-03-02 17:10:43 | 成功 | 成功 | 🔄 卡若AI 同步 2026-03-02 17:10 | 更新:金仓、运营中枢工作台 | 排除 >20MB: 14 个 | [仓库](http://open.quwanzhi.com:3000/fnvtk/karuo-ai) [百科](http://open.quwanzhi.com:3000/fnvtk/karuo-ai/wiki) |
|
||||||
|
| 2026-03-02 20:52:08 | 成功 | 成功 | 🔄 卡若AI 同步 2026-03-02 20:52 | 更新:金盾、卡木、总索引与入口、运营中枢工作台 | 排除 >20MB: 14 个 | [仓库](http://open.quwanzhi.com:3000/fnvtk/karuo-ai) [百科](http://open.quwanzhi.com:3000/fnvtk/karuo-ai/wiki) |
|
||||||
|
|||||||
Reference in New Issue
Block a user