🔄 卡若AI 同步 2026-03-03 04:51 | 更新:金盾、运营中枢工作台 | 排除 >20MB: 14 个

This commit is contained in:
2026-03-03 04:51:50 +08:00
parent 8ad0ea8b6a
commit 51f124ebc2
3 changed files with 106 additions and 0 deletions

View File

@@ -0,0 +1,104 @@
# 抖音视频文案一键解析 · 开源方案汇总
> 来源GitHub / 掘金 / Gitee 等平台检索整理 | 更新2026-03-02
---
## 一、GitHub 上的主要项目
### 1. douyin-text-extractor推荐一键链路完整
- **仓库**<https://github.com/wjllance/douyin-text-extractor>
- **技术**Node.js + TypeScript
- **流程**:解析分享链接 → 下载无水印视频 → 提取音频 → 调用语音 API 转文本
- **特点**:进度回调、自动清理临时文件、支持 SiliconFlow / OpenAI 等语音 API
- **安装**`npm install douyin-text-extractor`
- **一键用法**
```javascript
const service = new DouyinService({ speechApiKey: "your-speech-api-key" });
const result = await service.extractText("复制的抖音分享链接");
console.log(result.extractedText);
```
- **命令行**
```bash
node scripts/douyin.js to-text "https://v.douyin.com/xxx"
node scripts/douyin.js batch links.txt # 批量
```
- **依赖**Node.js ≥ 16、FFmpeg
---
### 2. douyin-AI-wenan文案后处理
- **仓库**<https://github.com/fangyuan99/douyin-ai-wenan>
- **技术**Vue 3 + Coze
- **功能**:对已提取的抖音视频文案做智能修正(同音字、标点等),可推到 Memos
- **定位**:文案清洗与工作流,需配合其他工具做「视频→文案」提取
---
### 3. Short-Video-Link 解析与文案提取
- **仓库**<https://github.com/zhangyanhua0913/Short-Video-Link--Homepage-Link-Parsing-and-Caption-Extraction>
- **功能**:短视频链接/主页链接解析 + 文案提取,支持批量、多语言
- **特点**:结合大模型提升多语言/方言准确度
---
### 4. DouYinParse仅解析元数据
- **仓库**<https://github.com/PearNoDec/DouYinParse>
- **技术**PHP
- **功能**:作者、标题、点赞/评论/收藏、发布时间、封面、无水印链接等,**不含语音转文案**
---
### 5. copywrite阿里云语音转写
- **仓库**GitHub / Gitee 搜 `friend-nicen/copywrite`
- **功能**:基于阿里云音频转文字 API自动切换视频并保存视频/音频/文案
- **适合**:已有阿里云、要批量自动化
---
## 二、掘金 / 社区上的流程方案
### 1. 高效短视频工作流(日均 2 万+ 条文案)
- **思路**RPA 或第三方采集 → 无水印下载(抖音/小红书/B 站)→ FFmpeg 转音频 → **Whisper 或 SenseVoice** 转写 → AI 清洗排版
- **引擎**Whisper准、慢/ SenseVoice约 35 秒一条)
- **硬件参考**GPU 8G+ 显存32GB+ 内存
### 2. video-analyzer本地视频分析
- **能力**:关键帧抽取 + 音频转录 + 视频描述生成
- **技术**Llama 11B 视觉 + OpenAI Whisper本地运行
---
## 三、与本机现有方案的对比
| 能力 | 本机现有MLX-Whisper + 脚本) | douyin-text-extractor |
|----------------|------------------------------------|---------------------------------|
| 下载抖音 | 需 Cookieyt-dlp | 库内集成解析与下载(可能也需 Cookie |
| 语音转文案 | 本地 MLX-Whisper无需 API | 需语音 APISiliconFlow/OpenAI 等) |
| 一键命令 | 本地视频文件一条命令 / 脚本 | 链接 → `extractText(shareLink)` |
| 批量 | 脚本可接文件列表 | 支持 `batch links.txt` |
---
## 四、可选「一键解析」流程归纳
1. **只要本地、不买 API**:本机 yt-dlp或浏览器导出 Cookie+ 本地 MLX-Whisper 脚本(你已有)。
2. **要「链接进、文案出」且接受云 API**:用 **douyin-text-extractor**,配好 `speechApiKey` 后直接 `extractText(分享链接)` 或命令行 `to-text`。
3. **要批量 + 文案清洗**douyin-text-extractor 批量 + douyin-AI-wenan 或自建 Coze/脚本做后处理。
4. **已有阿里云**copywrite 等基于阿里云语音转写的方案可对接现有资源。
---
## 五、参考链接
- douyin-text-extractor<https://github.com/wjllance/douyin-text-extractor>
- douyin-AI-wenan<https://github.com/fangyuan99/douyin-ai-wenan>
- 掘金「借助 AI 打造高效短视频工作流」:搜索「掘金 抖音 文案 2万」
- 本机脚本:`01_卡资/金盾_数据安全/存客宝副本管理/douyin_video_to_text.sh`(优先 MLX-Whisper

View File

@@ -209,3 +209,4 @@
| 2026-03-02 13:43:12 | 🔄 卡若AI 同步 2026-03-02 13:43 | 更新Cursor规则、金仓、水桥平台对接、总索引与入口、运营中枢参考资料、运营中枢工作台 | 排除 >20MB: 14 个 | | 2026-03-02 13:43:12 | 🔄 卡若AI 同步 2026-03-02 13:43 | 更新Cursor规则、金仓、水桥平台对接、总索引与入口、运营中枢参考资料、运营中枢工作台 | 排除 >20MB: 14 个 |
| 2026-03-02 13:50:12 | 🔄 卡若AI 同步 2026-03-02 13:49 | 更新:金仓、运营中枢工作台 | 排除 >20MB: 14 个 | | 2026-03-02 13:50:12 | 🔄 卡若AI 同步 2026-03-02 13:49 | 更新:金仓、运营中枢工作台 | 排除 >20MB: 14 个 |
| 2026-03-02 17:10:43 | 🔄 卡若AI 同步 2026-03-02 17:10 | 更新:金仓、运营中枢工作台 | 排除 >20MB: 14 个 | | 2026-03-02 17:10:43 | 🔄 卡若AI 同步 2026-03-02 17:10 | 更新:金仓、运营中枢工作台 | 排除 >20MB: 14 个 |
| 2026-03-02 20:52:08 | 🔄 卡若AI 同步 2026-03-02 20:52 | 更新:金盾、卡木、总索引与入口、运营中枢工作台 | 排除 >20MB: 14 个 |

View File

@@ -212,3 +212,4 @@
| 2026-03-02 13:43:12 | 成功 | 成功 | 🔄 卡若AI 同步 2026-03-02 13:43 | 更新Cursor规则、金仓、水桥平台对接、总索引与入口、运营中枢参考资料、运营中枢工作台 | 排除 >20MB: 14 个 | [仓库](http://open.quwanzhi.com:3000/fnvtk/karuo-ai) [百科](http://open.quwanzhi.com:3000/fnvtk/karuo-ai/wiki) | | 2026-03-02 13:43:12 | 成功 | 成功 | 🔄 卡若AI 同步 2026-03-02 13:43 | 更新Cursor规则、金仓、水桥平台对接、总索引与入口、运营中枢参考资料、运营中枢工作台 | 排除 >20MB: 14 个 | [仓库](http://open.quwanzhi.com:3000/fnvtk/karuo-ai) [百科](http://open.quwanzhi.com:3000/fnvtk/karuo-ai/wiki) |
| 2026-03-02 13:50:12 | 成功 | 成功 | 🔄 卡若AI 同步 2026-03-02 13:49 | 更新:金仓、运营中枢工作台 | 排除 >20MB: 14 个 | [仓库](http://open.quwanzhi.com:3000/fnvtk/karuo-ai) [百科](http://open.quwanzhi.com:3000/fnvtk/karuo-ai/wiki) | | 2026-03-02 13:50:12 | 成功 | 成功 | 🔄 卡若AI 同步 2026-03-02 13:49 | 更新:金仓、运营中枢工作台 | 排除 >20MB: 14 个 | [仓库](http://open.quwanzhi.com:3000/fnvtk/karuo-ai) [百科](http://open.quwanzhi.com:3000/fnvtk/karuo-ai/wiki) |
| 2026-03-02 17:10:43 | 成功 | 成功 | 🔄 卡若AI 同步 2026-03-02 17:10 | 更新:金仓、运营中枢工作台 | 排除 >20MB: 14 个 | [仓库](http://open.quwanzhi.com:3000/fnvtk/karuo-ai) [百科](http://open.quwanzhi.com:3000/fnvtk/karuo-ai/wiki) | | 2026-03-02 17:10:43 | 成功 | 成功 | 🔄 卡若AI 同步 2026-03-02 17:10 | 更新:金仓、运营中枢工作台 | 排除 >20MB: 14 个 | [仓库](http://open.quwanzhi.com:3000/fnvtk/karuo-ai) [百科](http://open.quwanzhi.com:3000/fnvtk/karuo-ai/wiki) |
| 2026-03-02 20:52:08 | 成功 | 成功 | 🔄 卡若AI 同步 2026-03-02 20:52 | 更新:金盾、卡木、总索引与入口、运营中枢工作台 | 排除 >20MB: 14 个 | [仓库](http://open.quwanzhi.com:3000/fnvtk/karuo-ai) [百科](http://open.quwanzhi.com:3000/fnvtk/karuo-ai/wiki) |