4.3 KiB
4.3 KiB
抖音视频文案一键解析 · 开源方案汇总
来源:GitHub / 掘金 / Gitee 等平台检索整理 | 更新:2026-03-02
一、GitHub 上的主要项目
1. douyin-text-extractor(推荐,一键链路完整)
- 仓库:https://github.com/wjllance/douyin-text-extractor
- 技术:Node.js + TypeScript
- 流程:解析分享链接 → 下载无水印视频 → 提取音频 → 调用语音 API 转文本
- 特点:进度回调、自动清理临时文件、支持 SiliconFlow / OpenAI 等语音 API
- 安装:
npm install douyin-text-extractor - 一键用法:
const service = new DouyinService({ speechApiKey: "your-speech-api-key" }); const result = await service.extractText("复制的抖音分享链接"); console.log(result.extractedText); - 命令行:
node scripts/douyin.js to-text "https://v.douyin.com/xxx" node scripts/douyin.js batch links.txt # 批量 - 依赖:Node.js ≥ 16、FFmpeg
2. douyin-AI-wenan(文案后处理)
- 仓库:https://github.com/fangyuan99/douyin-ai-wenan
- 技术:Vue 3 + Coze
- 功能:对已提取的抖音视频文案做智能修正(同音字、标点等),可推到 Memos
- 定位:文案清洗与工作流,需配合其他工具做「视频→文案」提取
3. Short-Video-Link 解析与文案提取
- 仓库:https://github.com/zhangyanhua0913/Short-Video-Link--Homepage-Link-Parsing-and-Caption-Extraction
- 功能:短视频链接/主页链接解析 + 文案提取,支持批量、多语言
- 特点:结合大模型提升多语言/方言准确度
4. DouYinParse(仅解析元数据)
- 仓库:https://github.com/PearNoDec/DouYinParse
- 技术:PHP
- 功能:作者、标题、点赞/评论/收藏、发布时间、封面、无水印链接等,不含语音转文案
5. copywrite(阿里云语音转写)
- 仓库:GitHub / Gitee 搜
friend-nicen/copywrite - 功能:基于阿里云音频转文字 API,自动切换视频并保存视频/音频/文案
- 适合:已有阿里云、要批量自动化
二、掘金 / 社区上的流程方案
1. 高效短视频工作流(日均 2 万+ 条文案)
- 思路:RPA 或第三方采集 → 无水印下载(抖音/小红书/B 站)→ FFmpeg 转音频 → Whisper 或 SenseVoice 转写 → AI 清洗排版
- 引擎:Whisper(准、慢)/ SenseVoice(快,约 3–5 秒一条)
- 硬件参考:GPU 8G+ 显存,32GB+ 内存
2. video-analyzer(本地视频分析)
- 能力:关键帧抽取 + 音频转录 + 视频描述生成
- 技术:Llama 11B 视觉 + OpenAI Whisper,本地运行
三、与本机现有方案的对比
| 能力 | 本机现有(MLX-Whisper + 脚本) | douyin-text-extractor |
|---|---|---|
| 下载抖音 | 需 Cookie(yt-dlp) | 库内集成解析与下载(可能也需 Cookie) |
| 语音转文案 | 本地 MLX-Whisper,无需 API | 需语音 API(SiliconFlow/OpenAI 等) |
| 一键命令 | 本地视频文件一条命令 / 脚本 | 链接 → extractText(shareLink) |
| 批量 | 脚本可接文件列表 | 支持 batch links.txt |
四、可选「一键解析」流程归纳
- 只要本地、不买 API:本机 yt-dlp(或浏览器导出 Cookie)+ 本地 MLX-Whisper 脚本(你已有)。
- 要「链接进、文案出」且接受云 API:用 douyin-text-extractor,配好
speechApiKey后直接extractText(分享链接)或命令行to-text。 - 要批量 + 文案清洗:douyin-text-extractor 批量 + douyin-AI-wenan 或自建 Coze/脚本做后处理。
- 已有阿里云:copywrite 等基于阿里云语音转写的方案可对接现有资源。
五、参考链接
- douyin-text-extractor:https://github.com/wjllance/douyin-text-extractor
- douyin-AI-wenan:https://github.com/fangyuan99/douyin-ai-wenan
- 掘金「借助 AI 打造高效短视频工作流」:搜索「掘金 抖音 文案 2万」
- 本机脚本:
01_卡资(金)/金盾_数据安全/存客宝副本管理/douyin_video_to_text.sh(优先 MLX-Whisper)