Files
karuo-ai/01_卡资(金)/金盾_数据安全/存客宝副本管理/抖音视频文案一键解析_开源方案汇总.md

105 lines
4.3 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 抖音视频文案一键解析 · 开源方案汇总
> 来源GitHub / 掘金 / Gitee 等平台检索整理 | 更新2026-03-02
---
## 一、GitHub 上的主要项目
### 1. douyin-text-extractor推荐一键链路完整
- **仓库**<https://github.com/wjllance/douyin-text-extractor>
- **技术**Node.js + TypeScript
- **流程**:解析分享链接 → 下载无水印视频 → 提取音频 → 调用语音 API 转文本
- **特点**:进度回调、自动清理临时文件、支持 SiliconFlow / OpenAI 等语音 API
- **安装**`npm install douyin-text-extractor`
- **一键用法**
```javascript
const service = new DouyinService({ speechApiKey: "your-speech-api-key" });
const result = await service.extractText("复制的抖音分享链接");
console.log(result.extractedText);
```
- **命令行**
```bash
node scripts/douyin.js to-text "https://v.douyin.com/xxx"
node scripts/douyin.js batch links.txt # 批量
```
- **依赖**Node.js ≥ 16、FFmpeg
---
### 2. douyin-AI-wenan文案后处理
- **仓库**<https://github.com/fangyuan99/douyin-ai-wenan>
- **技术**Vue 3 + Coze
- **功能**:对已提取的抖音视频文案做智能修正(同音字、标点等),可推到 Memos
- **定位**:文案清洗与工作流,需配合其他工具做「视频→文案」提取
---
### 3. Short-Video-Link 解析与文案提取
- **仓库**<https://github.com/zhangyanhua0913/Short-Video-Link--Homepage-Link-Parsing-and-Caption-Extraction>
- **功能**:短视频链接/主页链接解析 + 文案提取,支持批量、多语言
- **特点**:结合大模型提升多语言/方言准确度
---
### 4. DouYinParse仅解析元数据
- **仓库**<https://github.com/PearNoDec/DouYinParse>
- **技术**PHP
- **功能**:作者、标题、点赞/评论/收藏、发布时间、封面、无水印链接等,**不含语音转文案**
---
### 5. copywrite阿里云语音转写
- **仓库**GitHub / Gitee 搜 `friend-nicen/copywrite`
- **功能**:基于阿里云音频转文字 API自动切换视频并保存视频/音频/文案
- **适合**:已有阿里云、要批量自动化
---
## 二、掘金 / 社区上的流程方案
### 1. 高效短视频工作流(日均 2 万+ 条文案)
- **思路**RPA 或第三方采集 → 无水印下载(抖音/小红书/B 站)→ FFmpeg 转音频 → **Whisper 或 SenseVoice** 转写 → AI 清洗排版
- **引擎**Whisper准、慢/ SenseVoice约 35 秒一条)
- **硬件参考**GPU 8G+ 显存32GB+ 内存
### 2. video-analyzer本地视频分析
- **能力**:关键帧抽取 + 音频转录 + 视频描述生成
- **技术**Llama 11B 视觉 + OpenAI Whisper本地运行
---
## 三、与本机现有方案的对比
| 能力 | 本机现有MLX-Whisper + 脚本) | douyin-text-extractor |
|----------------|------------------------------------|---------------------------------|
| 下载抖音 | 需 Cookieyt-dlp | 库内集成解析与下载(可能也需 Cookie |
| 语音转文案 | 本地 MLX-Whisper无需 API | 需语音 APISiliconFlow/OpenAI 等) |
| 一键命令 | 本地视频文件一条命令 / 脚本 | 链接 → `extractText(shareLink)` |
| 批量 | 脚本可接文件列表 | 支持 `batch links.txt` |
---
## 四、可选「一键解析」流程归纳
1. **只要本地、不买 API**:本机 yt-dlp或浏览器导出 Cookie+ 本地 MLX-Whisper 脚本(你已有)。
2. **要「链接进、文案出」且接受云 API**:用 **douyin-text-extractor**,配好 `speechApiKey` 后直接 `extractText(分享链接)` 或命令行 `to-text`。
3. **要批量 + 文案清洗**douyin-text-extractor 批量 + douyin-AI-wenan 或自建 Coze/脚本做后处理。
4. **已有阿里云**copywrite 等基于阿里云语音转写的方案可对接现有资源。
---
## 五、参考链接
- douyin-text-extractor<https://github.com/wjllance/douyin-text-extractor>
- douyin-AI-wenan<https://github.com/fangyuan99/douyin-ai-wenan>
- 掘金「借助 AI 打造高效短视频工作流」:搜索「掘金 抖音 文案 2万」
- 本机脚本:`01_卡资/金盾_数据安全/存客宝副本管理/douyin_video_to_text.sh`(优先 MLX-Whisper