diff --git a/01_卡资(金)/金盾_数据安全/存客宝副本管理/抖音视频文案一键解析_开源方案汇总.md b/01_卡资(金)/金盾_数据安全/存客宝副本管理/抖音视频文案一键解析_开源方案汇总.md new file mode 100644 index 00000000..e15c6f3a --- /dev/null +++ b/01_卡资(金)/金盾_数据安全/存客宝副本管理/抖音视频文案一键解析_开源方案汇总.md @@ -0,0 +1,104 @@ +# 抖音视频文案一键解析 · 开源方案汇总 + +> 来源:GitHub / 掘金 / Gitee 等平台检索整理 | 更新:2026-03-02 + +--- + +## 一、GitHub 上的主要项目 + +### 1. douyin-text-extractor(推荐,一键链路完整) + +- **仓库**: +- **技术**:Node.js + TypeScript +- **流程**:解析分享链接 → 下载无水印视频 → 提取音频 → 调用语音 API 转文本 +- **特点**:进度回调、自动清理临时文件、支持 SiliconFlow / OpenAI 等语音 API +- **安装**:`npm install douyin-text-extractor` +- **一键用法**: + ```javascript + const service = new DouyinService({ speechApiKey: "your-speech-api-key" }); + const result = await service.extractText("复制的抖音分享链接"); + console.log(result.extractedText); + ``` +- **命令行**: + ```bash + node scripts/douyin.js to-text "https://v.douyin.com/xxx" + node scripts/douyin.js batch links.txt # 批量 + ``` +- **依赖**:Node.js ≥ 16、FFmpeg + +--- + +### 2. douyin-AI-wenan(文案后处理) + +- **仓库**: +- **技术**:Vue 3 + Coze +- **功能**:对已提取的抖音视频文案做智能修正(同音字、标点等),可推到 Memos +- **定位**:文案清洗与工作流,需配合其他工具做「视频→文案」提取 + +--- + +### 3. Short-Video-Link 解析与文案提取 + +- **仓库**: +- **功能**:短视频链接/主页链接解析 + 文案提取,支持批量、多语言 +- **特点**:结合大模型提升多语言/方言准确度 + +--- + +### 4. DouYinParse(仅解析元数据) + +- **仓库**: +- **技术**:PHP +- **功能**:作者、标题、点赞/评论/收藏、发布时间、封面、无水印链接等,**不含语音转文案** + +--- + +### 5. copywrite(阿里云语音转写) + +- **仓库**:GitHub / Gitee 搜 `friend-nicen/copywrite` +- **功能**:基于阿里云音频转文字 API,自动切换视频并保存视频/音频/文案 +- **适合**:已有阿里云、要批量自动化 + +--- + +## 二、掘金 / 社区上的流程方案 + +### 1. 高效短视频工作流(日均 2 万+ 条文案) + +- **思路**:RPA 或第三方采集 → 无水印下载(抖音/小红书/B 站)→ FFmpeg 转音频 → **Whisper 或 SenseVoice** 转写 → AI 清洗排版 +- **引擎**:Whisper(准、慢)/ SenseVoice(快,约 3–5 秒一条) +- **硬件参考**:GPU 8G+ 显存,32GB+ 内存 + +### 2. video-analyzer(本地视频分析) + +- **能力**:关键帧抽取 + 音频转录 + 视频描述生成 +- **技术**:Llama 11B 视觉 + OpenAI Whisper,本地运行 + +--- + +## 三、与本机现有方案的对比 + +| 能力 | 本机现有(MLX-Whisper + 脚本) | douyin-text-extractor | +|----------------|------------------------------------|---------------------------------| +| 下载抖音 | 需 Cookie(yt-dlp) | 库内集成解析与下载(可能也需 Cookie) | +| 语音转文案 | 本地 MLX-Whisper,无需 API | 需语音 API(SiliconFlow/OpenAI 等) | +| 一键命令 | 本地视频文件一条命令 / 脚本 | 链接 → `extractText(shareLink)` | +| 批量 | 脚本可接文件列表 | 支持 `batch links.txt` | + +--- + +## 四、可选「一键解析」流程归纳 + +1. **只要本地、不买 API**:本机 yt-dlp(或浏览器导出 Cookie)+ 本地 MLX-Whisper 脚本(你已有)。 +2. **要「链接进、文案出」且接受云 API**:用 **douyin-text-extractor**,配好 `speechApiKey` 后直接 `extractText(分享链接)` 或命令行 `to-text`。 +3. **要批量 + 文案清洗**:douyin-text-extractor 批量 + douyin-AI-wenan 或自建 Coze/脚本做后处理。 +4. **已有阿里云**:copywrite 等基于阿里云语音转写的方案可对接现有资源。 + +--- + +## 五、参考链接 + +- douyin-text-extractor: +- douyin-AI-wenan: +- 掘金「借助 AI 打造高效短视频工作流」:搜索「掘金 抖音 文案 2万」 +- 本机脚本:`01_卡资(金)/金盾_数据安全/存客宝副本管理/douyin_video_to_text.sh`(优先 MLX-Whisper) diff --git a/运营中枢/工作台/gitea_push_log.md b/运营中枢/工作台/gitea_push_log.md index e6a06a02..1b9298c9 100644 --- a/运营中枢/工作台/gitea_push_log.md +++ b/运营中枢/工作台/gitea_push_log.md @@ -209,3 +209,4 @@ | 2026-03-02 13:43:12 | 🔄 卡若AI 同步 2026-03-02 13:43 | 更新:Cursor规则、金仓、水桥平台对接、总索引与入口、运营中枢参考资料、运营中枢工作台 | 排除 >20MB: 14 个 | | 2026-03-02 13:50:12 | 🔄 卡若AI 同步 2026-03-02 13:49 | 更新:金仓、运营中枢工作台 | 排除 >20MB: 14 个 | | 2026-03-02 17:10:43 | 🔄 卡若AI 同步 2026-03-02 17:10 | 更新:金仓、运营中枢工作台 | 排除 >20MB: 14 个 | +| 2026-03-02 20:52:08 | 🔄 卡若AI 同步 2026-03-02 20:52 | 更新:金盾、卡木、总索引与入口、运营中枢工作台 | 排除 >20MB: 14 个 | diff --git a/运营中枢/工作台/代码管理.md b/运营中枢/工作台/代码管理.md index f1f1d8a3..9e7f73fc 100644 --- a/运营中枢/工作台/代码管理.md +++ b/运营中枢/工作台/代码管理.md @@ -212,3 +212,4 @@ | 2026-03-02 13:43:12 | 成功 | 成功 | 🔄 卡若AI 同步 2026-03-02 13:43 | 更新:Cursor规则、金仓、水桥平台对接、总索引与入口、运营中枢参考资料、运营中枢工作台 | 排除 >20MB: 14 个 | [仓库](http://open.quwanzhi.com:3000/fnvtk/karuo-ai) [百科](http://open.quwanzhi.com:3000/fnvtk/karuo-ai/wiki) | | 2026-03-02 13:50:12 | 成功 | 成功 | 🔄 卡若AI 同步 2026-03-02 13:49 | 更新:金仓、运营中枢工作台 | 排除 >20MB: 14 个 | [仓库](http://open.quwanzhi.com:3000/fnvtk/karuo-ai) [百科](http://open.quwanzhi.com:3000/fnvtk/karuo-ai/wiki) | | 2026-03-02 17:10:43 | 成功 | 成功 | 🔄 卡若AI 同步 2026-03-02 17:10 | 更新:金仓、运营中枢工作台 | 排除 >20MB: 14 个 | [仓库](http://open.quwanzhi.com:3000/fnvtk/karuo-ai) [百科](http://open.quwanzhi.com:3000/fnvtk/karuo-ai/wiki) | +| 2026-03-02 20:52:08 | 成功 | 成功 | 🔄 卡若AI 同步 2026-03-02 20:52 | 更新:金盾、卡木、总索引与入口、运营中枢工作台 | 排除 >20MB: 14 个 | [仓库](http://open.quwanzhi.com:3000/fnvtk/karuo-ai) [百科](http://open.quwanzhi.com:3000/fnvtk/karuo-ai/wiki) |