Files
karuo-ai/01_卡资(金)/金盾_数据安全/存客宝副本管理/抖音视频文案一键解析_开源方案汇总.md

4.3 KiB
Raw Blame History

抖音视频文案一键解析 · 开源方案汇总

来源GitHub / 掘金 / Gitee 等平台检索整理 | 更新2026-03-02


一、GitHub 上的主要项目

1. douyin-text-extractor推荐一键链路完整

  • 仓库https://github.com/wjllance/douyin-text-extractor
  • 技术Node.js + TypeScript
  • 流程:解析分享链接 → 下载无水印视频 → 提取音频 → 调用语音 API 转文本
  • 特点:进度回调、自动清理临时文件、支持 SiliconFlow / OpenAI 等语音 API
  • 安装npm install douyin-text-extractor
  • 一键用法
    const service = new DouyinService({ speechApiKey: "your-speech-api-key" });
    const result = await service.extractText("复制的抖音分享链接");
    console.log(result.extractedText);
    
  • 命令行
    node scripts/douyin.js to-text "https://v.douyin.com/xxx"
    node scripts/douyin.js batch links.txt   # 批量
    
  • 依赖Node.js ≥ 16、FFmpeg

2. douyin-AI-wenan文案后处理

  • 仓库https://github.com/fangyuan99/douyin-ai-wenan
  • 技术Vue 3 + Coze
  • 功能:对已提取的抖音视频文案做智能修正(同音字、标点等),可推到 Memos
  • 定位:文案清洗与工作流,需配合其他工具做「视频→文案」提取


4. DouYinParse仅解析元数据


5. copywrite阿里云语音转写

  • 仓库GitHub / Gitee 搜 friend-nicen/copywrite
  • 功能:基于阿里云音频转文字 API自动切换视频并保存视频/音频/文案
  • 适合:已有阿里云、要批量自动化

二、掘金 / 社区上的流程方案

1. 高效短视频工作流(日均 2 万+ 条文案)

  • 思路RPA 或第三方采集 → 无水印下载(抖音/小红书/B 站)→ FFmpeg 转音频 → Whisper 或 SenseVoice 转写 → AI 清洗排版
  • 引擎Whisper准、慢/ SenseVoice约 35 秒一条)
  • 硬件参考GPU 8G+ 显存32GB+ 内存

2. video-analyzer本地视频分析

  • 能力:关键帧抽取 + 音频转录 + 视频描述生成
  • 技术Llama 11B 视觉 + OpenAI Whisper本地运行

三、与本机现有方案的对比

能力 本机现有MLX-Whisper + 脚本) douyin-text-extractor
下载抖音 需 Cookieyt-dlp 库内集成解析与下载(可能也需 Cookie
语音转文案 本地 MLX-Whisper无需 API 需语音 APISiliconFlow/OpenAI 等)
一键命令 本地视频文件一条命令 / 脚本 链接 → extractText(shareLink)
批量 脚本可接文件列表 支持 batch links.txt

四、可选「一键解析」流程归纳

  1. 只要本地、不买 API:本机 yt-dlp或浏览器导出 Cookie+ 本地 MLX-Whisper 脚本(你已有)。
  2. 要「链接进、文案出」且接受云 API:用 douyin-text-extractor,配好 speechApiKey 后直接 extractText(分享链接) 或命令行 to-text
  3. 要批量 + 文案清洗douyin-text-extractor 批量 + douyin-AI-wenan 或自建 Coze/脚本做后处理。
  4. 已有阿里云copywrite 等基于阿里云语音转写的方案可对接现有资源。

五、参考链接