11 KiB
11 KiB
name, description, group, triggers, owner, version, updated
| name | description | group | triggers | owner | version | updated |
|---|---|---|---|---|---|---|
| 视频切片 | Soul派对视频切片 + 切片动效包装(片头/片尾/程序化)。触发词含视频剪辑、切片发布、切片动效包装、程序化包装、片头片尾。 | 木 | 视频剪辑、切片发布、字幕烧录、**切片动效包装、程序化包装、片头片尾、批量封面、视频包装** | 木叶 | 1.2 | 2026-02-17 |
视频切片
语言:所有文档、字幕、封面文案统一使用简体中文。soul_enhance 自动繁转简。
Soul 视频输出:Soul 剪辑的成片统一导出到
/Users/karuo/Movies/soul视频/最终版/,原视频在原视频/,中间产物在其他/。
联动规则:每次执行视频切片时,自动检查是否需要「切片动效包装」。若用户提到片头/片尾/程序化包装/批量封面,则联动调用
切片动效包装/10秒视频模板渲染,再与切片合成。
⭐ Soul派对切片流程(默认)
原始视频 → MLX转录 → 字幕转简体 → 高光识别(Ollama→规则) → 批量切片 → soul_enhance → 输出成片
↑ ↓
提取后立即繁转简+修正错误 封面+字幕(已简体)+加速10%+去语气词
一键命令(Soul派对专用)
一体化流水线(推荐)
cd 03_卡木(木)/木叶_视频内容/视频切片/脚本
conda activate mlx-whisper
python3 soul_slice_pipeline.py --video "/path/to/soul派对会议第57场.mp4" --clips 6
# 仅重新烧录(字幕转简体后重跑增强)
python3 soul_slice_pipeline.py -v "视频.mp4" -n 6 --skip-transcribe --skip-highlights --skip-clips
流程:转录 → 字幕转简体 → 高光识别 → 批量切片 → 增强
分步命令
# 1. 转录(MLX Whisper,约3分钟/2.5小时视频)
eval "$(~/miniforge3/bin/conda shell.zsh hook)"
conda activate mlx-whisper
mlx_whisper audio.wav --model mlx-community/whisper-small-mlx --language zh --output-format all
# 2. 高光识别(Ollama → 规则;流水线会在读取 transcript 前自动转简体)
python3 identify_highlights.py -t transcript.srt -o highlights.json -n 6
# 3. 切片
python3 batch_clip.py -i 视频.mp4 -l highlights.json -o clips/ -p soul
# 4. 增强处理(封面+字幕+加速,soul_enhance)
python3 soul_enhance.py -c clips/ -l highlights.json -t transcript.srt -o clips_enhanced/
增强功能说明
| 功能 | 说明 |
|---|---|
| 封面贴片 | 前2.5秒 Hook,苹方/思源黑体 |
| 字幕烧录 | 关键词加粗加大亮金黄突出,去语助词+去空格 |
| 加速10% | 节奏更紧凑,适合短视频 |
时间预估
| 步骤 | 2.5小时视频 |
|---|---|
| MLX转录 | 3分钟 |
| 切片10个 | 2分钟 |
| 增强处理 | 8分钟 |
| 总计 | 约13分钟 |
📹 通用视频处理
一键处理视频:转录 → 字幕清洗 → 视频增强 → 烧录字幕 → 输出单个成片
⚡ 一键命令
# 最简用法 - 输出: 视频名_带字幕.mp4
python3 /Users/karuo/Documents/个人/卡若AI/04_效率工具/视频切片/scripts/one_video.py -i "视频.mp4"
# 指定输出路径
python3 scripts/one_video.py -i "视频.mp4" -o "成片.mp4"
处理流程
┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐
│ 提取音频 │──▶│MLX转录 │──▶│字幕清洗 │──▶│视频增强 │──▶│烧录字幕 │
│ (5秒) │ │(1-3分钟)│ │繁转简 │ │降噪美颜 │ │ │
└─────────┘ └─────────┘ └─────────┘ └─────────┘ └─────────┘
│
▼
┌────────────────┐
│ 单个带字幕成片 │
│ 可直接发布 │
└────────────────┘
时间预估
| 视频时长 | 处理时间 |
|---|---|
| 5分钟 | 1-2分钟 |
| 30分钟 | 5-8分钟 |
| 1小时 | 10-15分钟 |
🎯 自动优化项
脚本自动完成以下优化,无需手动操作:
| 优化项 | 说明 |
|---|---|
| 繁转简 | 自动将繁体字幕转为简体 |
| 去语气词 | 删除"嗯"、"啊"、"那个"等 |
| 修正错误 | 自动修正常见转录错误 |
| 音频降噪 | FFT降噪+高低频过滤 |
| 画面美颜 | 亮度+饱和度微调 |
| 音量标准化 | 统一音量级别 |
📝 手动分步操作
如需更精细控制,可分步执行:
1. 转录
# 激活环境
eval "$(~/miniforge3/bin/conda shell.zsh hook)"
conda activate mlx-whisper
# 提取音频
ffmpeg -y -i "视频.mp4" -vn -ar 16000 -ac 1 audio.wav
# MLX Whisper转录
mlx_whisper audio.wav --model mlx-community/whisper-small-mlx --language zh --output-format srt
2. 字幕清洗
# 繁转简+修正错误
python3 scripts/fix_subtitles.py --input transcript.srt --output clean.srt
3. 视频增强
# 降噪+美颜
ffmpeg -y -i "视频.mp4" \
-vf "eq=brightness=0.05:saturation=1.1" \
-af "afftdn=nf=-25:nr=10:nt=w,highpass=f=80,lowpass=f=8000,volume=1.2" \
-c:v h264_videotoolbox -b:v 5M \
-c:a aac -b:a 128k \
enhanced.mp4
4. 烧录字幕
# Clean版(推荐)
python3 scripts/burn_subtitles_clean.py -i enhanced.mp4 -s clean.srt -o 成片.mp4
🎨 字幕样式
默认样式(Clean版)
| 元素 | 字号 | 颜色 | 效果 |
|---|---|---|---|
| 内容字幕 | 42px(竖屏)/ 36px(横屏) | 白色 | 黑色描边,无阴影 |
| 关键词 | 同上 | 金黄色 | 自动高亮 |
关键词高亮列表
自动高亮的关键词(金黄色):
- 数字:100万、30万、10万、5万、1万
- 概念:私域、AI、自动化、矩阵、IP、获客、变现、转化
- 平台:抖音、公众号、微信、存客宝
🔊 音频处理参数
| 滤镜 | 作用 | 参数 |
|---|---|---|
| highpass | 去低频杂音 | f=80Hz |
| lowpass | 去高频噪音 | f=8000Hz |
| afftdn | FFT降噪 | nf=-25, nr=10 |
| volume | 音量调整 | 1.2倍 |
📁 脚本列表
| 脚本 | 功能 | 使用频率 |
|---|---|---|
| soul_slice_pipeline.py | Soul 切片一体化流水线 | ⭐⭐⭐ 最常用 |
| soul_enhance.py | 封面+字幕(简体)+加速+去语气词 | ⭐⭐⭐ |
| identify_highlights.py | 高光识别(Ollama→规则) | ⭐⭐ |
| batch_clip.py | 批量切片 | ⭐⭐ |
| one_video.py | 单视频一键成片 | ⭐⭐ |
| burn_subtitles_clean.py | 字幕烧录(无阴影) | ⭐ |
| fix_subtitles.py | 字幕清洗(繁转简) | ⭐ |
🛠 环境配置
已安装(默认使用MLX Whisper)
- MLX Whisper:
~/miniforge3/envs/mlx-whisper⭐ 默认转录引擎- Apple Silicon优化,比CPU Whisper快10倍+
- 2.5小时视频转录仅需3分钟
- 字体:
03_卡木(木)/木叶_视频内容/视频切片/fonts/(优先) - 字幕: 统一简体中文(soul_enhance 自动繁转简)
转录命令(默认)
# 激活MLX环境
eval "$(~/miniforge3/bin/conda shell.zsh hook)"
conda activate mlx-whisper
# MLX Whisper转录(推荐)
mlx_whisper audio.wav --model mlx-community/whisper-small-mlx --language zh --output-format all
依赖检查
# FFmpeg
ffmpeg -version
# MLX环境
eval "$(~/miniforge3/bin/conda shell.zsh hook)"
conda activate mlx-whisper
python -c "import mlx_whisper; print('OK')"
# Python库
pip3 list | grep -E "moviepy|Pillow|opencc"
安装依赖
pip3 install --break-system-packages moviepy Pillow opencc-python-reimplemented
❓ 常见问题
Q: 转录不准确?
A: 使用medium模型:将脚本中的whisper-small-mlx改为whisper-medium-mlx
Q: 字幕太小/太大?
A: 修改one_video.py第142行的font_size值
Q: 处理太慢?
A:
- 视频已自动使用VideoToolbox GPU加速
- 字幕默认限制80条以内
Q: 输出文件太大?
A: 降低码率:将-b:v 5M改为-b:v 3M
🎬 切片动效包装(联动能力)
用 React 程序化生成片头/片尾/封面,与切片产出一键合成。每次执行视频切片时,若用户提到片头/片尾/包装/批量封面,则联动本能力。
联动规则(必守)
| 场景 | 是否联动 | 操作 |
|---|---|---|
| 用户说片头/片尾/程序化包装/批量封面 | ✓ | 先执行切片 → 渲染动效模板 → 合成 |
| 默认 Soul 切片、单视频成片 | 可选 | 执行后提示可选用切片动效包装 |
10秒视频模板(卡若AI 品牌)
路径:视频切片/切片动效包装/10秒视频/
| Composition | 说明 |
|---|---|
| Video10s | 简洁版:渐变 + 标题 + 副标题 |
| Video10sRich | 内容丰富版:粒子 + 极限环 + 流动线条 |
规格:竖屏 1080×1920,10 秒,30fps。
一键命令(动效包装)
cd 03_卡木(木)/木叶_视频内容/视频切片/切片动效包装/10秒视频
# 预览
npm run dev
# 渲染片头(简洁版)
npx remotion render src/index.ts Video10s /Users/karuo/Documents/卡若Ai的文件夹/导出/程序化视频/片头.mp4
# 渲染片头(丰富版)
npx remotion render src/index.ts Video10sRich /Users/karuo/Documents/卡若Ai的文件夹/导出/程序化视频/片头_丰富.mp4
与切片合成流程
切片产出(clips_enhanced/)
↓
【联动】渲染片头/片尾
↓
ffmpeg 合成:片头 + 切片 + 片尾
参考资料
- 速查:
视频切片/切片动效包装/参考资料/切片动效包装速查.md - 官方:https://www.remotion.dev/docs
📊 输出示例
输入: 会议录像.mp4 (500MB, 30分钟)
↓
输出: 会议录像_带字幕.mp4 (200MB)
- 中文字幕已烧录
- 音频已降噪
- 画面已优化
- 可直接发布抖音/视频号
🔗 工作目录
03_卡木(木)/木叶_视频内容/视频切片/
├── scripts/
│ ├── soul_slice_pipeline.py # ⭐ Soul 一体化
│ ├── soul_enhance.py # ⭐ 封面+字幕+加速
│ ├── one_video.py # 单视频成片
│ └── ...
├── 切片动效包装/ # 联动能力:片头/片尾/程序化
│ ├── 10秒视频/ # React 程序化模板
│ └── 参考资料/切片动效包装速查.md
├── fonts/
└── SKILL.md