Files
karuo-ai/03_卡木(木)/木叶_视频内容/视频切片/SKILL.md

11 KiB
Raw Blame History

name, description, group, triggers, owner, version, updated
name description group triggers owner version updated
视频切片 Soul派对视频切片 + 切片动效包装(片头/片尾/程序化)。触发词含视频剪辑、切片发布、切片动效包装、程序化包装、片头片尾。 视频剪辑、切片发布、字幕烧录、**切片动效包装、程序化包装、片头片尾、批量封面、视频包装** 木叶 1.2 2026-02-17

视频切片

语言:所有文档、字幕、封面文案统一使用简体中文。soul_enhance 自动繁转简。

Soul 视频输出Soul 剪辑的成片统一导出到 /Users/karuo/Movies/soul视频/最终版/,原视频在 原视频/,中间产物在 其他/

联动规则:每次执行视频切片时,自动检查是否需要「切片动效包装」。若用户提到片头/片尾/程序化包装/批量封面,则联动调用 切片动效包装/10秒视频 模板渲染,再与切片合成。

Soul派对切片流程默认

原始视频 → MLX转录 → 字幕转简体 → 高光识别(Ollama→规则) → 批量切片 → soul_enhance → 输出成片
                     ↑                        ↓
            提取后立即繁转简+修正错误    封面+字幕(已简体)+加速10%+去语气词

一键命令Soul派对专用

一体化流水线(推荐)

cd 03_卡木/木叶_视频内容/视频切片/脚本
conda activate mlx-whisper
python3 soul_slice_pipeline.py --video "/path/to/soul派对会议第57场.mp4" --clips 6

# 仅重新烧录(字幕转简体后重跑增强)
python3 soul_slice_pipeline.py -v "视频.mp4" -n 6 --skip-transcribe --skip-highlights --skip-clips

流程:转录 → 字幕转简体 → 高光识别 → 批量切片 → 增强

分步命令

# 1. 转录MLX Whisper约3分钟/2.5小时视频)
eval "$(~/miniforge3/bin/conda shell.zsh hook)"
conda activate mlx-whisper
mlx_whisper audio.wav --model mlx-community/whisper-small-mlx --language zh --output-format all

# 2. 高光识别Ollama → 规则;流水线会在读取 transcript 前自动转简体)
python3 identify_highlights.py -t transcript.srt -o highlights.json -n 6

# 3. 切片
python3 batch_clip.py -i 视频.mp4 -l highlights.json -o clips/ -p soul

# 4. 增强处理(封面+字幕+加速soul_enhance
python3 soul_enhance.py -c clips/ -l highlights.json -t transcript.srt -o clips_enhanced/

增强功能说明

功能 说明
封面贴片 前2.5秒 Hook苹方/思源黑体
字幕烧录 关键词加粗加大亮金黄突出,去语助词+去空格
加速10% 节奏更紧凑,适合短视频

时间预估

步骤 2.5小时视频
MLX转录 3分钟
切片10个 2分钟
增强处理 8分钟
总计 约13分钟

📹 通用视频处理

一键处理视频:转录 → 字幕清洗 → 视频增强 → 烧录字幕 → 输出单个成片


一键命令

# 最简用法 - 输出: 视频名_带字幕.mp4
python3 /Users/karuo/Documents/个人/卡若AI/04_效率工具/视频切片/scripts/one_video.py -i "视频.mp4"

# 指定输出路径
python3 scripts/one_video.py -i "视频.mp4" -o "成片.mp4"

处理流程

┌─────────┐   ┌─────────┐   ┌─────────┐   ┌─────────┐   ┌─────────┐
│ 提取音频 │──▶│MLX转录  │──▶│字幕清洗 │──▶│视频增强 │──▶│烧录字幕 │
│  (5秒)  │   │(1-3分钟)│   │繁转简   │   │降噪美颜 │   │         │
└─────────┘   └─────────┘   └─────────┘   └─────────┘   └─────────┘
                                                              │
                                                              ▼
                                                     ┌────────────────┐
                                                     │ 单个带字幕成片 │
                                                     │   可直接发布   │
                                                     └────────────────┘

时间预估

视频时长 处理时间
5分钟 1-2分钟
30分钟 5-8分钟
1小时 10-15分钟

🎯 自动优化项

脚本自动完成以下优化,无需手动操作:

优化项 说明
繁转简 自动将繁体字幕转为简体
去语气词 删除"嗯"、"啊"、"那个"等
修正错误 自动修正常见转录错误
音频降噪 FFT降噪+高低频过滤
画面美颜 亮度+饱和度微调
音量标准化 统一音量级别

📝 手动分步操作

如需更精细控制,可分步执行:

1. 转录

# 激活环境
eval "$(~/miniforge3/bin/conda shell.zsh hook)"
conda activate mlx-whisper

# 提取音频
ffmpeg -y -i "视频.mp4" -vn -ar 16000 -ac 1 audio.wav

# MLX Whisper转录
mlx_whisper audio.wav --model mlx-community/whisper-small-mlx --language zh --output-format srt

2. 字幕清洗

# 繁转简+修正错误
python3 scripts/fix_subtitles.py --input transcript.srt --output clean.srt

3. 视频增强

# 降噪+美颜
ffmpeg -y -i "视频.mp4" \
  -vf "eq=brightness=0.05:saturation=1.1" \
  -af "afftdn=nf=-25:nr=10:nt=w,highpass=f=80,lowpass=f=8000,volume=1.2" \
  -c:v h264_videotoolbox -b:v 5M \
  -c:a aac -b:a 128k \
  enhanced.mp4

4. 烧录字幕

# Clean版推荐
python3 scripts/burn_subtitles_clean.py -i enhanced.mp4 -s clean.srt -o 成片.mp4

🎨 字幕样式

默认样式Clean版

元素 字号 颜色 效果
内容字幕 42px竖屏/ 36px横屏 白色 黑色描边,无阴影
关键词 同上 金黄色 自动高亮

关键词高亮列表

自动高亮的关键词(金黄色):

  • 数字100万、30万、10万、5万、1万
  • 概念私域、AI、自动化、矩阵、IP、获客、变现、转化
  • 平台:抖音、公众号、微信、存客宝

🔊 音频处理参数

滤镜 作用 参数
highpass 去低频杂音 f=80Hz
lowpass 去高频噪音 f=8000Hz
afftdn FFT降噪 nf=-25, nr=10
volume 音量调整 1.2倍

📁 脚本列表

脚本 功能 使用频率
soul_slice_pipeline.py Soul 切片一体化流水线 最常用
soul_enhance.py 封面+字幕(简体)+加速+去语气词
identify_highlights.py 高光识别Ollama→规则
batch_clip.py 批量切片
one_video.py 单视频一键成片
burn_subtitles_clean.py 字幕烧录(无阴影)
fix_subtitles.py 字幕清洗(繁转简)

🛠 环境配置

已安装默认使用MLX Whisper

  • MLX Whisper: ~/miniforge3/envs/mlx-whisper 默认转录引擎
    • Apple Silicon优化比CPU Whisper快10倍+
    • 2.5小时视频转录仅需3分钟
  • 字体: 03_卡木/木叶_视频内容/视频切片/fonts/(优先)
  • 字幕: 统一简体中文soul_enhance 自动繁转简)

转录命令(默认)

# 激活MLX环境
eval "$(~/miniforge3/bin/conda shell.zsh hook)"
conda activate mlx-whisper

# MLX Whisper转录推荐
mlx_whisper audio.wav --model mlx-community/whisper-small-mlx --language zh --output-format all

依赖检查

# FFmpeg
ffmpeg -version

# MLX环境
eval "$(~/miniforge3/bin/conda shell.zsh hook)"
conda activate mlx-whisper
python -c "import mlx_whisper; print('OK')"

# Python库
pip3 list | grep -E "moviepy|Pillow|opencc"

安装依赖

pip3 install --break-system-packages moviepy Pillow opencc-python-reimplemented

常见问题

Q: 转录不准确?

A: 使用medium模型将脚本中的whisper-small-mlx改为whisper-medium-mlx

Q: 字幕太小/太大?

A: 修改one_video.py第142行的font_size

Q: 处理太慢?

A:

  1. 视频已自动使用VideoToolbox GPU加速
  2. 字幕默认限制80条以内

Q: 输出文件太大?

A: 降低码率:将-b:v 5M改为-b:v 3M


🎬 切片动效包装(联动能力)

用 React 程序化生成片头/片尾/封面,与切片产出一键合成。每次执行视频切片时,若用户提到片头/片尾/包装/批量封面,则联动本能力

联动规则(必守)

场景 是否联动 操作
用户说片头/片尾/程序化包装/批量封面 先执行切片 → 渲染动效模板 → 合成
默认 Soul 切片、单视频成片 可选 执行后提示可选用切片动效包装

10秒视频模板卡若AI 品牌)

路径:视频切片/切片动效包装/10秒视频/

Composition 说明
Video10s 简洁版:渐变 + 标题 + 副标题
Video10sRich 内容丰富版:粒子 + 极限环 + 流动线条

规格:竖屏 1080×192010 秒30fps。

一键命令(动效包装)

cd 03_卡木/木叶_视频内容/视频切片/切片动效包装/10秒视频

# 预览
npm run dev

# 渲染片头(简洁版)
npx remotion render src/index.ts Video10s /Users/karuo/Documents/卡若Ai的文件夹/导出/程序化视频/片头.mp4

# 渲染片头(丰富版)
npx remotion render src/index.ts Video10sRich /Users/karuo/Documents/卡若Ai的文件夹/导出/程序化视频/片头_丰富.mp4

与切片合成流程

切片产出(clips_enhanced/) 
    ↓
【联动】渲染片头/片尾
    ↓
ffmpeg 合成:片头 + 切片 + 片尾

参考资料


📊 输出示例

输入: 会议录像.mp4 (500MB, 30分钟)
      ↓
输出: 会议录像_带字幕.mp4 (200MB)
      - 中文字幕已烧录
      - 音频已降噪
      - 画面已优化
      - 可直接发布抖音/视频号

🔗 工作目录

03_卡木/木叶_视频内容/视频切片/
├── scripts/
│   ├── soul_slice_pipeline.py   # ⭐ Soul 一体化
│   ├── soul_enhance.py          # ⭐ 封面+字幕+加速
│   ├── one_video.py             # 单视频成片
│   └── ...
├── 切片动效包装/                # 联动能力:片头/片尾/程序化
│   ├── 10秒视频/                # React 程序化模板
│   └── 参考资料/切片动效包装速查.md
├── fonts/
└── SKILL.md