实时捕获系统音频 → 语音识别 → 中文翻译 → OBS 字幕显示。 专为 Windows + NVIDIA GPU 优化。
- Windows 10/11
- NVIDIA GPU + CUDA 12.x
- OBS Studio 28+ (内置 WebSocket v5)
- Python 3.11+
set BUILD_CUDA_EXT=0 && python -m pip install -r requirements.txt说明:
requirements.txt已锁定为当前最新且相互兼容的一组版本。BUILD_CUDA_EXT=0用于避免auto-gptq在 Windows 上强制编译 CUDA 扩展导致安装失败。
通过 OBS WebSocket 推送字幕,需先在 OBS 中启用 WebSocket。
python main.py| 参数 | 默认值 | 说明 |
|---|---|---|
--asr-model |
Qwen/Qwen3-ASR-0.6B |
ASR 模型名称 |
--asr-language |
自动检测 | 源语言(如 en / ja / zh) |
--target-lang |
zh |
目标语言 |
--obs-source |
subtitle |
OBS 文本源名称 |
--obs-password |
(空) | WebSocket 密码 |
-v |
off | 调试日志 |
直接在 OBS 内运行,无需 WebSocket,延迟更低。
- OBS → 工具 → 脚本
- Python 设置 → 配置 Python 安装路径
- 点击 + → 选择
obs_script.py - 配置参数(模型、语言、文本源名称)
- 点击 ▶ 启动
- 创建文本源:场景 → 来源 → + → 文本 (GDI+),命名为
subtitle - 模式 A 额外步骤:工具 → WebSocket 服务器设置 → 勾选启用
系统音频 → WASAPI Loopback → Silero VAD → Qwen3-ASR-0.6B → HY-MT1.5 翻译 → OBS 字幕
↑
模式A: WebSocket | 模式B: obspython 直接更新