MioSub是由 corvo007 开发、基于 AGPL‑3.0 开源的一站式全自动 AI 字幕生成与编辑工具,依托 Google Gemini 与 OpenAI Whisper 技术,实现视频 / 音频的下载、转录、翻译、对齐、压制全流程自动化,大幅降低字幕制作门槛,广泛适用于番剧、播客、Vlog、影视解说等场景。
- MioSub开源项目地址:https://github.com/corvo007/MioSub
- MioSub官方演示地址:https://demo.miosub.app/
- MioSub官方下载地址:https://github.com/corvo007/MioSub/releases

核心功能与特色
1. 全流程自动化处理
MioSub 实现了从视频链接到成品字幕的一站式处理,包括视频下载、字幕转录、翻译润色、时间轴对齐和压制导出等完整工作流。传统字幕制作需要 3-6 小时的工作,MioSub 可将其压缩到 15-30 分钟级别,真正实现”少手工、少返工、一次交付”。
2. 强大的人工智能技术
- Whisper 转录:基于 Whisper 语音识别模型实现高精度字幕转录
- Gemini 翻译润色:集成 Gemini 大语言模型进行智能翻译和文本润色
- 强制对齐:内置 CTC 对齐器,实现毫秒级字符对齐精度,确保字幕与视频精准同步
- 说话人识别:自动推测并标注多说话人身份,支持自定义说话人名称和颜色
3. 丰富的功能特性
- 术语表管理:自动应用术语表,统一译名,保证专业术语的一致性
- 长上下文翻译:保持上下文连贯性,提升翻译质量
- 批量重生成:支持选中片段一键重跑完整流程(转录→润色→对齐→翻译)
- 版本快照:操作前自动保存版本快照,可随时回滚
- 多格式支持:不仅支持视频,播客、电台、有声书等纯音频文件也能直接处理
4. 用户体验优化
- 内置 NotoSans 字体,解决中日文渲染中的缺字和方块问题
- 编辑器、设置面板全面重构,界面更清爽、流畅
- 支持自定义字幕样式和压制导出
应用场景
MioSub 非常适合以下使用场景:
- 海外视频内容引进的本地化字幕制作
- YouTube、B站等平台的视频字幕处理
- 播客、有声书等音频内容的字幕化
- 需要快速生产高质量字幕的专业团队
MioSub 代表了 AI 技术在视频字幕领域的创新应用,通过自动化和智能化的方式,大幅降低了字幕制作的门槛和时间成本,让普通人也能轻松完成专业的字幕制作工作,真正实现了”世界的内容,你的语言”的产品愿景。
相关导航
暂无评论...






