产品介绍
Mitsuko 是一款专为字幕翻译和音频转录设计的 AI 工具,旨在通过前沿的 AI 技术提供高质量的翻译和转录服务。其核心功能包括:
- 字幕翻译:支持 SRT 和 ASS 格式的字幕文件,使用 Gemini、Claude、Grok 和 OpenAI 的 GPT 等 AI 模型进行翻译。
- 音频转录:从音频文件中生成精准时间轴对齐的字幕,支持自定义指令以优化结果。
- 上下文提取:通过提取上下文信息,确保翻译在跨场景和剧集时保持一致性和准确性。
核心优势:
- 上下文感知:优先考虑语义而非字面翻译,确保翻译的自然性和准确性。
- 文化适应:能够处理文化差异和习语表达,提供更符合目标语言习惯的翻译。
- 语调对齐:根据角色语音模式调整翻译风格,保持角色声音的一致性。
产品功能
字幕翻译
- 上下文感知:优先考虑语义而非字面翻译。
- 语调对齐:根据角色语音模式调整翻译风格。
- 文化适应:处理文化差异和习语表达。
- 自定义指令:用户可以通过指令引导翻译过程。
音频转录
- 精准时间轴:生成与音频完美对齐的字幕。
- 智能分段:基于句子和从句的智能分段。
- 自定义指令:在转录前添加自定义指令以优化结果。
上下文提取
- 多源提取:从字幕、音频或文本中提取上下文。
- 结构化文档:生成结构化的上下文文档。
- 跨剧集一致性:确保翻译在跨剧集时保持一致。
技术原理
Mitsuko 的技术流程如下:
flowchart TD
A[输入字幕/音频] --> B[上下文提取]
B --> C[AI 模型处理]
C --> D[翻译/转录]
D --> E[输出结果]
价格方案
Mitsuko 提供灵活的信用点系统,用户可以根据需求选择适合的 AI 模型和服务。以下是详细的定价方案:
| 模型类型 |
输入 Token 成本 |
输出 Token 成本 |
上下文长度 |
最大生成 Token |
| DeepSeek R1 |
0.607 |
2.41 |
128k |
128k |
| Gemini 2.5 Pro |
1.5 |
12 |
1M |
66k |
| Claude 3.7 Sonnet |
3.6 |
18 |
200k |
64k |
| GPT-4o |
3 |
12 |
128k |
16k |
音频转录成本:
- 免费版:100 MB 文件限制。
- 高级版(≤100 分钟):2760 信用点/分钟。
- 高级版(>100 分钟):5520 信用点/分钟。

使用方法
- 上传文件:上传字幕或音频文件。
- 选择模型:根据需求选择 AI 模型。
- 添加指令(可选):输入自定义指令以优化结果。
- 开始处理:系统将自动完成翻译或转录。
- 下载结果:获取处理后的文件。
产品优势
- 高质量翻译:远超传统机器翻译工具。
- 上下文感知:确保翻译的自然性和一致性。
- 灵活定价:信用点系统满足不同需求。
- 多模型支持:支持多种前沿 AI 模型。
产品劣势
- 信用点成本:部分高级模型成本较高。
- 学习曲线:自定义指令功能可能需要一定学习时间。
案例展示
原始字幕(场景:角色愤怒):
もう我慢できない!
Mitsuko 翻译(上下文感知):
I've had enough of this!
传统翻译(字面):
I cannot endure anymore!
支持与服务
- Discord 社区:加入 Discord 获取支持。
- GitHub:查看开源项目。
- 联系客服:通过网站联系客服。
常见问题
支持 SRT 和 ASS 格式。
可以通过自定义指令引导翻译过程。
根据输入和输出 Token 数量计算,具体成本因模型而异。
提供精准时间轴对齐的字幕。
支持多种语言,具体取决于所选模型。
可以从字幕、音频或文本中提取。
提供免费试用,但有文件大小限制。