Fish Speech-文本到语音（TTS）合成框架-办公人导航

Fish Speech 是一个由 Fish Audio 开发的开源文本转语音（TTS）解决方案，旨在为用户提供高质量、易用的语音合成服务。该项目基于先进的深度学习技术，包括 VQ-GAN、Llama 和 VITS 等前沿 AI 技术，能够将文本转换为逼真的语音。Fish Speech 支持多语言处理，包括中文、日语和英语，甚至支持更多语言，如韩语、法语、德语等。其模型训练数据量庞大，使用约 15 万小时的三语数据进行训练，确保了语言处理能力接近人类水平。

Fish Speech官网入口网址：https://speech.fish.audio/
Fish Speech开源项目地址：https://github.com/fishaudio/fish-speech
Fish Speech中文介绍：链接

Fish.audio

Fish.audio 是一个基于 AI 技术的音频处理与创作平台，主要提供语音克隆、AI 音效生成、文本转语音（TTS）和语音转文本等功能。

Fish Speech 的设计注重高效性和轻量化，用户可以在个人设备上轻松运行和微调模型，使其成为私人语音助手。它支持多种推理方式，包括命令行、HTTP API 和 Web UI，用户可以通过官网或 GitHub 获取模型和源码。Fish Speech 的官网地址为 https://speech.fish.audio/ ，用户可以在线体验其功能。

Fish Speech 的应用场景广泛，包括语音克隆、内容创作、教育、娱乐等，适合开发者、研究人员和爱好者使用。尽管 Fish Speech 在语音合成方面表现出色，但也存在一些局限性，如文本过长时可能无法处理、音色克隆效果受限制等。

Fish Speech 是一个功能强大、开源且易于使用的文本转语音工具，为 AI 语音合成领域提供了重要的技术支持。