免费AI 助手,提供聊天、文档阅读、音视频速读、AI 创作(图像/视频/音频)等。阿里云自主研发的大语言模型
开源大模型平台
科大讯飞推出的新一代认知智能大模型
提供优质的Gemini、Claude、OpenAI、Midjourney、Suno、Luma等种AI模型API接入服务。
AI Ping是面向大模型使用者,提供全面、客观、真实的大模型服务评测与信息汇总平台。提供长周期、高频率、多时段评测数据,助力您高效完成大模型服务的选型与供应商评估
知识库大模型,智能客服,智能问答,AI写作
一个全品类AI API供应商,以统一的API Key访问Claude,GPT,Gemini,DeepSeek,Seedance,Z-image等模型API。所有模型均来自原厂,并享受20%的折扣。
在线快速查找并比较各大平台的 AI 模型价格网站
ZZenmux.ai一个面向开发者、企业及AI产品构建者的企业级AI模型聚合平台。通过统一的API接口,将全球领先的大模型(如OpenAI、Claude、Gemini、DeepSeek等)进行集成。
UniAPI是一个面向企业和开发者的企业级AI模型聚合API服务平台,提供“All In One”的一站式AI模型接口代理服务。
一个面向企业与内容团队的多模型服务平台,核心价值在于通过一个统一的API接口,为用户提供整合全球顶尖AI模型的能力,旨在显著降低AI应用的成本并提升生产级应用的可靠性。
在线大模型微调与训练服务平台,该平台面向具备微调需求、但编码与工程能力相对基础的用户群体,提供“开箱即用、低代码、全链路覆盖”的大模型训练解决方案。
一个专注于大语言模型API 价格对比的权威在线工具,旨在帮助开发者、企业用户和研究人员快速、直观地比较主流AI模型的服务成本。
由中国科学院深圳先进技术研究院、香港中文大学、INSAIT 等机构联合提出的一种基于扩散模型先验的图像复原方法
新一代面向软件工程、竞赛编程的代码大模型系列,该模型聚焦于代码智能领域,具备能读懂、能写、能改代码的综合能力,可用于自动编程、Bug修复和代码解释等多类任务
Z-Image(造相)是通义实验室推出的一款高效图像生成基础模型,基于单流扩散Transformer架构(Scalable Single-Stream DiT, S3-DiT),参数量达60亿。
Grsai聚合了各种优秀的主流图片与视频生成大模型,以低于官网好几倍的价格为您降低使用成本!提供企业级专业稳定的API中转站,服务稳定可靠,达到99.99%。
一个与人工智能(AI)模型评估和比较相关的平台,其核心功能是通过用户投票和社区参与的方式,对大型语言模型(LLM)进行评测和排名。
MonkeyOCR是一款开源文档解析模型,专注于高效、精准地解析复杂结构化文档。
IndexTTS2 是一个突破性的自回归语音合成模型,旨在解决大规模文本到语音(TTS)系统在精确时长控制和情感表达方面的挑战。
专注于语言模型(LLM)SQL 能力评测的专业平台,构建了全面且具实践价值的 SQL 能力排行榜(SCALE),为开发者、数据库管理员及企业技术决策者提供关键参考
美团自主研发的生成式AI大模型,模型具备强大的多模态能力,能处理文本、图像等多种数据类型
Kimi K2 是北京月之暗面科技有限公司于 2025 年 7 月 11 日推出的开源大语言模型。
MMAudio是一个多模态音频生成模型,旨在通过视频和/或文本输入生成高质量、同步的音频。
Veo 3 是 Google DeepMind 推出的新一代视频生成模型,专为电影制作人、故事讲述者和创意工作者设计,将视频与音频无缝结合,开启生成式 AI 的创作新篇章。
字节跳动开发的AI视频生成模型,模型能够根据文本或图像生成高质量的视频内容,支持多镜头切换、稳定运动轨迹和风格化控制,适用于创意内容创作、广告制作和教育演示等场景。
Hallo 是一个由复旦大学(Fudan University)开发的开源项目,专注于音频驱动的视觉合成技术,特别是用于人像动画生成。
MuseTalk 是一个实时高质量音频驱动唇形同步模型,旨在解决高分辨率、身份一致性和准确唇形同步的面部视觉配音挑战,尤其适用于实时应用如直播视频 。
SadTalker 是一个基于单张图像和音频生成说话人脸视频的模型,其核心功能是通过音频输入使静态图片中的图像动起来,并生成说话的虚拟人物。
一款高性能文本到语音(TTS)系统,基于流匹配的非自回归生成方法,结合了扩散变换器(DiT)技术。
Seed-TTS 是由字节跳动开发的高级文本到语音(TTS)模型系列,旨在生成高质量、几乎无法与人类语音区分的语音。
MiniMind项目旨在从零开始训练一个轻量级语言模型(LLM),并提供完整的训练、微调、推理和部署流程。