MiniMax Audio推Speech- 02语音模型,一次性可以输入20万字符

备受关注的音频技术创新者 MiniMax Audio 正式发布了其全新的 Speech-02 系列语音模型,支持 30 多种语音,一次性可以输入 20 万字符。为用户带来更真实、更流畅、更便捷的音频体验。

MiniMax Audio 推 Speech- 02 语音模型,一次性可以输入 20 万字符

全新的 Speech-02 系列是本次更新的核心亮点。据官方介绍,该系列在多语言覆盖能力上实现了显著提升,能够更准确、更地道地呈现多种语言的发音。

更令人惊喜的是,Speech-02 的人声相似度高达99%,这意味着合成的语音听起来更加自然、贴近真人. 此外,该模型还实现了零节奏故障,彻底解决了音频播放过程中可能出现的卡顿和节奏不稳问题,保证了听感的连贯性和流畅性。值得强调的是,尽管在多方面进行了重大升级,Speech-02 系列依然维持了原有的亲民价格。

除了核心的语音合成技术的提升,MiniMax Audio 还推出了多项实用新功能。全新的“Read Anything”功能允许用户通过上传本地文件或粘贴网络 URL,即可随时随地收听各类内容,极大地拓展了用户获取音频信息的渠道 [1, 我们之前的对话]。无论是文档、电子书还是网页文章,用户都可以轻松转化为自己喜欢的音色进行聆听。

针对长文本处理的需求,MiniMax Audio 推出了强大的“Long-Text Mode(长文本))”,该模式单次输入即可支持高达 20 万字符的异步语音合成,这使得创建音频书籍、播客等长音频内容变得前所未有的便捷,彻底解决了以往长文本合成时需要分段处理的困扰。

为了优化用户的使用体验,MiniMax Audio 还对历史管理功能进行了增强,用户可以更方便地查看、删除和整理自己的语音合成历史和设置。同时,新增的“Discovery Hub”将所有新功能和更新内容集中展示,帮助用户快速了解和掌握 MiniMax Audio 的最新动态。

以上关于MiniMax Audio推Speech- 02语音模型,一次性可以输入20万字符的文章就介绍到这了,更多相关内容请搜索码云笔记以前的文章或继续浏览下面的相关文章,希望大家以后多多支持码云笔记。

「点点赞赏,手留余香」

0

给作者打赏,鼓励TA抓紧创作!

微信微信 支付宝支付宝

还没有人赞赏,快来当第一个赞赏的人吧!

声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权/违法违规/事实不符,请将相关资料发送至 admin@mybj123.com 进行投诉反馈,一经查实,立即处理!
码云笔记 » MiniMax Audio推Speech- 02语音模型,一次性可以输入20万字符

发表回复