赞助商
立即入驻

ChatTTS增强版V2,批量导出srt,语速控制,情感控制,支持朗读数字,问题修复

ChatTTS增强版V2,批量导出srt,语速控制,情感控制,支持朗读数字,问题修复插图

在Github上大火的ChatTTS究竟是个啥?

省流:文本转语音+声音克隆

听说很牛,究竟有多牛?

牛到作者毫不掩饰的说是目前为止的开源项目天花板

ChatTTS增强版V2,批量导出srt,语速控制,情感控制,支持朗读数字,问题修复插图1

ChatTTS的独特价值

我们的产品带来独特的价值体现在以下几个方面:

特点 符合的人群 使用场景 产品特色
支持文本到语音的转换 语音技术研究者、开发者、教育机构 学术研究、语音交互应用开发、教学 使用深度学习技术,高质量语音合成
使用自定义模型训练 语音技术研究者、开发者 定制化语音合成需求 支持自定义模型训练
ChatTTS增强版V2,批量导出srt,语速控制,情感控制,支持朗读数字,问题修复插图2 ChatTTS增强版V2,批量导出srt,语速控制,情感控制,支持朗读数字,问题修复插图3

介绍

  • ChatTTS是专门为对话场景设计的文本转语音模型,例如LLM助手对话任务。
  • 它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。
  • 在HuggingFace中开源的版本为4万小时训练且未SFT的版本.

亮点

  • 对话式 TTS: ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人
  • 细粒度控制: 该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。
  • 更好的韵律: ChatTTS在韵律方面超越了大部分开源TTS模型。同时提供预训练模型,支持进一步的研究。
ChatTTS的应用场景

  • ChatTTS适用于各种需要高质量语音合成的场景,包括但不限于:
  • 电商直播:为直播提供更加自然的语音配音,提高用户体验。
  • 自媒体:帮助自媒体创作者生成生动的配音,吸引更多观众。
  • 在线教育:为在线课程提供清晰自然的讲解声音,提升学习效果。
  • 客服和售后服务:提供更人性化的语音服务,提高客户满意度。

使用介绍

1:下载资源压缩包

我们提供了 2 套整合包,一套是软件君的,还有一套是ChatTTS-ui

2:本地启动程序

下载完成后,解压压缩包,点击”启动.exe”启动脚本

3:浏览器操作使用

ChatTTS增强版V2,批量导出srt,语速控制,情感控制,支持朗读数字,问题修复插图4
  1. text:指的是需要转换成语音的文字内容。
  2. Refine text:选择是否自动对输入的文本进行优化处理。
  3. 随机度:一个控制输出随机性的参数,数值越大,生成的语音随机性越高,这可能导致生成的语音质量有时更好,有时更差。
  4. 声音选择:默认值为2222,这是一个数字参数,用于选择声音的类型。可选的数字有2222、7869、6653、4099、5099,可以任选其一,或者输入其他数字以随机选择声音。
  5. 定制声音:这是一个正整数参数,用于定制声音的音调和音色。如果设置了此值,将优先使用,而忽略声音选择参数。
  6. 提示设置:用于添加笑声、停顿等效果。例如,可以设置为[oral_2][laugh_0][break_6]。
软件君的整合包-更新记录 V1.0版本:2024-6-2

1、基于ChatTTS项目,支持保存音色,支持生成wav。

ChatTTS增强版V2,批量导出srt,语速控制,情感控制,支持朗读数字,问题修复插图5

原版整合包-更新记录 支持 WIN+MAC

需注意第一个生成的音频较慢!需耐心等待,生成完第一个,后续生成会超快!!!!

功能介绍

  1. 音质增强/降噪解决Chat-TTS生成时的噪音问题。
  2. 支持多txt批量处理和长文本处理。可自定义切割长度。
  3. 支持导出srt文件。
  4. 支持调节语速、停顿、笑声、口语化程度等参数。
  5. 修复朗读数字问题,详情看帮助。
  6. 支持储存音色配置与选项配置。方便管理。

扫码免费下载

此处有隐藏内容--请扫描下方二维码查看
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...