![]() | 1 Ccf 2024-06-02 16:01:59 +08:00 ![]() 毫无情感 |
![]() | 2 mlhorizon 2024-06-02 16:35:51 +08:00 看来机器人还是得感情,欣赏不了诗词。 |
3 sammy520 2024-06-02 17:21:07 +08:00 via Android 要展示东西,最好把他最显著的特性用一般大众能感受的方式展现出来,但凡你用正常语速朗读一篇小王子,也不会像读诗词这么尬。。。 |
![]() | 4 kebamt 2024-06-02 17:38:33 +08:00 ![]() 能不能停顿一下,听着难受 |
![]() | 5 icyalala 2024-06-02 17:39:03 +08:00 ![]() 这是 ChatTTS 又不是 梁逸峰 TTS 。。。 |
6 jianchang512 OP /div> 感觉这个 tts 还行,没那么大的机械味。 |
7 cxtrinityy 2024-06-02 17:50:22 +08:00 via Android 读诗不行,读网 2-3 倍速网络小说可以,微信读书那个就完全不行,要钱的声音咬字糊糊的不行,还不如机械音 |
8 PrinceofInj 2024-06-02 18:06:20 +08:00 估计训练的材料过于口语化,有几句感觉要笑场的样子。不会是访谈资料给多了吧?可能拿去读剧本之类的不错。但是读书面文字就不行了。 |
9 xuanjiangsara 2024-06-02 19:42:03 +08:00 官方自己的英文,那是相当难听。不知道这个怎么会吹捧,难道大家光听中文得了? |
10 jianchang512 OP |
11 xuanjiangsara 2024-06-02 21:00:54 +08:00 @jianchang512 所以果然是中国专供了,擦汗。 除了英文长句语调怪外,还发现刻意断句加喘息。听得我都要过度换气了。 没听中文是不是有这个“特色”,但是这种感觉添加的很机械。估计是因为矬子里拔将军,中文最高个了。 |
12 jianchang512 OP @xuanjiangsara 主要没有好的中文 tts 项目 官方说是故意加了些干扰,防止可能的用于犯罪,中文也会出现噪声和奇怪笑声 |
![]() | 13 hfJ433 2024-06-02 21:12:01 +08:00 语速太快了 |
14 ZzzzRyan 2024-06-02 22:22:12 +08:00 @xuanjiangsara #11 训练的数据中文偏多,中文更好不是很正常吗?国外的也没谁听说成是英文特供啊? |
![]() | 15 gdfsjunjun 2024-06-02 22:32:39 +08:00 这标点没识别啊,遇到标点没停顿? 而且毫无感情,似乎并没有理解诗句的意思,只是一个无情的朗读机器。 现在 AI 这么发达,理解意思应该不成问题吧? |
16 click 2024-06-02 22:33:10 +08:00 本地使用对硬件有要求吗? |
17 xuanjiangsara 2024-06-02 22:49:05 +08:00 @ZzzzRyan 我指的是我以为是中国专供,不是中文专供。中国专供是给无法科学上网的人提供跟其他国家一样多语言 AI 的均等机会。 |
![]() | 18 yolee599 2024-06-03 01:55:46 +08:00 via Android 看看这个?甚至连说话时候吸气的声音都能生成: [来感受一下 ChatTTS 这个语音合成( TTS )模型-哔哩哔哩] https://b23.tv/YD7I50D |
![]() | 19 cheese 2024-06-03 04:04:21 +08:00 你这个 demo 听得我尿急。一点断句停顿都没。还不如白嫖微软的在线接口 |
20 jianchang512 OP @cheese 可以加入停顿的,使用[uv_break],不过简单起见没加,听着有点快 |
![]() | 21 Retas 2024-06-03 09:33:46 +08:00 聊天可以,念诗属实是把缺点全暴露出来了 |
![]() | 22 davin 2024-06-03 09:47:23 +08:00 听着就好像是拿着本书,对着麦克风念的,一会还忽远忽近。之前尝试过,不手动加停顿,真的是上气不接下气 |
![]() | 23 psyer 2024-06-03 10:31:08 +08:00 via Android 倒有点像自己读书的时候背诗的样子 |