这几天测完了今年备受瞩目的两个开源tts,可以说相当失望。具体是哪家,懂的都懂,就不点名了。 一个连正确的发音都做不到,幻觉丛生,另一个强很多,至少是能用的,只是数据训练量明显不够,克隆音色相似度不够,说话自然度也差很多,距离官方发布的卖家秀相去甚远,无法给消费者直接使用。 我非常好奇,开源出来的模型版本,到底是不是卖家做营销视频的那个版本。 不过我确实越来越理解大家说的“开源是一种商业模式”了,以前我们管小红书上的这种东西叫“照骗”。 这些照骗,为模型厂商赢得了注意力,自媒体博主也跟着转发放大,结果到最后一开箱,大家发现根本货不对版。 毕竟照骗看得多了,大家就不再相信照片了。 希望多一些真开源,少一些假照骗。