Negli ultimi giorni ho testato due tts open source molto attesi di quest'anno e posso dire che sono rimasto piuttosto deluso. Di quale azienda si tratta, chi capisce sa, quindi non farò nomi. Uno non riesce nemmeno a pronunciare correttamente, è pieno di allucinazioni, l'altro è molto migliore, almeno è utilizzabile, solo che la quantità di dati per l'addestramento è chiaramente insufficiente, la somiglianza del tono clonata non è abbastanza, e la naturalezza del parlato è molto scarsa, lontana anni luce da quella mostrata nei video promozionali ufficiali, non può essere utilizzato direttamente dai consumatori. Sono molto curioso di sapere se la versione del modello open source sia davvero quella utilizzata nei video di marketing dei venditori. Tuttavia, capisco sempre di più ciò che si dice "l'open source è un modello di business", in passato chiamavamo queste cose su Xiaohongshu "foto ingannevoli". Queste foto ingannevoli hanno attirato l'attenzione dei produttori di modelli, e i blogger dei social media le hanno amplificate, ma alla fine, quando si apre il pacco, tutti si rendono conto che il prodotto non corrisponde affatto. Dopo aver visto troppe foto ingannevoli, la gente smette di credere alle immagini. Spero ci siano più veri open source e meno false foto ingannevoli.