Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Under de senaste dagarna har jag testat de två högprofilerade TTS:erna med öppen källkod i år, vilket kan sägas vara en besvikelse. Vilken som är specifik förstår alla som förstår den, så jag kommer inte att nämna den vid namn.
Den ena kan inte ens göra det korrekta uttalet, hallucinationer, den andra är mycket starkare, åtminstone kan den användas, men mängden dataträning räcker uppenbarligen inte, likheten i den klonade klangen räcker inte och talets naturlighet är mycket sämre.
Jag är väldigt nyfiken på om modellversionen med öppen källkod är versionen av säljarens marknadsföringsvideo.
Men jag förstår mer och mer vad alla säger om att "öppen källkod är en affärsmodell", och vi brukade kalla den här typen av saker på Xiaohongshu för "fotobedrägeri".
Dessa bedrägerier har uppmärksammats av modelltillverkare, och självmediebloggare har också vidarebefordrat och förstärkt, men i slutet av uppackningen upptäckte alla att varorna inte alls var rätt version.
När allt kommer omkring, om du tittar på för många bilder, kommer alla inte längre att tro på foton.
Jag hoppas att det kommer att finnas mer riktig öppen källkod och mindre falska fotobedrägerier.
Topp
Rankning
Favoriter