Actuellement, quelques réflexions sur TPU et $GOOG Premièrement : refuser les comparaisons de paramètres non valides Ne débattez plus sur la différence de paramètres entre GPU et TPU, ou sur le coût de migration, ou qui est le meilleur. Quelle est l'utilité ? $GOOG n'est pas une entreprise de semi-conducteurs, et TPU n'est pas un produit destiné à être vendu partout. Ils ont commencé à se positionner il y a près de dix ans, et c'était entièrement pour servir leur propre activité. Ils n'ont même pas assez de cette technologie pour eux-mêmes, alors pourquoi la vendre à vous ? C'est comme Amazon qui développe sa logistique, c'est pour leur propre rapidité, pas pour vendre des camions. De même, cela ne peut pas être utilisé pour FUD sur $nvda en disant qu'ils vendent des cartes, $goog ne vend pas de cartes, comment comparer ? Utiliser ce FUD est très déraisonnable. Deuxièmement : le cœur de Gemini est "la capacité d'industrialisation" Tout le monde se concentre sur la performance des modèles eux-mêmes, mais néglige un point plus important pour la mise en œuvre commerciale : le coût et la vitesse (Unit Economics). L'expérience de Gemini me dit que Google utilise l'avantage natif de TPU pour réduire le coût de l'inférence AI au minimum, tout en maintenant une latence extrêmement faible. Si l'IA devient une "infrastructure" à l'avenir, pour 95 % des cas d'utilisation (recherche d'informations, rédaction d'e-mails, résumés), "facile à utiliser, bon marché, réponse en temps réel" est bien plus important que "extrêmement intelligent mais lent à réagir". Veuillez noter que ce qui précède est une hypothèse sur l'avenir, l'IA est encore incertaine, personne ne sait à quoi elle devrait ressembler à l'avenir. $GOOG est comme Ford ou Toyota à l'époque. Ils ont introduit la chaîne de montage (clusters TPU), créé une ligne de production lean intégrée matériel-logiciel (JAX/refroidissement liquide), transformant les voitures en biens accessibles à tous, et non en produits de luxe réservés aux riches à leurs débuts. Enfin : Je n'ai pas dit que $NVDA est mauvais, ni que d'autres modèles ne fonctionnent pas. ...