Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nathan Snell
Produit @ Mailchimp. Développer une IA marketing pour l’e-commerce 🤖 Précédent : cofondateur @RaleonHQ (Acquis) @nCino (IPO). Conseiller. Investisseur providentiel. Père de 4 enfants.
Si vous pensez que Claude et Gemini sont interchangeables, apprenez-moi vos méthodes. J'aimerais aussi vivre au pays des rêves.
Notre échange nous a fait passer de 80 % à 10 % EN UN SEUL JOUR.
Nous testions différents LLM pour la génération de contenu de campagne.
Claude était exceptionnel. Pas seulement en termes de qualité de sortie, mais aussi en performance réelle en aval.
Gemini 2.5 Pro faisait un travail incroyable du côté de l'analyse et semblait proche de Claude.
Nous avons donc décidé de mener une expérience.
Que se passerait-il si nous l'échangions pour la génération créative ?
Tout le reste était identique. Les invites, les données, les flux.
Nous avons littéralement JUSTE changé le modèle.
Il s'avère que Claude est bien meilleur pour le raisonnement créatif et le flux narratif.
Il comprend le ton, le contexte émotionnel et la pertinence d'une manière que les autres ne font pas encore.
Gemini est correct pour l'exactitude factuelle et la synthèse, mais il a complètement échoué lorsqu'il s'agissait de générer un contenu d'email qui connecte réellement.
Lorsque nous sommes revenus à Claude, les conversions se sont normalisées immédiatement.
Là où la plupart des gens se trompent, c'est en supposant qu'ils peuvent encore utiliser le même modèle (ChatGPT) pour tout.
Avec l'IA évoluant aussi rapidement, nous sommes maintenant dans une situation où les meilleurs résultats proviennent de l'utilisation des meilleurs modèles.
Mais ces métriques ne vous disent pas si votre IA fait réellement le travail.
Vérifiez le tweet suivant pour un décompte complet des SOP.
1,43K
J'ai traversé le boom des .com, le cloud, le mobile, et maintenant l'IA.
Il y a une raison pour laquelle Gartner a créé son cadre Hype Cycle. Chaque vague technologique le suit :
1. Déclencheur d'innovation (tout le monde s'excite)
2. Pic des attentes gonflées (le battage médiatique devient fou)
3. Creux de la désillusion (la réalité s'installe, les gens abandonnent)
4. Pente de l'illumination (des cas d'utilisation réels émergent)
5. Plateau de productivité (adoption grand public)
Pour éviter cela et écraser la prochaine phase, il suffit de supporter la phase intermédiaire ennuyeuse d'itération constante jusqu'à ce que les choses se stabilisent.
Prenez la vidéo IA en ce moment.
Les gens montrent toutes les fonctionnalités intéressantes, mais la seule chose qui devient virale est un singe donnant une conférence TED.
Oui, cela peut également être utilisé pour des B-roll et des accroches, mais générer entièrement des créations publicitaires utilisables qui fonctionnent à grande échelle n'est toujours pas là.
Je pense à l'IA en trois catégories :
1. Surévaluée
2. Dans le laboratoire
3. Réellement utile.
La vidéo IA se situe quelque part entre surévaluée et dans le laboratoire.
Pendant ce temps, les flux de travail basés sur le texte et la génération d'images apportent déjà une valeur massive, mais ils ne sont pas assez sexy pour le fil d'actualité.
Nous avons fait des tests avec des marques où elles juraient que l'IA ne pouvait pas gérer les textures de produit ou les détails fins.
Nous leur avons prouvé le contraire en utilisant Nana Banana.
Je paierais en fait pour voir à nouveau leurs visages quand ils ont réalisé qu'ils ne pouvaient pas faire la différence.
Et c'est là que se trouve la vraie valeur. Dans les applications pratiques qui rendent déjà le travail des gens plus facile ou rendent les tests créatifs plus rapides.
La véritable adoption se produit de deux manières :
1. Après que le battage médiatique se soit calmé et que les opérateurs commencent à obtenir des résultats réels.
2. Lorsque les entreprises coupent à travers le battage médiatique tôt pour offrir une valeur significative (et arbitrer le bruit des autres).
Je préfère passer mon temps au milieu. Tester, apprendre, itérer pour percer le battage médiatique.
Pas à courir après ce qui est tendance sur X cette semaine.
1,34K
Le bricolage m'a rendu un meilleur opérateur que n'importe quelle conférence ou MBA ne pourrait jamais le faire.
Il y a quelques mois, notre flux de travail de performance chez Raleon était un véritable calvaire. La recherche prenait des heures. L'analyse prenait encore plus de temps. Angles, titres, notes créatives, tableurs, tout éparpillé sur dix onglets.
Vous finissiez un cycle en sachant déjà que vous deviez commencer le suivant.
Alors un week-end, j'ai ouvert Claude par frustration et je me suis posé une simple question :
Est-ce que cette chose peut réellement prendre une part du travail, ou est-ce juste un autre outil à la mode ?
J'ai donc commencé à jouer avec les compétences de Claude, et tout a enfin commencé à s'imbriquer.
J'ai constitué une petite équipe d'agents qui pouvaient faire exactement le travail sous lequel je me retrouvais enseveli :
• Un qui génère des idées
• Un qui révise
• Un qui prédit la performance
Je n'ai pas eu à écrire une seule ligne de code pour les construire. C'est essentiellement une équipe créative de performance automatisée qui travaille ensemble en coulisses.
Ce que j'ai le plus apprécié, c'est d'apprendre comment ces agents fonctionnent réellement une fois que vous les poussez un peu.
Je pense que trop de fondateurs externalisent leur curiosité, et c'est une énorme occasion manquée.
Ils pensent qu'ils sont au-delà de la phase où ils doivent se salir les mains, mais vous ne comprenez vraiment comment ces systèmes d'agents se comportent lorsque vous cassez quelque chose vous-même et que vous regardez ce qui se passe ensuite.
À ce stade de ma carrière, je n'ai pas besoin de bricoler avec l'IA le week-end.
Mais je le fais quand même, car cela me permet de rester au courant de la façon dont les modèles se comportent à mesure qu'ils évoluent en temps réel.
1,01K
Meilleurs
Classement
Favoris

