Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

AMD
Ensemble, nous advance_
Affinage supervisé, RLHF, LoRA. Des compétences réelles pour une IA du monde réel.
Apprenez à affiner et à aligner les LLM avec @realSharonZhou d'AMD dans ce nouveau cours de @DeepLearningAI.

Andrew Ngil y a 23 heures
Un nouveau cours passionnant : Ajustement et apprentissage par renforcement pour les LLM : Introduction à l'après-formation, enseigné par @realSharonZhou, VP de l'IA chez @AMD. Disponible maintenant à .
L'après-formation est la technique clé utilisée par les laboratoires de pointe pour transformer un LLM de base - un modèle entraîné sur un texte non étiqueté massif pour prédire le mot/token suivant - en un assistant utile et fiable capable de suivre des instructions. J'ai également vu de nombreuses applications où l'après-formation transforme une application de démonstration qui fonctionne seulement 80 % du temps en un système fiable qui performe de manière constante. Ce cours vous enseignera les techniques d'après-formation les plus importantes !
Dans ce cours de 5 modules, Sharon vous guide à travers l'ensemble du pipeline d'après-formation : ajustement supervisé, modélisation des récompenses, RLHF, et des techniques comme PPO et GRPO. Vous apprendrez également à utiliser LoRA pour un entraînement efficace, et à concevoir des évaluations qui détectent les problèmes avant et après le déploiement.
Compétences que vous acquerrez :
- Appliquer l'ajustement supervisé et l'apprentissage par renforcement (RLHF, PPO, GRPO) pour aligner les modèles sur les comportements souhaités
- Utiliser LoRA pour un ajustement efficace sans réentraîner des modèles entiers
- Préparer des ensembles de données et générer des données synthétiques pour l'après-formation
- Comprendre comment faire fonctionner des pipelines de production LLM, avec des points de décision go/no-go et des boucles de rétroaction
Ces méthodes avancées ne sont plus réservées aux laboratoires d'IA de pointe, et vous pouvez maintenant les utiliser dans vos propres applications.
Apprenez ici :
20,57K
Une avancée majeure pour une infrastructure IA sécurisée de bout en bout aux Émirats arabes unis.
En collaboration avec @Cisco et @G42ai, nous propulsons l'innovation IA de nouvelle génération avec les accélérateurs AMD Instinct MI350X pour faire progresser le Partenariat d'Accélération IA entre les États-Unis et les Émirats arabes unis.
Lisez la suite :

16,07K
La pile d'IA de l'Amérique, propulsée par AMD.
En collaboration avec @ENERGY, @ORNL, @HPE et @OracleCloud, nous sommes fiers d'annoncer qu'AMD aide à faire progresser la science à grande échelle. Avec les GPU AMD Instinct et les CPU EPYC au cœur du tout nouveau superordinateur et de l'usine d'IA de la nation, Discovery et Lux, les États-Unis sont prêts à continuer de mener l'innovation en matière d'IA.

36,46K
Meilleurs
Classement
Favoris

