DApp Store | Hub Web3 pour les événements et les jeux | OKX Wallet

Que peut-on faire avec Discover?

background background

discoveryBanners

Rubriques tendance

#

Bonk Eco continues to show strength amid $USELESS rally

#

Pump.fun to raise $1B token sale, traders speculating on airdrop

LAUNCHCOIN+8,56 %

#

Boop.Fun leading the way with a new launchpad on Solana.

header

AMD

Ensemble, nous advance_

AMD

AMDil y a 22 heures

Affinage supervisé, RLHF, LoRA. Des compétences réelles pour une IA du monde réel. Apprenez à affiner et à aligner les LLM avec @realSharonZhou d'AMD dans ce nouveau cours de @DeepLearningAI.

Andrew Ng

Andrew Ngil y a 23 heures

Un nouveau cours passionnant : Ajustement et apprentissage par renforcement pour les LLM : Introduction à l'après-formation, enseigné par @realSharonZhou, VP de l'IA chez @AMD. Disponible maintenant à . L'après-formation est la technique clé utilisée par les laboratoires de pointe pour transformer un LLM de base - un modèle entraîné sur un texte non étiqueté massif pour prédire le mot/token suivant - en un assistant utile et fiable capable de suivre des instructions. J'ai également vu de nombreuses applications où l'après-formation transforme une application de démonstration qui fonctionne seulement 80 % du temps en un système fiable qui performe de manière constante. Ce cours vous enseignera les techniques d'après-formation les plus importantes ! Dans ce cours de 5 modules, Sharon vous guide à travers l'ensemble du pipeline d'après-formation : ajustement supervisé, modélisation des récompenses, RLHF, et des techniques comme PPO et GRPO. Vous apprendrez également à utiliser LoRA pour un entraînement efficace, et à concevoir des évaluations qui détectent les problèmes avant et après le déploiement. Compétences que vous acquerrez : - Appliquer l'ajustement supervisé et l'apprentissage par renforcement (RLHF, PPO, GRPO) pour aligner les modèles sur les comportements souhaités - Utiliser LoRA pour un ajustement efficace sans réentraîner des modèles entiers - Préparer des ensembles de données et générer des données synthétiques pour l'après-formation - Comprendre comment faire fonctionner des pipelines de production LLM, avec des points de décision go/no-go et des boucles de rétroaction Ces méthodes avancées ne sont plus réservées aux laboratoires d'IA de pointe, et vous pouvez maintenant les utiliser dans vos propres applications. Apprenez ici :

20,57K

AMD

AMD28 oct., 22:20

Une avancée majeure pour une infrastructure IA sécurisée de bout en bout aux Émirats arabes unis. En collaboration avec @Cisco et @G42ai, nous propulsons l'innovation IA de nouvelle génération avec les accélérateurs AMD Instinct MI350X pour faire progresser le Partenariat d'Accélération IA entre les États-Unis et les Émirats arabes unis. Lisez la suite :

16,07K

AMD

AMD28 oct., 03:01

La pile d'IA de l'Amérique, propulsée par AMD. En collaboration avec @ENERGY, @ORNL, @HPE et @OracleCloud, nous sommes fiers d'annoncer qu'AMD aide à faire progresser la science à grande échelle. Avec les GPU AMD Instinct et les CPU EPYC au cœur du tout nouveau superordinateur et de l'usine d'IA de la nation, Discovery et Lux, les États-Unis sont prêts à continuer de mener l'innovation en matière d'IA.

36,46K

Meilleurs

Classement

Favoris

©2017 - 2025 WEB3.OKX.COM

Français 简体中文繁體中文 English Tiếng Việt Русский Español (Latinoamérica)Bahasa Indonesia Deutsch Italiano Polski Čeština Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Norsk (bokmål)Suomi Svenska

En savoir plus sur OKX Web3

Télécharger Learn À propos de nous Offres d'emploi Nous contacter Conditions d’utilisation Avis de confidentialité X (anciennement Twitter)

Produit

Tableau de bord du portefeuille Swap Marché Earn Découvrir Créer Explorateur Sécurité

Assistance

Centre d'assistance Vérification officielle Annonces Grille tarifaire DEX Connexion avec OKX Portefeuille Bitcoin Portefeuille Ethereum Portefeuille Solana