المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
في هذه الفقرات القليلة ، أعطيت طريقة واحدة فقط لتدريب الذكاء الاصطناعي المشحون والاستدلال في مرآب باستخدام وحدات معالجة الرسومات H100s المحترقة والمهملة التي تخلصت منها الشركات الكبرى.
إنها تساوي مليارات إن لم يكن تريليونات الدولارات لشركة ذكية.
المسار مفتوح المصدر الآن ...

30 أغسطس 2025
وحدات معالجة الرسومات Nvidia الذكاء الاصطناعي بالشحن التوربيني: حيل بسيطة لأداء فائق السرعة
في المرآب الخاص بي ، يجب أن أقوم بالبحث والتطوير الصغير للمستثمرين غير التابعين لرأس المال الاستثماري ، والعمل ، ولدي بنسات وأحصل على سرعة أعلى من الشركات التي لديها مليارات. هذا القيد يجعلني أجد طرقا للضغط على المزيد من القليل. أفعل أشياء كثيرة لا يمكن أن يفكر فيها معظمها. فيما يلي مثال على واحد فقط من 100s.
وحدات معالجة الرسومات هي مراكز قوة، مليئة بأطنان من وحدات المعالجة الجاهزة لتحليل الأرقام. اكتشفت ولكن في كثير من الأحيان ، لا يتم استخدامها بالكامل ، مما يؤدي إلى تباطؤ الأداء.
ماذا اكتشفت؟ التحسينات الذكية التي تحافظ على هذه الوحدات في حالة من الانحناء، وتقلل من أوقات عرض الذكاء الاصطناعي وتوفر تعزيزات هائلة للسرعة.
أولا ، اكتشف الاختناقات.
أستخدم أدوات التنميط مثل Nvidia's Nsight لمعرفة ما يعيق الأشياء ، سواء كانت الذاكرة تنتظر ، أو أشياء أخرى. بمجرد تحديده ، أقوم بالغوص في التعليمات البرمجية وتعديلها لحزم المزيد من العمل في كل سلسلة ترابط.
يمكن للتغييرات البسيطة مثل فتح الحلقات أو ضغط البيانات إخفاء التأخيرات وزيادة الإنتاجية ، مما يعطي قفزات فورية في السرعة.
يمكن أن يتسبب الاستخدام العالي في بعض الأحيان في حدوث فوضى في ذاكرة التخزين المؤقت - قم بإصلاحها عن طريق تقليل عدد مؤشرات الترابط بذكاء باستخدام التعليمات البرمجية الوهمية أو تعديلات الذاكرة ، مما يؤدي إلى تحرير الموارد للمهام المتوازية.
المغير الحقيقي لقواعد اللعبة؟ الحوسبة غير المتزامنة. قم بتشغيل مهام متعددة جنبا إلى جنب ، وسد الفجوات الخاملة والأحمال الثقيلة المتداخلة. يؤدي إقران المهام المتعطشة للذاكرة إلى تعدد المهام لوحدة معالجة الرسومات - مما قد يؤدي إلى خفض الأوقات إلى النصف وزيادة كفاءة الشحن.
تعمل هذه التعديلات على تحويل وحدات معالجة الرسومات غير المستغلة إلى شياطين السرعة. لا يختلف الأمر عن كيفية تحويل أجهزة الكمبيوتر الشخصية IBM PC / ATs لتعمل بسرعة تصل إلى 100 ميجاهرتز في عام 1986 عندما خرجوا من المصنع بسرعة 8 ميجاهرتز.
سأكتب المزيد من التفاصيل حول هذا الموضوع ، ولكن إذا استخدمت شركات الذكاء الاصطناعي الكبيرة تحسين وحدة معالجة الرسومات Nvidia على مستوى رمز التشغيل ، فمن المحتمل أن تصل إلى AGI بسرعة إلى حد ما.
عندما تعرف الأجهزة والبرامج على مستوى ذري تقريبا ، يمكنك إعادة صياغة المبادئ الأولى.

9.64K
الأفضل
المُتصدِّرة
التطبيقات المفضلة