トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
NVIDIA と AMD の両方の GPU スタックは、署名されたファームウェアの最小限を除いて、コンパイラを除いて 100% オープンソースで純粋な Python です。ベンダーのドライバー、フレームワーク、またはライブラリを使用していません。そのため、Mac で動作させるのはとても簡単です。
コンパイラについては、AMDではアップストリームLLVMを使用し、NVIDIAではMESAプロジェクトのNAKコンパイラを使用します。コンパイラも1、2年以内に純粋なtinygradに置き換える予定です。
RANGEIFYが統合されたことで、当社のローディング機能は最先端のTVMスタイルに一致するようになりました。私たちはそのレベルの速度についてThunderKittensとTileLangを研究しており、AMD Llama 405Bトレーニング契約の期日までに200日以内にこれらすべての準備を整えるはずです。
tinygrad はサイズが小さく、純粋な Python の性質を持っているため、進歩するのが最も簡単な ML ライブラリであり、改善の傾きが最速です。スケジューリングにはMegakernelスタイル、計画にはMODeL_optスタイル、シンボリックにはE-graphスタイルがあれば、PyTorchとJAXの速度で最先端の技術を吹き飛ばすはずです。
そうすれば、エヌビディアの堀は終わります。tinygradに新しいアクセラレータを追加するには、せいぜい1000行です。また、カーネルドライバ、コンパイラ、ライブラリの助けを借りて新しいアクセラレータを追加するつもりはありません。「アクセラレータ全体」用のソフトウェアは、tinygrad が現在 NVIDIA と AMD GPU で行っているように、PCIe BAR 上で直接話すわずか 1000 行のソフトウェアです。
@geerlingguy あるいは実際には、AMD はさらに簡単です。「extra/usbgpu/tbgpu」ドライバをインストールし、AMD=1
@geerlingguy あるいは実際には、AMD はさらに簡単です。「extra/usbgpu/tbgpu」ドライバとAMD=1をインストールするだけです。0 は、このレベルで Intel をサポートする予定です。
50.32K
トップ
ランキング
お気に入り