Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

パウロ
Так, я занурююся в архітектуру на основі ICMS і Enfabrica. Це свого роду угода Mellanox. Але NVLink буде дуже перевантажений GPU, CPU і DPU. Nvidia потрібно спростити передачу даних для кв і ваги.

Zephyr15 годин тому
Введення HBF не відбудеться
Ознайомтеся з угодою Nvidia ICMS та Enfabrica, щоб дізнатися чому
55
Я вважаю, що HBF занадто переоцінений
У деяких випадках, якщо програмне забезпечення суттєво модифікувати, ним не буде неможливо користуватися, але це буде ілюзія, що воно замінить HBM або що розмір ринку буде великим
Як написано тут, якщо він майже завантажений тут, то це буде зміщення і вага тієї ж моделі, а не KV, але це було б абсолютно непридатно
За словами експертів, HBF може бути впроваджений у GPU NVIDIA до 2027~28 року, а ринок може перевершити HBM до 2038 року
Зі зростанням обсягів роботи на основі штучного інтелекту впровадження високопропускної здатності (HBF) прискорюється, і експерти прогнозують швидше, ніж очікувалося, комерціалізацію. За даними Sisa Journal, професор KAIST Кім Чен Хо, відомий як «батько HBM», припускає, що Samsung Electronics і SanDisk планують інтегрувати HBF у продукти NVIDIA, AMD і Google до кінця 2027 або початку 2028 року. Як зазначено у звіті, Кім додає, що хоча розробка HBM займає понад 10 років, HBF може бути комерціалізована значно раніше, оскільки компанії вже використовують накопичені в HBM технології та експертизу дизайну для розробки HBF.
Крім того, Кім прогнозує, що впровадження HBF розшириться приблизно в той час, коли буде впроваджений HBM6, і ринок HBF може перевершити HBM приблизно до 2038 року. За словами Кіма, HBM6 — це не єдиний стек пам'яті, а кілька стеків взаємопов'язані, як житловий будинок. Оскільки HBM на базі DRAM стикаються з обмеженнями пропускної здатності, Кім вважає, що HBF у вигляді NAND-стеків з'явиться для заповнення цієї прогалини.
Роль HBF у висновку ШІ та архітектурі систем
Щодо ролі HBF у робочих навантаженнях ШІ, Кім пояснив, що GPU спочатку отримують змінні дані від HBM під час висновку, обробляють їх і генерують результати. Кім вірить, що в майбутньому HBF візьме на себе цю роль і надасть значно більші потужності для підтримки цього завдання. HBM швидший, а HBF забезпечує приблизно в 10 разів більшу пропускну здатність. Як зазначено у звіті, Кім наголошує, що хоча HBF підтримує необмежену кількість циклів читання, вона обмежена приблизно 100 000 циклів запису, тому програмне забезпечення таких компаній, як OpenAI та Google, має бути оптимізоване для операцій, що потребують інтенсивного читання.
Кім також додав, що поточний процес подачі даних до GPU передбачає довгий шлях передачі через мережу зберігання, процесори даних і конвеєри GPU. У майбутньому компанія планує більш оптимізовану архітектуру, яка зможе обробляти дані безпосередньо за HBM. Цю структуру, яку очікують до реалізації в HBM7, іноді називають «фабрикою пам'яті».
Samsung і SK hynix просувають розвиток HBF
Як зазначено у звіті, SK hynix планує випустити пробну версію HBF для демо пізніше цього місяця. У звіті також зазначено, що Samsung Electronics та SK hynix підписали меморандум про взаєморозуміння (MOU) із SanDisk для просування стандартизації HBF і наразі працюють над цією ініціативою через спільний консорціум. Обидві компанії активно розробляють продукти HBF і планують запустити їх у 2027 році.
За даними галузевих джерел, посиланих у звіті, HBF, за оцінками, здатний забезпечувати пропускну здатність понад 1 638 ГБ/с, що є значним стрибком порівняно зі стандартними SSD, які зазвичай забезпечують близько 7 000 МБ/с через NVMe PCIe 4.0. Щодо пропускної здатності, HBF очікується до 512GB, що значно більше, ніж HBM4 у 64GB.
53
Мідна фольга, бурильна яма
Google TPUでアップグレード
M9グレーパナソニックつえええ
TPU від Google лідирують у технології CCL (Chip Cl), а виробники свердлових свердел вітають оновлення.
Оскільки ASIC-платформи продовжують еволюціонувати до вищої щільності обчислень і вимог до пропускної здатності, саморозроблені TPU Google входять у нову фазу оновлення специфікацій. За даними джерел у ланцюгах постачання, Google планує комплексно збільшити кількість шарів плат і класів матеріалів CCL для своєї платформи наступного покоління TPU, починаючи з 2026 року, відкриваючи можливості оновлення специфікацій виробникам CCL у Японії та Тайвані. Зі збільшенням кількості шарів підкладки та підвищенням складності матеріалів змінюється структура попиту на свердла у виробничому процесі.
Постачання CCL від Google для TPU-проектів наразі переважно підтримується японською Panasonic та тайванською Taikoo Technology. Оглядаючись назад на покоління TPU V6e (серія Ghost), Panasonic зіткнулася з дефіцитом склових волокон з низькою діелектричною константою, і Swire Technology увійшла в ланцюг постачання та здобула певну частку. За оцінками ланцюга постачання, проект TPU нового покоління буде постачатися Panasonic приблизно на 70%, а Swire — близько 30%, що свідчить про повернення до більш стабільної структури постачання.
На основі поточного дизайну GhostLite і GhostFish у серії Ghost зберігають консервативну конфігурацію приблизно з 22~24 шарами плат і Ccl класу M7. Однак після 2026 року платформа TPU перейде на ZebraFish і SunFish, що суттєво покращить загальні характеристики. За даними джерел у ланцюгах постачання, нова платформа використовує CCL класу M8/M9, кількість шарів друкованих плат збільшена до 36 і 44 шарів відповідно, і очікується, що вона відповідатиме вимогам до вищої пропускної здатності та енергоспоживання шляхом використання оптичного волокна високої якості Low Dk та мідної фольги HVLP4.
Зі збільшенням кількості шарів друкованих плат і класів матеріалів зростає і тиск на виробничий процес. За словами інсайдерів галузі, попит на бурові свердла для високоякісних AI-плат зростає з темпами, що значно перевищують темпи зростання вартості виробництва ПХБ. Раніше одне свердло використовувалося близько 3 000 разів, але з появою висококласних AI-плат його термін служби різко скоротився до менш ніж 800 разів. У майбутньому, якщо будуть впроваджені інтерпозиційні плати рівня M9 та материнські плати ASIC, кількість використання одного бурового долота може бути ще більше зменшена.
Аналітики галузі вважають, що трансформація дизайну TPU від Google після 2026 року означає, що ASIC увійшли на новий етап «високої кількості підлог, високих матеріалів і високої доданої вартості». Це відображатиметься не лише у середній ціні продажу (ASP) висококласних продуктів з CCL та PCB, а й пошириться на ключові ланцюги постачання, такі як низькодіелектричне скловолокно, висококласна мідна фольга HVLP та свердла. Ланцюги постачання заздалегідь коригують свої конфігурації, щоб пристосуватися до впровадження нових платформ.
54
Найкращі
Рейтинг
Вибране
