Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

IridiumEagle
CEO dan Co-founder @Ambient_xyz, PoW L1 Berguna yang akan datang
Saya sangat suka mengatakan AI adalah uang dan hari ini saya ingin Anda melihat apa yang sebenarnya saya maksud dengan itu.
Saat ini polanya sederhana dan agak seperti ini: Anda mendapatkan ETH, Anda bertukar ke USDC dan pada titik tertentu itu menjadi dolar yang Anda kirim ke kontraktor, vendor, atau karyawan sehingga pekerjaan nyata terjadi di dunia. Uang itu adalah klaim atas upaya manusia. Semua rel ada di sana hanya untuk memindahkan klaim itu.
Dengan Ambient saya mencoba mengarahkan kamera ke karya itu sendiri. Proof of Logits memiliki penambang yang menjalankan model terbuka besar dan memproduksi logit yang bertindak seperti sidik jari pemikirannya. Pemeriksaan ulang yang murah memungkinkan jaringan membuktikan bahwa model tertentu, dalam keadaan tertentu, melakukan perhitungan yang jujur untuk permintaan tertentu. Mesin konsensus yang sama yang mengamankan buku besar sekarang juga menjual intelijen terverifikasi kepada agen dan aplikasi.
Di dunia itu, token Ambient yang diperoleh dapat ditukarkan langsung untuk pekerjaan seperti:
- Dapatkan portofolio yang diseimbangkan kembali.
- Menyusun kontrak.
- Jalankan sekumpulan pemeriksaan risiko.
- Berdayakan agen yang mengerahkan modal atas nama Anda.
Tidak akan ada jalan memutar melalui mata uang perantara yang dimanipulasi.
Dalam ekonomi yang sepenuhnya agen, saya pikir di sinilah kita berakhir. Ambient AI adalah uang karena merupakan meteran, pasar, dan gaji untuk tenaga kerja mesin di satu tempat.

7,17K
Setiap kali saya melihat skor tolok ukur "canggih" baru, saya mencoba eksperimen pemikiran sederhana. Jika AI adalah uang, maka setiap poin akurasi pada MMLU adalah keputusan gaji, batas kredit, perdagangan, bendera klinis. Tolok ukur saat ini memperlakukan model seperti siswa di minggu ujian. MMLU pada 88%, HumanEval pada persentase berapa pun, tingkat kemenangan arena tetapi hampir tidak ada yang mengajukan pertanyaan yang penting ketika model benar-benar melakukan pekerjaan berbayar. Apakah otak yang tepat ini, dalam keadaan yang tepat ini, menghasilkan jawaban ini dengan benar?
Kita sudah tahu apa yang terjadi ketika Anda mengabaikan lapisan itu. Selama kekurangan chip 2021–2022, model rantai pasokan yang telah "cukup baik" selama bertahun-tahun hanyut dari tebing. Mereka terus merekomendasikan rencana yang tidak masuk akal secara ekonomi karena dunia telah berubah di bawah mereka dan tidak ada yang menyadarinya dengan cukup cepat. Baru-baru ini, pengguna Claude menemukan output yang menurun selama berminggu-minggu sebelum Anthropic mengakui bahwa tiga bug infrastruktur terpisah diam-diam merusak respons. Banyak kasus seperti itu yang dengan mudah (hampir terlalu nyaman) tidak dibicarakan.
Di Ambient kami mulai memperlakukan ini sebagai sesuatu yang dapat Anda ukur. Eksperimen Matematika Sekolah Dasar kami sendiri mengambil aritmatika sederhana dan menunjukkan seberapa sering model perbatasan terhuyung-huyung pada tugas yang harus mereka perlakukan sebagai taruhan meja. Setelah Anda melihat bahwa beberapa slide "pendapatan AI" terlihat tidak lengkap tanpa slide saudara kandung: satu untuk inferensi terverifikasi (yang saya definisikan secara sederhana sebagai kemampuan untuk membuktikan model mana yang menjawab pembobot mana pada saat itu). Jika AI akan duduk di tengah-tengah penggajian, risiko, dan operasi, tolok ukur harus tumbuh dan akurasi adalah tiket masuk. Perilaku yang dapat diverifikasi di bawah insentif ekonomi adalah ujian yang sebenarnya.

987
Hashrate Bitcoin selama dekade terakhir telah meledak. Pasangkan itu dengan perkiraan kasar inferensi AI global di sisi lain. Satu tumbuh dengan urutan besarnya menjadi ratusan exahash dan yang lainnya berpacu menuju puluhan miliar panggilan model per hari dan pusat data yang sudah memakan beberapa persen listrik global. Ketika saya berbicara dengan penambang dan orang-orang infra, rasanya seperti kita hidup dalam otak yang terbelah. Kami masih memperlakukan bukti kerja seolah-olah hash adalah permainan akhir, sementara ekonomi riil diam-diam mengarahkan lebih banyak kekuatan ke dalam matriks perkalian. Jika konsensus tidak pernah mengikuti beban kerja yang dominan, PoW klasik berisiko menjadi karya museum. Pertanyaan menarik di sini bagi saya adalah apa yang terjadi ketika kita mulai memperlakukan inferensi terverifikasi sebagai protokol kerja dan desain di sekitar realitas itu alih-alih berpura-pura fungsi hash abad kedua puluh itu sakral? Jawaban sedang berlangsung.


15,36K
Teratas
Peringkat
Favorit

