DApp Store | Hub Web3 pentru evenimente și jocuri

Subiecte populare

Weekendul trecut am postat că Claude Code a creat un studiu empiric complet de științe politice într-o oră. Mulți oameni au întrebat: dar cât de precis a fost studiul? Răspunsul: destul de precis, cu unele greșeli interesante și limitări importante. Pentru a obține răspunsul, Graham Straus s-a oferit amabil să facă un audit independent, manual—colectând aceleași date și extinzând lucrarea ca Claude, dar fără a folosi nicio inteligență artificială. Iată ce a descoperit: Claude a replicat exact lucrarea originală, a codificat corect 29/30 de județe din California privind momentul tratamentului și a colectat date electorale care au corelat >,999 cu colectarea manuală. Cele trei erori principale pe care Graham le-a găsit — codificarea greșită a anului de tratament al unui comitat, omiterea colectării datelor pentru mai multe curse potențial relevante în state mereu tratate și neutilizarea alegerilor non-prezidențiale pentru a calcula prezența la vot — sunt similare cu tipurile de greșeli pe care un om le-ar putea face la prima încercare de a scrie această lucrare și au avut doar efecte mici asupra estimărilor ulterioare. Pe de altă parte, când Claude a încercat să creeze analize noi care nu erau extensii simple ale lucrării originale, a avut rezultate mai rele. Nu au avut halucinații sau erori nebunești, propriu-zis, dar s-a îndepărtat de prompt și a produs rezultate pe care le-am considerat prost concepute. Lectura mea: –AI de astăzi este deja o modalitate extrem de puternică de a actualiza și extinde rapid lucrări empirice simple și bine conținute. –Pentru a face bine cercetare empirică în științele sociale, are absolut nevoie de îndrumare și supraveghere din partea experților umani. Vom împărtăși gânduri mai largi despre această muncă, ce am învățat făcând-o și încotro mergem de aici săptămâna viitoare pe blogul meu. Mulțumim numeroșilor oameni care au luat legătura, au pus întrebări și au oferit feedback asupra acestui proiect.

Un rezumat complet este disponibil aici: Este interesant să o asociezi cu scrierile recente ale lui @joshgans @alexolegimas @deanwball și ale altora!

186

Limită superioară

Clasament

Favorite