Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Viime viikonloppuna julkaisin, että Claude Code loi täydellisen empiirisen poliittisen tutkimuksen tunnissa. Monet kysyivät: mutta kuinka tarkka tutkimus oli?
Vastaus: melko tarkka, mutta mukana on joitakin mielenkiintoisia virheitä ja merkittäviä rajoituksia.
Vastauksen saamiseksi Graham Straus ystävällisesti tarjoutui tekemään itsenäisen, manuaalisen auditoinnin—keräten saman datan ja laajentaen artikkelia kuin Claude, mutta ilman tekoälyä. Tässä mitä hän löysi:
Claude toisti alkuperäisen artikkelin tarkasti, koodasi 29/30 Kalifornian piirikuntaa oikein hoitojen ajoituksessa ja keräsi vaalidataa, joka korreloi >,999 ja manuaalinen keräys.
Grahamin kolme pääasiallista virhettä—yhden piirikunnan hoitovuoden väärin koodaaminen, useiden mahdollisesti relevanttien vaalien tietojen keräämisen jättäminen pois aina käsitellyissä osavaltioissa sekä ei-presidentinvaalien käyttämättä jättäminen äänestysaktiivisuuden laskemiseen—ovat samankaltaisia kuin ne virheet, joita ihminen voi tehdä ensimmäisellä kierroksella tämän artikkelin kirjoittamisessa, ja niillä oli vain vähän vaikutuksia myöhempiin arvioihin.
Toisaalta, kun Claude yritti luoda uusia analyysejä, jotka eivät olleet suoraviivaisia jatkoja alkuperäisestä artikkelista, se onnistui huonommin. Ei hallusinaatioita tai hulluja virheitä sinänsä, mutta se poikkeaa kehotuksesta ja tuotti tuloksia, joita pidimme huonosti suunniteltuina.
Oma lukemani:
–Tekoäly on nykyään jo erittäin tehokas tapa nopeasti päivittää ja laajentaa hyvin hallittuja, yksinkertaisia empiirisiä artikkeleita.
–Empiirisen yhteiskuntatieteellisen tutkimuksen tekemiseen tarvitaan ehdottomasti ihmisten asiantuntijoiden ohjausta ja valvontaa.
Jaamme ensi viikolla blogissani laajempia ajatuksia tästä työstä, mitä opimme tekemällä ja mihin suuntaan tästä eteenpäin. Kiitos monille, monille ihmisille, jotka ottivat yhteyttä, esittivät kysymyksiä ja antoivat palautetta tästä projektista.


4.1. klo 08.01
Tässä on todiste siitä, että Claude Code voi kirjoittaa kokonaisen empiirisen valtiotieteellisen artikkelin.
Vahvistaakseni väitteeni, että tekoälyagentit tulevat politiikan kimppuun "kuin tavarajuna", pyysin tänään Claude Codea täysin kopioimaan ja laajentamaan vanhaa artikkeliani, jossa arvioin universaalin postiäänestyksen vaikutusta äänestysaktiivisuutta ja vaalituloksia... käytännössä yhdellä iskulla.
Huolellisen kehotuksen jälkeen Claude Code:
(1) Latasimme vanhan paperin reposition ja kopioimme aiemmat tulokset, kääntäen vanhan Stata-koodimme Pythoniksi
(2) Selasin verkkoa saadakseen päivitetyt viralliset vaali- ja väestönlaskentatiedot
(3) Suoritti uusia analyysejä, jotka jatkoivat tuloksia vuoteen 2024 asti
(4) Luotu uudet taulukot ja kuvat
(5) Suoritti kirjallisuuskatsauksen
(6) Kirjoitti kokonaan uuden artikkelin
(7) Siirsin koko jutun uuteen github-repositioon
Koko homma kesti noin tunnin.
Tämä on järjetön paradigman muutos siinä, miten empiiristä työtä tehdään.
Se myös vahvistaa sen, että useat ihmiset, mukaan lukien @BrendanNyhan, totesivat eilen--- on erityisen helppoa skaalata havaintotutkimusta tekoälyn avulla.
Kiitos @alexolegimas, @arthur_spirling ja monille muille, jotka antoivat palautetta. .

Täydellinen katsaus on saatavilla täällä:
On mielenkiintoista yhdistää se @joshgans @alexolegimas @deanwball:n ja muiden tuoreiden kirjoitusten kanssa!
220
Johtavat
Rankkaus
Suosikit