Epiplexity, päättely ja LLM:ien "vieras" käyttäytyminen: Keskusteluni @Pavel_Izmailov:n kanssa, joka on tekoälytutkija @AnthropicAI:ssa ja professori @nyuniversity:ssa. 00:00 - Intro 00:53 - Avaruusolentojen selviytymisvaistot: aiheuttaako jatkuva oppiminen suuren kohdistusongelman? Kommentoi @iruletheworldmo 03:33 - Oppiko tekoäly petoksen tieteiskirjallisuudesta? 05:55 - Linjauksen, Superalignmentin ja OpenAI-tiimien määrittely 08:12 - Pavelin matka: Venäläisestä matematiikasta OpenAI:n superalignmentiin 10:46 - Kulttuuritarkistus: OpenAI vs. Anthropic vs. Akatemia 11:54 – Miksi siirtyä NYU:hun? Akateeminen maailma ja tarve tutkivalle tutkimukselle 13:09 – Tekeekö järkeminen tekoälyn kohdistuksesta vaikeampaa vai helpompaa? 14:22 - Sandbaging: Kun mallit teeskentelevät olevansa tyhmiä 16:19 - Skaalautuva valvonta: Tekoälyn käyttö tekoälyn valvonnassa 18:04 - Heikosta vahvaan yleistys 22:43 - Mekaaninen tulkittavuus: Mustan laatikon sisällä 25:08 - Järjen räjähdys 27:07 – Ovatko transformerit tarpeeksi vai tarvitsemmeko uuden paradigman?...