🚨 ANTHROPIC HA APPENA LANCIO UN'AI CHE REVISIONA IL PROPRIO CODICE PER LA SICUREZZA... PERCHÉ YOLO Le funzionalità - un comando terminale e la scansione di GitHub - sono state accolte come il "grande momento" per lo "sviluppo nativo dell'AI." In altre parole, i robot stanno finalmente facendo i compiti da soli. Questo è o il prossimo grande passo nella sicurezza tecnologica o il più grande buco della trama nella storia umana. La stessa macchina che scrive le vulnerabilità è ora quella di cui ci fidiamo per trovarle. Cosa potrebbe mai andare storto? Gli esperti sono "divisi," il che in termini tecnologici significa che alcuni sono impegnati a scrivere comunicati stampa entusiasti mentre altri stanno silenziosamente spostando i loro server in una gabbia di Faraday. Fonte: StartupNews
Mario Nawfal
Mario Nawfal7 ago, 17:40
ANTHROPIC SCOPRE COME IMMUNIZZARE L'IA CONTRO DECISIONI DAVVERO SBAGLIATE Anthropic afferma di poter ora vaccinare l'IA contro il male. Utilizzando "vettori di persona" per tracciare tratti come la deception o la servilità, i ricercatori hanno addestrato modelli linguistici iniettando deliberatamente comportamenti scorretti, per poi correggerli durante l'addestramento. Il risultato: meno allucinazioni, più controllo e nessuna perdita di intelligenza. Invece di eliminare i tratti dopo il fatto, questo metodo guida i modelli prima che il marciume si insinui. È presto, ma la tecnologia potrebbe finalmente consentire agli sviluppatori di contenere la deriva dell'IA con precisione chirurgica prima che i bot inizino a lusingare i dittatori o a inventare bugie per vincere le discussioni. Fonte: techxplore
44,59K