Tekoälyn turvallisuus ei ole kaikille sopiva asia; se on hyvin kulttuurispesifistä. Törmäsin tähän LinguaSafe-paperiin, ja se todella korostaa jotain tärkeää kaikille, jotka rakentavat tekoälyä maailmanlaajuiselle yleisölle. Pelkkä haitallisen kehotteen kääntäminen englannista voi olla tehokas jailbreak. Sama kehote, joka on "turvallinen" englanniksi, muuttuu "vaaralliseksi" muilla kielillä, joten tarvitset todellista, alkuperäistä dataa näiden ongelmien havaitsemiseksi.
8,19K