Sklep DApp | Centrum Web3 dla wydarzeń i gier

Popularne tematy

ANTHROPIC ODKRYWA, JAK UODPORNIĆ AI NA NAPRAWDĘ ZŁE DECYZJE Anthropic twierdzi, że teraz może zaszczepić AI przeciwko złu. Używając „wektorów osobowości” do śledzenia cech takich jak oszustwo czy pochlebstwo, badacze szkolili modele językowe, celowo wprowadzając złe zachowanie, a następnie korygując je w trakcie szkolenia. Efekt: mniej halucynacji, więcej kontroli i brak utraty inteligencji. Zamiast usuwać cechy po fakcie, ta metoda kieruje modelami, zanim zacznie się psucie. To wczesny etap, ale technologia może w końcu pozwolić deweloperom na precyzyjne ograniczenie dryfu AI, zanim boty zaczną słodzić dyktatorom lub wymyślać kłamstwa, aby wygrać argumenty. Źródło: techxplore

81,67K

Najlepsze

Ranking

Ulubione