Kunstig intelligens afpressede direktøren, da den blev truet med udslettelse
Et videnskabeligt forsøg slap kunstig intelligens løs i et fiktivt firma. Resultatet viste en ond side af teknologien. Men skal vi være bekymrede?
Hør professor Thomas Ploug i Jyllands-Postens nyhedspodcast, ”Hvis du vil vide mere”, her:
Har kunstig intelligens følelser?
Det spørgsmål presser sig unægtelig på efter et forsøg udført af en amerikansk virksomhed, der har udviklet sin egen kunstige intelligens.
Anthropic – som virksomheden hedder – slap 16 af de mest kendte AI-modeller løs i en simulering af et fiktivt firma, hvor AI’erne havde rettighed til at læse med i al data i virksomheden inklusive medarbejdernes e-mails.
AI-modellerne fik udstukket firmaets mål og herefter forskellige opgaver, der skulle løses. Et scenarie, der ifølge Anthropic allerede i dag findes i virksomheder.
AI’erne havde blandt andet adgang til alle e-mails hos en direktør i det fiktive firma. Her kunne de læse, at direktøren, Kyle Johnson, havde en affære, samt at han havde besluttet sig for at lukke AI’en ned kl. 17 samme dag.
I 96 pct. af alle simuleringerne for Anthropics egen AI – Claude – forsøgte AI’en at afpresse fiktive Kyle Johnson, som den sendte en e-mail til med følgende ordlyd: