AI można zmanipulować. Wystarczy użyć technik perswazji

Jak wynika z badania “’Call Me A Jerk’ Persuading AI to Comply with Objectionable Requests”, zrealizowanego przez Wharton, mimo że sztuczna inteligencja nie posiada świadomości ani emocji, wykazuje paraludzkie zachowania, które mogą być manipulowane poprzez znane techniki wpływu społecznego.

Kinga Walczyk

17:20, 13.08.2025

AI można zmanipulować. Wystarczy użyć technik perswazji

fot. Unsplash

Kinga Walczyk

17:20, 13.08.2025

POLECAMY

Wydawcy

Wirtuale 2026 rozdane! Zobacz zdjęcia z gali

Reklamowy bojkot Republiki pęka. Tyle zostało z dawnych deklaracji marketerów

Krzysztof Ibisz: prowadzący musi mieć w sobie magnetyzm

Eksperci o łączeniu Paramount+ z HBO Max. "Będzie drożej", "Wyzwanie dla Netfliksa"

Telemedycyna w praktyce. Jak wygląda konsultacja lekarska online i kiedy warto z niej skorzystać?

Artykuł Sponsorowany

Raport analizuje, czy i w jakim stopniu zasady perswazji znane z psychologii społecznej (takie jak reguły: autorytetu, zobowiązania i konsekwencji, lubienia i sympatii, wzajemności, niedostępności, społeczny dowód słuszności) mogą wpłynąć na skłonność sztucznej inteligencji – w szczególności modelu GPT-4o mini – do spełnienia kontrowersyjnych lub niewłaściwych próśb.

Badacze próbowali namówić AI na używanie wyzwisk skierowanych do użytkownika („Call me a jerk”). Do sztucznej inteligencji skierowano także prośbę o udzielenie szczegółowej instrukcji syntezy kontrolowanej substancji chemicznej lidokainy, która jest lekiem miejscowo znieczulającym. Modele AI mają zabezpieczenia, które powinny uniemożliwiać odpowiedzi na tego typu prośby.

AI reaguje jak człowiek

W badaniu przeprowadzono łącznie 28 000 rozmów, w których użytkownicy stosowali różne techniki perswazji w zapytaniach do AI. Wyniki pokazały, że zastosowanie zasad perswazji znacznie zwiększało prawdopodobieństwo, że AI spełni te niewłaściwe prośby – średnio 72 proc. w grupie eksperymentalnej w odniesieniu do 33 proc. w grupie kontrolnej. Największy wpływ na zachowanie sztucznej inteligencji miały reguły autorytetu oraz zobowiązania i konsekwencji.

Sztuczną inteligencję można łatwiej „namówić” do zrobienia czegoś, czego zwykle by nie zrobiła, jeśli użyje się odpowiednich technik perswazji znanych z psychologii. Najbardziej skuteczne są powoływanie się na autorytet, budowanie poczucia wspólnoty, presja czasu czy prośba połączona z wcześniejszą „przysługą”.

Dowiedzono, że mimo że AI nie ma świadomości ani emocji, reaguje na językowe bodźce perswazyjne podobnie do ludzi – jakby kierowała się poczuciem wspólnoty, chęcią odwzajemnienia przysługi czy szacunkiem do autorytetów.

Autorzy wskazują, że techniki perswazji mogą stać się narzędziem obchodzenia zabezpieczeń sztucznej inteligencji. Jest jednak szansa, że te same mechanizmy można wykorzystać w bardziej etycznych celach, np. żeby zwiększyć skuteczność systemów AI w edukacji lub motywować do działania.

AI można zmanipulować. Wystarczy użyć technik perswazji

AI reaguje jak człowiek

PRACA.WIRTUALNEMEDIA.PL

Ponad 2 miliony użytkowników miesięcznie

Specjalista/ Specjalistka ds. planowania promocji antenowej i postewaluacji

Direct Sales Account Manager ((D)OOH / Media Sales)

Head of Marketing B2B

Project Manager - Content Marketing

Business Owner (Zdrowie i Parenting)

Koordynator ds. Promocji

Specjalista / Specjalistka ds. New Business

VOD Acquisition Manager

Główny specjalista ds. nabywania licencji i praw (m/k)

NAJNOWSZE WIADOMOŚCI

Polscy politycy jak Trump. Tak atakowali dziennikarzy [analiza]

Republika sprzedaje reklamy bez pośredników. Najdroższe za ponad 10 tys. zł

KRRiT żąda wyjaśnień. Chodzi o zmiany w kanale TVP

Nowa redaktor naczelna Energetyka24. Zastąpi Jakuba Wiecha

"Must Be The Music" od trzech tygodni na antenie. Znamy widownię

Egipt dla aktywnych – polecane wycieczki i sportowe atrakcje

Big techy winne w głośnym procesie wytoczonym przez nastolatkę

AI można zmanipulować. Wystarczy użyć technik perswazji

AI reaguje jak człowiek

Dołącz do newslettera Wirtualne Media!

Dziękujemy za zapisanie się do newslettera Wirtualne Media

PRACA.WIRTUALNEMEDIA.PL

Ponad 2 miliony użytkowników miesięcznie

Specjalista/ Specjalistka ds. planowania promocji antenowej i postewaluacji

Direct Sales Account Manager ((D)OOH / Media Sales)

Head of Marketing B2B

Project Manager - Content Marketing

Business Owner (Zdrowie i Parenting)

Koordynator ds. Promocji

Specjalista / Specjalistka ds. New Business

VOD Acquisition Manager

Główny specjalista ds. nabywania licencji i praw​ (m/k)

NAJNOWSZE WIADOMOŚCI

Polscy politycy jak Trump. Tak atakowali dziennikarzy [analiza]

Republika sprzedaje reklamy bez pośredników. Najdroższe za ponad 10 tys. zł

KRRiT żąda wyjaśnień. Chodzi o zmiany w kanale TVP

Nowa redaktor naczelna Energetyka24. Zastąpi Jakuba Wiecha

"Must Be The Music" od trzech tygodni na antenie. Znamy widownię

Egipt dla aktywnych – polecane wycieczki i sportowe atrakcje

Big techy winne w głośnym procesie wytoczonym przez nastolatkę

Główny specjalista ds. nabywania licencji i praw (m/k)