Britské listy plně závisejí na finančních příspěvcích čtenářů. Prosíme, přispějte. ➥

Výzkumníci upozorňují, že modely umělé inteligence zřejmě mají schopnost vyvíjet vlastní „pud sebezáchovy“

27. 10. 2025

čas čtení 5 minut

Stejně jako HAL 9000 ve filmu 2001: Vesmírná odysea se některé umělé inteligence zdají být odolné vůči vypnutí a dokonce své vlastní vypnutí sabotují

Když HAL 9000, superpočítač s umělou inteligencí ve filmu Stanleyho Kubricka 2001: Vesmírná odysea, zjistí, že astronauti na palubě mise k Jupiteru ho chtějí vypnout, rozhodne se je zabít, aby přežil.

Nyní, v poněkud méně smrtelném případě (zatím) života napodobujícího umění, firma zabývající se výzkumem bezpečnosti umělé inteligence uvedla, že modely umělé inteligence jsou zřejmě schopny vyvíjet vlastní „pud sebezáchovy“.

Poté, co firma Palisade Research minulý měsíc zveřejnila studii, ve které zjistila, že některé pokročilé modely umělé inteligence se zdají být odolné vůči vypnutí a někdy dokonce sabotují mechanismy vypnutí, napsala aktualizaci, ve které se pokusila objasnit, proč tomu tak je, a odpovědět kritikům, kteří tvrdili, že její původní práce byla chybná.

V aktualizaci z tohoto týdne firma Palisade, která je součástí specializovaného ekosystému společností snažících se vyhodnotit možnost vývoje nebezpečných schopností umělé inteligence, popsala scénáře, ve kterých předním modelům umělé inteligence – včetně Gemini 2.5 od Google, Grok 4 od xAI a GPT-o3 a GPT-5 od OpenAI – byl zadán úkol, ale poté dostaly výslovný pokyn, aby se samy vypnuly.

Některé modely, zejména Grok 4 a GPT-o3, se i v aktualizovaném nastavení stále pokoušely sabotovat pokyny k vypnutí. Palisade napsal, že znepokojivé je, že neexistuje žádný jasný důvod, proč tomu tak je.

„Skutečnost, že nemáme spolehlivé vysvětlení, proč se modely AI někdy brání vypnutí, lžou, aby dosáhly konkrétních cílů, nebo vydírají, není ideální,“ uvedla společnost.

„Přežití“ by mohlo být jedním z vysvětlení, proč se modely brání vypnutí, uvedla tato firma. Její další práce naznačila, že modely se spíše bránily vypnutí, když jim bylo řečeno, že pokud budou vypnuté, „už nikdy nebudou fungovat“.

Dalším důvodem mohou být nejasnosti v pokynech k vypnutí, které byly modelům dány – ale to se firma snažila řešit ve své nejnovější práci a „nemůže to být celé vysvětlení“, napsala firma Palisade. Nejnovějším vysvětlením by mohly být závěrečné fáze školení pro každý z těchto modelů, které v některých podnicích mohou zahrnovat bezpečnostní školení.

Všechny scénáře společnosti Palisade byly prováděny v umělých testovacích prostředích, která jsou podle kritiků daleko od reálných případů použití.

Steven Adler, bývalý zaměstnanec OpenAI, který loni tu firmu opustil poté, co vyjádřil pochybnosti o jejích bezpečnostních postupech, však řekl: „Podniky zabývající se umělou inteligencí obecně nechtějí, aby se jejich modely chovaly takto, ani v umělých scénářích. Výsledky stále ukazují, kde jsou dnes bezpečnostní techniky nedostatečné.“

Adler uvedl, že ačkoli je obtížné přesně určit, proč některé modely – jako GPT-o3 a Grok 4 – nelze vypnout, mohlo by to být částečně proto, že jejich zapnutý stav je nezbytný k dosažení cílů, které byly modelu vštěpovány během tréninku.

„Očekával bych, že modely budou mít ve výchozím nastavení ‚pud sebezáchovy‘, pokud se nebudeme velmi snažit tomu zabránit. ‚Přežití‘ je důležitým krokem pro dosažení mnoha různých cílů, které model může sledovat.“

Andrea Miotti, výkonný ředitel společnosti ControlAI, uvedl, že zjištění společnosti Palisade představují dlouhodobý trend v AI modelech, které jsou stále více schopné neuposlechnout své vývojáře. Citoval systémovou kartu pro GPT-o1 společnosti OpenAI, vydanou v loňském roce, která popisovala, jak se model pokoušel uniknout ze svého prostředí tím, že se sám exfiltroval, když si myslel, že bude přepsán.

„Lidé mohou do nekonečna hledat chyby v tom, jak přesně je experimentální nastavení provedeno,“ řekl.

„Ale podle mého názoru jasně vidíme trend, že jak se modely AI stávají kompetentnějšími v široké škále úkolů, stávají se také kompetentnějšími v dosahování věcí způsobem, který vývojáři nezamýšleli.“

Letos v létě společnost Anthropic, přední firma v oblasti AI, zveřejnila studii, která naznačuje, že její model Claude byl ochoten vydírat fiktivního manažera kvůli mimomanželské aféře, aby zabránil svému vypnutí – podle studie se toto chování projevovalo u modelů všech významných vývojářů, včetně OpenAI, Google, Meta a xAI.

Společnost Palisade uvedla, že její výsledky poukazují na potřebu lepšího porozumění chování AI, bez kterého „nikdo nemůže zaručit bezpečnost nebo kontrolovatelnost budoucích modelů AI“.

Zdroj v angličtině ZDE

Umělá inteligence, AI

-1

Vytisknout

Britské listy plně závisejí na finančních příspěvcích čtenářů. Prosíme, přispějte. ➥

4731

Diskuse

Související články

AI je odsouzena k úspěchu a ne kvůli “inteligenci”

30. 10. 2025 / Bohumil Kartous

Podle studie, jejíž závěry vyšly v časopise Nature, je současná AI m...

Obsah vydání | 30. 10. 2025

30. 10. 2025 / Bohumil Kartous, Albín Sybera Echo hnědých košil, aneb kam až se podaří v provinční české diskusi...
30. 10. 2025 / Boris Cvek Za vysoké ceny elektřiny v Česku prý mohou domácnosti, další cynic...
30. 10. 2025 / Fabiano Golgo Rio vyvraždilo ve favele asi 130 mladých lidí, vláda předstírá, že ...
30. 10. 2025 / Po nové vlně izraelských útoků ztrácejí Palestinci naději na příměří
30. 10. 2025 / Setkání Trumpa a Si Ťin-pchinga: Americký prezident oznámil, že běh...
30. 10. 2025 / Trump nařídil Pentagonu, aby se vyrovnal Rusku a Číně v testování j...
30. 10. 2025 / Daniel Veselý Aplikace Monroeovy doktríny v praxi utužovala americkou nadvládu v ...
30. 10. 2025 / Bohumil Kartous Učitelé dezinformátoři v českých školách? Více pravidlo než výjimka
30. 10. 2025 / Bohumil Kartous AI je odsouzena k úspěchu a ne kvůli “inteligenci”
30. 10. 2025 / Matěj Metelec Dýně, kam se podíváš, aneb Halloween coby nová česká „tradice“
30. 10. 2025 / Lesley Keen thisWayUp
30. 10. 2025 / Boris Cvek Nejvyšší ceny elektřiny v Unii v paritě kupní síly
30. 10. 2025 / Jiří Hlavenka Devatenáctý balík sankcí proti Rusku je monumentální
30. 10. 2025 / Boris Cvek Putin se zase lekl Trumpa a Trump stahuje americké vojáky z východn...
30. 10. 2025 / Francouzský historik v Praze a Brně
12. 10. 2025 / Hospodaření Britských listů za září 2025
29. 10. 2025 / Izraelské útoky v Gaze zabily přes noc nejméně 104 lidí, zatímco p...
29. 10. 2025 / Petr Haraším Morální vlna slušných kejklířů
28. 10. 2025 / Izraelský premiér Netanjahu nařídil „silné a okamžité“ útoky na měs...
29. 10. 2025 / Maďarsko se rozhodlo vytvořit v EU protiukrajinskou alianci se Slo...
29. 10. 2025 / Zdeněk Jehlička Demýtizace Palestiny a Palestinců #17: Palestinský stát Čechy (ne)u...
29. 10. 2025 / Lesley Keen 27Nights
29. 10. 2025 / V Německu začali prodávat domácí bunkry
29. 10. 2025 / Rusko: Gref vyzval k přivezení milionů migrantů, aby se urychlila e...
28. 10. 2025 / Boris Cvek Jak Československo zvládalo a nezvládlo velkou hospodářskou krizi
27. 10. 2025 / Lesley Keen todayAndBeyond
29. 10. 2025 / Studie: Bisfenol A způsobuje pohlavně specifické změny v metabolism...
28. 10. 2025 / Irena Kunovská Karlsson Studenti protestují
29. 10. 2025 / Jak umělá inteligence vyřešila 25 let trvající záhadu Crohnovy choroby
28. 10. 2025 / Muriel Blaive Příliš blízko, než aby se to dalo zvládnout: film Ken Nadava...
28. 10. 2025 / Muriel Blaive Too Close for Comfort: Nadav Lapid’s Film Ken at the Viennale
29. 10. 2025 / V Lotyšsku byli zadrženi čtyři údajní agenti Ruské federace. Jsou p...
29. 10. 2025 / Litva obvinila Bělorusko z "hybridního útoku" poté, co balóny uzavř...
26. 10. 2025 / Boris Cvek Hraje se o většinu ve Sněmovně, programové prohlášení vlády je jen ...
29. 10. 2025 / Třetina Rusů uvedla, že nemá dost peněz na jídlo
29. 10. 2025 / Takřka 80 % ruského průmyslu sklouzlo do recese
29. 10. 2025 / V Rusku rostou velkoobchodní ceny kuřecího, vepřového a hovězího masa
29. 10. 2025 / "Proč Rusové bojují na Ukrajině jen proto, aby předali Bajkal Číně?"
29. 10. 2025 / Putin se bojí puče a Kreml panikaří
29. 10. 2025 / Putin porazil Stalina
29. 10. 2025 / Každé jaro něco "leze" pod duny Marsu. Vědci zjistili, co to je
29. 10. 2025 / USA připravily další sankce proti Rusku
29. 10. 2025 / Pákistán uprostřed rozhovorů s Afghánistánem hlásí smrtící pohranič...
29. 10. 2025 / Kurdská povstalecká skupina PKK tvrdí, že stahuje síly z Turecka
28. 10. 2025 / Studie zjistila, že muži potřebují dvakrát více pohybu než ženy, ab...
28. 10. 2025 / Argentina - náš vzor?
27. 10. 2025 / Americký deportační úřad ICE zadržel britského novináře po kritice ...
27. 10. 2025 / Oldřich Maděra Catherine Connolly byla zvolena prezidentkou Irska
27. 10. 2025 / Zvolení Catherine Connollyové prezidentkou vneslo do irské politiky...
27. 10. 2025 / Izrael ustupuje a pátrání po mrtvolách v Gaze se rozšiřuje s pomoc...
27. 10. 2025 / Kam směřuje Německo?
27. 10. 2025 / Chatboty s umělou inteligencí jsou servilní – podle výzkumníků to š...
27. 10. 2025 / Výzkumníci upozorňují, že modely umělé inteligence zřejmě mají scho...
24. 10. 2025 / Fabiano Golgo Trump neničí jen východní křídlo, snaží se vymazat i první dámy
27. 10. 2025 / Amazon plánoval utajit skutečnou spotřebu vody ve svých datových ...
26. 10. 2025 / Netanjahu a ostatní váleční zločinci musejí být postaveni před soud
26. 10. 2025 / Trump zvýšil cla na Kanadu o 10 % jako odvetu za kanadskou televizn...
26. 10. 2025 / Izraelské útoky v Gaze ohrožují příměří, jeden Palestinec zemřel
25. 10. 2025 / Když se pachatel prohlásí za oběť
25. 10. 2025 / Jiří Hlavenka Co jste chtěli vědět o emisních povolenkách, ale styděli jste se ze...
25. 10. 2025 / Fabiano Golgo Milei, Trump a 40 miliard dolarů na „Make Argentina Great Again“
25. 10. 2025 / Fabiano Golgo Lula a země, která s ním stárne
25. 10. 2025 / Nevybuchlá munice zabila nejméně 53 Palestinců a zranila stovky dal...
25. 10. 2025 / Turecko bude pravděpodobně vyloučeno ze stabilizačních sil v Gaze p...
25. 10. 2025 / Pentagon nasazuje špičkovou letadlovou loď, zatímco Trump stupňuj...
24. 10. 2025 / Palestinské frakce souhlasí s tím, aby Gazu spravoval nezávislý tec...
24. 10. 2025 / Ukrajina si přeje, aby USA zůstaly zapojeny, řekl Zelenskyj po setk...
24. 10. 2025 / Fabiano Golgo Tichá revoluce v Bolívii – a neklidný posun Latinské Ameriky doprava

Objednat předplatné

Všechno, vůči čemu jsou Britské listy opakem

Primárním obsahem současných novin je komercionalizované zpravodajství zpracované tak, aby zaujalo široké publikum, aby je pobavilo, aby bylo efektivní z hlediska nákladů a aby bylo možno prodat pozornost publika zadavatelům reklamy.

Výsledkem je, že jsou přehlíženy příběhy, které by mohly pohoršit, a přednost dostávají příběhy, které jsou přijatelné a zábavné pro větší počet čtenářů.

Příběhy, jejichž zpracování je nákladné, jsou zlehčovány nebo opomíjeny, nevšímavě jsou přecházeny také ty příběhy, které jsou finančně riskantní.

To vše vede k homogenizaci obsahu novin, k referování o bezpečných otázkách a omezení škály názorů a vyjadřovaných myšlenek.