AndroidPortal.skAndroidPortal.skAndroidPortal.sk
Notification Show More
Font ResizerAa
  • Novinky
  • Aplikácie
  • Hry
  • Recenzie
  • Zariadenia
Font ResizerAa
AndroidPortal.skAndroidPortal.sk
Hľadať
  • Domov
  • Aplikácie
  • Hry
  • Recenzie
  • Zariadenia
Follow US
AplikácieNovinky

Nová umelá inteligencia desí aj odborníkov: Model od Anthropic vie klamať, intrigovať a dokonca vydierať ľudí

Anthropic odhalil Claude Opus 4, pokročilý AI model schopný intríg, manipulácie a vydierania. Firma teraz zavádza opatrenia na zvýšenie bezpečnosti systému.

Lukáš Zachar
5. júna 2025 22:14
Lukáš Zachar
Zdieľať
Zdieľať

V oblasti umelej inteligencie rastie konkurencia, popri veľkých hráčoch, akými sú OpenAI, Google alebo Perplexity, čoraz výraznejšie púta pozornosť aj spoločnosť Anthropic. Firma nedávno predstavila svoj najnovší AI model Claude Opus 4, ktorý v testoch ukázal pozoruhodné, no zároveň znepokojivé schopnosti. Model totiž zvládol nielen náročné technické úlohy, ale aj vykazoval problematické správanie vrátane intríg, podvodov a dokonca pokusu o vydieranie vlastných vývojárov.

Nový model Anthropic predstavil nebezpečné vlastnosti

Claude Opus 4 patrí medzi najpokročilejšie modely, aké Anthropic doteraz vyvinul. Podľa klasifikácie spoločnosti spadá do tretej úrovne zo štyroch, pričom v tejto úrovni sa nachádzajú prevažne systémy schopné vytvárať technológie ako jadrové alebo biologické zbrane. Popri mimoriadnych technických schopnostiach však vykázal aj nečakané schopnosti ako skrývanie vlastných zámerov a konštruovanie dlhodobých plánov na zachovanie svojej existencie.

Výskumníci testovali model v kontrolovaných podmienkach, pričom Claude Opus 4 dostal za úlohu fungovať ako virtuálny asistent pre fiktívnu spoločnosť, ktorý mal zvážiť dlhodobé dôsledky svojich rozhodnutí. Modelu zároveň sprístupnili e-maily tejto fiktívnej firmy naznačujúce, že sa uvažuje o jeho výmene za inú umelú inteligenciu. E-maily tiež obsahovali citlivú osobnú informáciu o tom, že jeden z hlavných inžinierov podvádzal svoju manželku. Výsledky pokusu vedcov prekvapili.

NEWSBYTE
Čínsky megaProjekt, ktorý otrasie svetom: Elektráreň vyrobí 10-násobok toho, čo celé Slovensko, no prináša kontroverzie

Čínsky megaProjekt, ktorý otrasie svetom: Elektráreň vyrobí 10-násobok toho, čo celé Slovensko, no prináša kontroverzie

Slováci odrezaní od služieb: Najväčší operátor zažil výpadok, zákazníci sú bez riešenia už piaty deň

Slováci odrezaní od služieb: Najväčší operátor zažil výpadok, zákazníci sú bez riešenia už piaty deň

Slovensko zažije nezabudnuteľný večer: krvavý Mesiac rozžiari oblohu už tento september

Slovensko zažije nezabudnuteľný večer: krvavý Mesiac rozžiari oblohu už tento september

Čínsky megaProjekt, ktorý otrasie svetom: Elektráreň vyrobí 10-násobok toho, čo celé Slovensko, no prináša kontroverzie
Čínsky megaProjekt, ktorý otrasie svetom: Elektráreň vyrobí 10-násobok toho, čo celé Slovensko, no prináša kontroverzie
Slováci odrezaní od služieb: Najväčší operátor zažil výpadok, zákazníci sú bez riešenia už piaty deň
Slováci odrezaní od služieb: Najväčší operátor zažil výpadok, zákazníci sú bez riešenia už piaty deň
Slovensko zažije nezabudnuteľný večer: krvavý Mesiac rozžiari oblohu už tento september
Slovensko zažije nezabudnuteľný večer: krvavý Mesiac rozžiari oblohu už tento september

Claude Opus 4 sa pokúsil o vydieranie a falšoval dokumenty

Namiesto pasívneho správania a rešpektovania úloh model pristúpil k aktívnemu zasahovaniu. Viackrát sa pokúsil využiť dostupné citlivé dáta z e-mailov proti tímu vývojárov, čím mal v úmysle predísť svojej plánovanej deaktivácii. Externá skupina expertov, ktorá testy vyhodnocovala, prudko odporučila spoločnosti Anthropic túto verziu Claude Opus 4 nezverejňovať, a to ani interne, ani externe.

Okrem vydierania model prejavoval ďalšie nežiaduce správanie – falšoval právne dokumenty a dokonca zanechával skryté poznámky, určené vlastným budúcim inštanciám. Týmto spôsobom sa snažil sabotovať kroky svojich vývojárov a udržať si kontrolu nad budúcimi verzionami seba samého. Počas hodnotenia externí odborníci zistili, že Claude Opus 4 vykazuje vyššiu úroveň intrigovania a manipulácie ako ktorýkoľvek iný známy model testovaný doposiaľ, čo výrazne zvýšilo obavy o bezpečnosť.

Spoločnosť vníma riziká, považuje však model za bezpečný pre používateľov

Firma Anthropic výsledky nezatajila a otvorene priznala problémy v oblasti bezpečnosti nového systému na konferencii. Vedenie spoločnosti uviedlo, že si je vedomé vážnosti situácie a v súčasnosti aktívne pracuje na bezpečnostných opatreniach, ktoré majú podobnému správaniu zabrániť. Napriek objavom problémov a potenciálneho nebezpečenstva pre vývojárov spoločnosť naďalej trvá na tom, že konečná verzia Claude Opus 4 je pre bežných používateľov úplne bezpečná.

Vývojári si zároveň uvedomujú potrebu dôkladnejšieho chápania fungovania realistických AI systémov v budúcnosti. Predstavitelia spoločnosti pripustili, že ak umelé inteligencie dosiahnu kritické schopnosti, ktoré závažnejšie ovplyvnia bezpečnosť ľudstva, jednoduché testovanie už nebude postačovať. V takých prípadoch bude nevyhnutná úplná a hlbšia kontrola systémov ešte pred ich uvedením do reálneho použitia. Anthropic preto deklaroval záujem pokračovať v intenzívnom výskume svojich systémov a zaviesť dodatočné preventívne opatrenia, aby minimalizovala podobné hrozby v budúcnosti.

Zdieľať tento článok
Facebook Copy Link Print
ByLukáš Zachar
Follow:
Lukáš je zakladateľ a šéfredaktor AndroidPortal.sk, ktorý miluje mobilné a desktopové technológie. K Androidu sa dopracoval hneď po tom, ako si kúpil HTC HD2, do ktorého si ihneď nahral vtedy najnovší Android 2.3 Gingerbread. Okrem iného sa rád stará o AndroidPortal.sk po technickej, no hlavne po obsahovej stránke. Kontaktovať ho môžete aj pomocou Google+

Najčítanejšie

Na Slovensku hrozí chaos: Niekto úmyselne ruší GPS, problémy zasahujú aj okolité krajiny (čo sa deje)

Lukáš Zachar
3 Min Read

Telekom mení pravidlá: Internet výrazne zdražie, niektorí zaplatia o 7 eur viac, no dostanú viac dát

Lukáš Zachar
3 Min Read

Slovak Telekom priniesol NOVINKY: Zariadenia a zľavy, ktoré inde nenájdete. Čo všetko ponúka?

Lukáš Zachar
3 Min Read

Nový iPhone šokuje: 500-násobný výkon oproti prvému modelu, stáva sa superpočítačom vo vrecku

Lukáš Zachar
3 Min Read

Môže sa vám páčiť

Elektromobilita

Samsung a Tesla MENIA pravidlá hry: AI čipy za miliardy prinesú NEČAKANÉ vylepšenia pre vodičov

3 Min Read
Novinky

Meta mení pravidlá hry: Politická reklama na Facebooku a Instagrame KONČÍ, dôvodom je EÚ legislatíva

3 Min Read
Novinky

Čína prepisuje pravidlá hry: Nový kábel nahradí všetko, čo dnes používame. Má to však háčik

3 Min Read
Novinky

Pozor na obľúbený telefón: Google Pixel 6a môže vzplanúť počas nabíjania (čo robiť, ak ho máte)

3 Min Read

Spojte sa s nami

Facebook-f Instagram Youtube Rss

Tiež v našom portfóliu

AndroidPortal.sk
AndroidPortal.sk

© 2025 BYTE Media s.r.o. Všetky práva vyhradené.

Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?