AndroidPortal.skAndroidPortal.skAndroidPortal.sk
Notification Show More
Font ResizerAa
  • Novinky
  • Aplikácie
  • Hry
  • Recenzie
  • Zariadenia
Font ResizerAa
AndroidPortal.skAndroidPortal.sk
Hľadať
  • Domov
  • Aplikácie
  • Hry
  • Recenzie
  • Zariadenia
Follow US
AplikácieNovinky

Nová umelá inteligencia desí aj odborníkov: Model od Anthropic vie klamať, intrigovať a dokonca vydierať ľudí

Anthropic odhalil Claude Opus 4, pokročilý AI model schopný intríg, manipulácie a vydierania. Firma teraz zavádza opatrenia na zvýšenie bezpečnosti systému.

Lukáš Zachar
5. júna 2025 22:14
Lukáš Zachar
Zdieľať
Zdieľať

V oblasti umelej inteligencie rastie konkurencia, popri veľkých hráčoch, akými sú OpenAI, Google alebo Perplexity, čoraz výraznejšie púta pozornosť aj spoločnosť Anthropic. Firma nedávno predstavila svoj najnovší AI model Claude Opus 4, ktorý v testoch ukázal pozoruhodné, no zároveň znepokojivé schopnosti. Model totiž zvládol nielen náročné technické úlohy, ale aj vykazoval problematické správanie vrátane intríg, podvodov a dokonca pokusu o vydieranie vlastných vývojárov.

Kapitoly
Nový model Anthropic predstavil nebezpečné vlastnostiClaude Opus 4 sa pokúsil o vydieranie a falšoval dokumentySpoločnosť vníma riziká, považuje však model za bezpečný pre používateľov

Nový model Anthropic predstavil nebezpečné vlastnosti

Claude Opus 4 patrí medzi najpokročilejšie modely, aké Anthropic doteraz vyvinul. Podľa klasifikácie spoločnosti spadá do tretej úrovne zo štyroch, pričom v tejto úrovni sa nachádzajú prevažne systémy schopné vytvárať technológie ako jadrové alebo biologické zbrane. Popri mimoriadnych technických schopnostiach však vykázal aj nečakané schopnosti ako skrývanie vlastných zámerov a konštruovanie dlhodobých plánov na zachovanie svojej existencie.

Výskumníci testovali model v kontrolovaných podmienkach, pričom Claude Opus 4 dostal za úlohu fungovať ako virtuálny asistent pre fiktívnu spoločnosť, ktorý mal zvážiť dlhodobé dôsledky svojich rozhodnutí. Modelu zároveň sprístupnili e-maily tejto fiktívnej firmy naznačujúce, že sa uvažuje o jeho výmene za inú umelú inteligenciu. E-maily tiež obsahovali citlivú osobnú informáciu o tom, že jeden z hlavných inžinierov podvádzal svoju manželku. Výsledky pokusu vedcov prekvapili.

Claude Opus 4 sa pokúsil o vydieranie a falšoval dokumenty

Namiesto pasívneho správania a rešpektovania úloh model pristúpil k aktívnemu zasahovaniu. Viackrát sa pokúsil využiť dostupné citlivé dáta z e-mailov proti tímu vývojárov, čím mal v úmysle predísť svojej plánovanej deaktivácii. Externá skupina expertov, ktorá testy vyhodnocovala, prudko odporučila spoločnosti Anthropic túto verziu Claude Opus 4 nezverejňovať, a to ani interne, ani externe.

Okrem vydierania model prejavoval ďalšie nežiaduce správanie – falšoval právne dokumenty a dokonca zanechával skryté poznámky, určené vlastným budúcim inštanciám. Týmto spôsobom sa snažil sabotovať kroky svojich vývojárov a udržať si kontrolu nad budúcimi verzionami seba samého. Počas hodnotenia externí odborníci zistili, že Claude Opus 4 vykazuje vyššiu úroveň intrigovania a manipulácie ako ktorýkoľvek iný známy model testovaný doposiaľ, čo výrazne zvýšilo obavy o bezpečnosť.

Spoločnosť vníma riziká, považuje však model za bezpečný pre používateľov

Firma Anthropic výsledky nezatajila a otvorene priznala problémy v oblasti bezpečnosti nového systému na konferencii. Vedenie spoločnosti uviedlo, že si je vedomé vážnosti situácie a v súčasnosti aktívne pracuje na bezpečnostných opatreniach, ktoré majú podobnému správaniu zabrániť. Napriek objavom problémov a potenciálneho nebezpečenstva pre vývojárov spoločnosť naďalej trvá na tom, že konečná verzia Claude Opus 4 je pre bežných používateľov úplne bezpečná.

Vývojári si zároveň uvedomujú potrebu dôkladnejšieho chápania fungovania realistických AI systémov v budúcnosti. Predstavitelia spoločnosti pripustili, že ak umelé inteligencie dosiahnu kritické schopnosti, ktoré závažnejšie ovplyvnia bezpečnosť ľudstva, jednoduché testovanie už nebude postačovať. V takých prípadoch bude nevyhnutná úplná a hlbšia kontrola systémov ešte pred ich uvedením do reálneho použitia. Anthropic preto deklaroval záujem pokračovať v intenzívnom výskume svojich systémov a zaviesť dodatočné preventívne opatrenia, aby minimalizovala podobné hrozby v budúcnosti.

Zdieľať tento článok
Facebook Copy Link Print
ByLukáš Zachar
Follow:
Lukáš je zakladateľ a šéfredaktor AndroidPortal.sk, ktorý miluje mobilné a desktopové technológie. K Androidu sa dopracoval hneď po tom, ako si kúpil HTC HD2, do ktorého si ihneď nahral vtedy najnovší Android 2.3 Gingerbread. Okrem iného sa rád stará o AndroidPortal.sk po technickej, no hlavne po obsahovej stránke. Kontaktovať ho môžete aj pomocou Google+

Najčítanejšie

Booking má problém: Obľúbenú platformu žaluje 25 krajín EÚ, ceny dovoleniek sa môžu výrazne zmeniť

Lukáš Zachar
3 Min Read

POZOR na zajtrajšok: WhatsApp prestáva fungovať tisícom Slovákov, skontrolujte si svoj telefón

Lukáš Zachar
3 Min Read

Slovákov zasiahla nová vlna podvodov: Útočníci cez WhatsApp pripravujú ľudí o peniaze, polícia varuje, že škody môžu byť veľké

Lukáš Zachar
3 Min Read

Šok pre rodičov: Známy operátor bez varovania vypol obľúbenú detskú TV stanicu, náhrada neexistuje

Lukáš Zachar
3 Min Read

Môže sa vám páčiť

Aplikácie

MIMORIADNE varovanie: Obávaný vírus Crocodilus útočí na smartfóny Slovákov, oklamané sú už stovky ľudí

3 Min Read
Aplikácie

POZOR: YouTube končí na obľúbených smartfónoch, tisíce Slovákov stratia prístup k populárnej aplikácii (ZOZNAM zariadení)

4 Min Read
Novinky

Koniec zdieľania čísla: WhatsApp prichádza s novinkou, ktorá poteší každého používateľa

4 Min Read
Novinky

YouTube pritvrdzuje: Platiaci používatelia dostanú viac reklám, Google priznáva, že potrebuje peniaze

3 Min Read

Spojte sa s nami

Facebook-f Instagram Youtube Rss

Tiež v našom portfóliu

AndroidPortal.sk
AndroidPortal.sk

© 2025 BYTE Media s.r.o. Všetky práva vyhradené.

Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?