Írske dátové centrá dnes spotrebúvajú viac ako 20 percent celkovej národnej elektriny. V Severnej Virgínii, najhustejšom cloudovom uzle sveta, čakajú noví záujemcovia o pripojenie až sedem rokov. Tieto čísla nie sú dôsledkom neefektívnosti, ale priamym výsledkom toho, ako bola AI infraštruktúra budovaná posledné desaťročie, teda sústredená do čo najmenšieho počtu obrovských lokalít.
Centralizovaný model teraz naráža na fyzické limity. Podľa analýzy TechRadar sa globálny dopyt po dátových centrách do roku 2030 viac ako strojnásobí, pričom hnacou silou nebude tréning nových modelov, ale inferencia, teda každodenné používanie už natrénovaných systémov. Odhalenie podvodnej transakcie, prepočet optimálnej logistickej trasy, identifikácia chyby na výrobnej linke v reálnom čase. To všetko sú inferenčné úlohy, ktoré sa dejú nepretržite a vyžadujú odpoveď v milisekundách.
Latencia, ktorú systém neodpustí
Chirurgický asistentský systém nemôže čakať na odpoveď z dátového centra v inej krajine. Rovnako autonómny inšpekčný dron alebo priemyselný bezpečnostný systém. Server vzdialený stovky kilometrov jednoducho nestíha. Práve táto požiadavka tlačí výpočtový výkon fyzicky bližšie k miestu, kde sa rozhodnutie prijíma.
Odpoveďou je edge computing, sieť menších, modulárnych výpočtových zariadení umiestnených v blízkosti zdrojov dát. Každý uzol spracúva rozhodnutia lokálne. Ak jeden vypadne, zvyšok siete funguje ďalej. TechRadar prirovnáva túto logiku k peer-to-peer sieťam z ranej éry internetu: tak ako BitTorrent neriešil prenos súborov budovaním rýchlejších centrálnych serverov, ale distribuoval problém naprieč tisíckami uzlov, aj AI inferencia nachádza silu v distribúcii.
400 000 GPU v distribuovanej sieti
Francúzska spoločnosť Antimatter stavia sieť tisíc modulárnych mikro-dátových centier umiestnených priamo pri zdrojoch energie, s cieľom nainštalovať 400 000 GPU mimo tradičných cloudových lokalít. Ide o priamu reakciu na energetickú kapacitu, nie cenu energie, ale jej fyzickú dostupnosť, ktorá sa v Severnej Virgínii a Írsku stala reálnou bariérou rastu.
Hardvér tento posun umožňuje. Neurálne procesory navrhnuté špeciálne pre inferenčné úlohy sú dnes bežnou súčasťou smartfónov, notebookov aj priemyselných zariadení. Výpočtový výkon, ktorý pred niekoľkými rokmi vyžadoval celý serverový rack, sa dnes zmestí do vreckového zariadenia. Čím lacnejší a kompaktnejší je inferenčne schopný hardvér, tým ťažšie sa obhajuje predpoklad, že každá záťaž musí smerovať do centralizovaného cloudu.
Egress poplatky a regulačný tlak
Centralizovaná inferencia prináša aj skryté ekonomické náklady. Vždy, keď dáta opustia sieť hyperscale poskytovateľa cloudu, organizácia platí egress poplatky. Pri záťažiach vyžadujúcich nepretržitý prenos dát medzi centrálnym serverom a distribuovaným prevádzkovým prostredím sa tieto poplatky kumulujú spôsobom, ktorý nie je vždy zrejmý v momente rozhodovania. Lokálne spracovanie dát na okraji siete objem prenosov znižuje, a teda aj náklady.
Súbežne s ekonomickým tlakom rastie aj regulačný. Suverenita dát sa sprísňuje v Európskej únii, juhovýchodnej Ázii aj Latinskej Amerike. Centralizovanie inferencie do malého počtu zariadení vytvára právne riziká pre organizácie pôsobiace vo viacerých jurisdikciách. Edge infraštruktúra tento problém rieši priamo: dáta sa spracúvajú lokálne, v rámci príslušnej jurisdikcie, bez zložitých právnych obchádzok. Pre európske firmy to podľa TechRadar čoraz menej zostáva otázkou architektúrnej voľby.
Cloud zostáva, mení sa jeho rola
Tréningové záťaže, veľkoplošné spracovanie dát a mnohé podnikové aplikácie budú naďalej efektívne bežať v centralizovanom cloudovom prostredí. Edge computing nie je argumentom proti cloudu. Je argumentom za zosúladenie infraštruktúry s tým, čo záťaže skutočne vyžadujú. Inferencia a tréning sú odlišné problémy a čoraz viac firiem im začína stavať odlišnú infraštruktúru.
Antimatter nie je jediným hráčom, ktorý stavia na distribuovanom modeli. Energetická situácia v Severnej Virgínii a Írsku, kde sa koncentrovala väčšina hyperscale kapacity, robí alternatívy ekonomicky aj fyzicky nevyhnutnými skôr, ako regulátori stihnú reagovať.

