Kam běží AI zajíc aneb porce novinek pro lepší orientaci ve světě umělé inteligence
Gartner odhaduje, že do roku 2030 klesnou náklady na inference (odpovědi) u 1T (velkých) modelů pro poskytovatele o více než 90 %. Anthropic uvedl Claude Opus 4.7, svůj dosud nejschopnější veřejně dostupný model. MIT Sloan upozorňuje, že open source modely při vydání dosahují zhruba 90 % výkonu closed modelů a rozdíl typicky mažou již během 13 týdnů, což nahrává růstu privátního a hybridního AI cloudu. OpenAI pozastavilo svůj hlavní britský datacentrový projekt kvůli regulaci a vysokým cenám energie, zatímco v USA Muskova xAI uvedla do provozu datacentrum Colossus 2 se 100 tisíci GPU, které postavila za 6 měsíců.
1. AI výkon bude rychle zlevňovat
Gartner ve své nové studii odhadl, že do roku 2030 klesnou náklady na inference u modelu s jedním bilionem parametrů pro poskytovatele o více než 90 % oproti roku 2025. Pro uživatele AI je to skvělá zpráva. Pro infrastrukturní projekty je to ale zásadní varování: pokud se jednotková cena AI výkonu rychle propadá, pak budoucí ekonomika podobných projektů stojí mnohem méně na „vzácnosti výpočetního výkonu“ a mnohem víc na ceně elektřiny, využití kapacity, provozní efektivitě a navázaných službách.
2. Anthropic zvedá laťku modelem Claude Opus 4.7
Anthropic 16. dubna uvedl Claude Opus 4.7 a sám jej popisuje jako významné zlepšení oproti Opus 4.6 hlavně v pokročilém software engineeringu, delších agentních úlohách a práci s obrazem. V některých hodnoceních se objevují dvouciferné posuny ve vybraných workflow: například Cursor uvádí posun z 58 % na 70 %, CursorBench a některé další firmy popisují zlepšení task success zhruba o 10 až 15 %. Bez ohledu na to, kdo je dnes „absolutně nejlepší“, je zřejmé, že US komerční frontier modely pokračují v rychlém tempu iterací a zatím ovládají většinu trhu.
Zdroj: https://www.anthropic.com/news/claude-opus-4-7
3. Open modely se přibližují closed modelům rychleji než dřív
Pokračuje trend, který popsala již lednová studie MIT Sloan. Podle výzkumu mají open modely při vydání v průměru asi 89,6 % výkonu closed modelů, ale výkonový rozdíl typicky dorovnávají během 13 týdnů; ještě před rokem to bylo 27 týdnů. Současně otevřené modely stojí v inferenci výrazně méně a přesun části poptávky z closed do open modelů by podle studie mohl globálně ušetřit zhruba 25 miliard dolarů ročně. To neznamená konec closed modelů. Znamená to ale, že se AI trh rychleji komoditizuje a že pro mnoho firem bude stále racionálnější kombinace open modelů, vlastních dat a levnějšího provozu.
Na druhou stranu studie na datech z OpenRouteru i International AI Safety Report ale zároveň ukazují, proč closed modely dál dominují: nejen kvůli pohodlí a ekosystému, ale také kvůli bezpečnosti, monitoringu, governance a nižší toleranci enterprise trhu k riziku.
Zdroj:
4. Na to reaguje růst privátního a hybridního AI cloudu
Open modely lze provozovat na vlastní infrastruktuře a data tak vůbec nemusí opouštět firemní servery. Přesně na tom dnes staví velcí dodavatelé. IBM u watsonx zdůrazňuje možnost vybrat open-source model nebo vlastní model a provozovat jej napříč cloudy. VMware Private AI zase otevřeně cílí na firmy, které chtějí řešit privacy, choice, cost, performance a compliance v rámci vlastního datacentra nebo privátního cloudu. To je dnes velmi silný trend: ne vše běží do veřejného cloudu a už vůbec ne vše musí běžet do jedné vzdálené centrální AI infrastruktury.
5. Google dál snižuje závislost na Nvidii
Další důležitá novinka je čipová. Google pokračuje v dlouhodobé strategii vlastních TPU. Začátkem dubna podepsal Broadcom s Googlem dlouhodobou dohodu o vývoji a dodávkách budoucích generací vlastních AI čipů až do roku 2031, přičemž tyto TPU mají být nákladově efektivnější alternativou k drahým GPU od Nvidie. Google už dříve oznámil šestou generaci TPU Trillium a uvádí, že proti předchozí generaci přináší zhruba 4× vyšší výkon a 67% zlepšení energetické efektivity. Pro trh je to důležitý signál: největší hráči nečekají jen na další generaci obecných GPU, ale stále více si staví vlastní specializovanou architekturu. To se netýká EU, které nemá technologie ani chipy a je tak závislá na zámořských dodavatelích.
Zdroj:
6. Evropa naráží na elektřinu, síť a regulaci. USA staví
V infrastruktuře se mezitím dál rozevírají nůžky mezi USA a Evropou. OpenAI minulý týden pozastavilo svůj hlavní britský datacentrový projekt kvůli nepříznivému regulatornímu prostředí a vysokým cenám energie. Amazon už v únoru Reuters řekl, že v Evropě může připojení do přenosové sítě trvat až sedm let, zatímco samotná výstavba datacentra obvykle zabere kolem dvou let. Na opačné straně Atlantiku xAI postavilo datacentrum Colossus 2 za 180 dní a do května ho dále rozšíří na 2GW, což je ekvivalent spotřeby 1.5 milionu domácností. Rozdíl mezi americkou a evropskou realitou dnes není jen v kapitálu, ale i v energii, připojení a rychlosti povolování.
7. Co z toho plyne pro firmy v EU
1. AI výkon bude dál zlevňovat, takže je méně rozumné stavět strategii na samotné vzácnosti výpočetního výkonu a důležitější je řešit konkrétní use-cases.
2. Schopnosti špičkových modelů stále rostou, ale roste i tlak na to, aby firmy velmi pečlivě vybíraly mezi closed, open a hybridní variantou.
3. Private AI cloud přestává být okrajová varianta a stává se hlavním směrem pro firmy s citlivými daty, compliance a požadavkem na kontrolu.
4. Evropská infrastrukturní ambice bude bez levnější energie, lepší sítě a rychlejšího povolování narážet na tvrdé limity.
Pozvánka
Pokud vás tyto posuny zajímají a chcete se dozvědět více o aplikacích AI v průmyslu, médiích i státní správě, přijďte na květnové AI odpoledne s odborníky z Cognito (odborný partner Roku AI 2026), které proběhne ve čtvrtek 14. května. Místo konání, program a registraci spustíme příští týden.
