Analitycy i menedżerowie mówią wprost: era bezrefleksyjnego płacenia za najdroższe opcje abonamentowe i nielimitowane tokeny dobiega końca. Nadchodzi czas pragmatyzmu, w którym głównym kryterium wyboru staje się efektywność kosztowa.
Model rozliczeń oparty na zużyciu uderza w budżety
Zgodnie z najnowszym raportem Reutersa, dynamiczne przejście dostawców AI z tradycyjnych, stałych modeli subskrypcyjnych (SaaS) na rozliczenia oparte na faktycznym zużyciu (usage-based pricing) drastycznie skomplikowało planowanie budżetów w firmach. Choć ceny jednostkowe za milion tokenów (fragmentów tekstu przetwarzanych przez algorytmy) na rynku sukcesywnie spadają, to całkowite koszty operacyjne przedsiębiorstw szybują w górę.
Powód jest prosty: skala wdrożeń rośnie wykładniczo. Kiedy algorytmy zostają zintegrowane z codzienną pracą tysięcy pracowników, automatyczną obsługą klienta czy systemami analitycznymi, liczba generowanych zapytań staje się nieprzewidywalna. Przykładowo, eksperci wskazują, że w wielu organizacjach koszty utrzymania systemów sztucznej inteligencji wspomagających programowanie (AI coding) zaczynają przewyższać średnie wynagrodzenie programisty, co stawia pod znakiem zapytania pierwotny sens ekonomiczny takiej automatyzacji.
Chińska ofensywa cenowa i zwrot ku open-source
W obliczu tak dużych obciążeń finansowych, oczy biznesu zwróciły się w stronę alternatywnych rozwiązań. Jak wynika z notatki analitycznej banku Citi przytaczanej przez Reutersa, na rynku widoczny jest gigantyczny zwrot w kierunku modeli o otwartym kodzie źródłowym (open-source) oraz znacznie tańszych alternatyw z Chin.
Świetnym papierkiem lakmusowym tych zmian jest platforma OpenRouter, agregująca ruch do różnych modeli sztucznej inteligencji. Dane Citi pokazują, że udział modeli open-source w tokenach przetwarzanych przez OpenRouter wystrzelił z 34% w styczniu do aż 65% w czerwcu 2026 roku. Co niezwykle ciekawe, cztery najpopularniejsze modele na tej platformie to obecnie produkty chińskie, z czego na pozycji lidera umocnił się DeepSeek. Powodem tej migracji jest astronomiczna przepaść cenowa przy jednoczesnym zacieraniu się różnic w jakości algorytmów:
-
Koszt topowych modeli z USA: średnio około 4,00 USD za milion tokenów.
-
Koszt konkurencyjnych modeli z Chin: zaledwie 0,18 USD za milion tokenów.
Mówimy tu o usłudze niemal o 95% tańszej. Jak zauważa Jamil Byun (ekspert rynku AI), dystans technologiczny dzielący darmowe lub tanie modele o otwartym kodzie od zamkniętych, najdroższych systemów komercyjnych skurczył się z ponad roku do zaledwie około czterech miesięcy. Dla większości standardowych zadań biznesowych – takich jak porządkowanie baz danych, pisanie prostych raportów czy obsługa infolinii – ta czteromiesięczna różnica w zaawansowaniu nie ma żadnego znaczenia praktycznego. Za to różnica w cenie ma znaczenie kolosalne.
Co zrobi Dolina Krzemowa?
Taki układ sił stawia pod ogromną presją dotychczasowych hegemonów, takich jak OpenAI czy Anthropic. Firmy te, przygotowując się do wejścia na giełdę (IPO), muszą zbalansować potrzebę generowania zysków z koniecznością utrzymania udziałów w rynku.
Głosy płynące z branży – w tym od liderów technologicznych takich jak Nikesh Arora (CEO Palo Alto Networks) – jednoznacznie sugerują, że twórcy oprogramowania korporacyjnego muszą radykalnie przemyśleć swoje strategie cenowe. Jeśli chcą, by ich systemy były szeroko adoptowane przez biznes, ceny tokenów premium muszą drastycznie spaść, wyprzedzając nawet naturalny spadek kosztów infrastruktury.
Nowa era technologicznego pragmatyzmu
Pierwsza faza fascynacji generatywną sztuczną inteligencją opierała się na podejściu „chcemy tego, co najlepsze i najbardziej zaawansowane”. Druga faza, w której właśnie się znajdujemy, to twarda szkoła ekonomii. Dyrektorzy finansowi (CFO) i dyrektorzy ds. technologii (CTO) nauczyli się liczyć koszty. Biznes odchodzi od drogich, sztywnych abonamentów na rzecz elastycznego żonglowania modelami. Zamiast zaprzęgać gigantyczny, kosztowny model do wysłania prostego maila, firmy wolą precyzyjnie dobierać mniejsze, wyspecjalizowane i wielokrotnie tańsze narzędzia open-source. Wygrają ci dostawcy technologii, którzy zrozumieją, że w 2026 roku dla klienta biznesowego optymalizacja kosztów jest równie seksowna, co liczba parametrów w modelu LLM.
Do tego dochodzi jeszcze pytanie o korzystanie z tzw. suwerennych modeli LLM: skoro jesteśmy Polakami, to czy nie powinniśmy wykorzystywać właśnie Bielika jako podstawowego narzędzia? A może i tym razem wygra pragmatyzm i chłodna kalkulacja? Doszłoby wtedy do takiej samej sytuacji, jaką obserwujemy w tak wielu dziedzinach życia, czyli prymatu tanich, chińskich rozwiązań nad tym, co droższe.