OpenAI wprowadza GPT - 5 – ma działać jak agent, a nie tylko chatbot

OpenAI zaprezentowało GPT-5, swój nowy flagowy model sztucznej inteligencji, który od teraz będzie domyślnie napędzał ChatGPT dla wszystkich użytkowników, także tych darmowych.

Od chatbota do agenta

Model ten łączy zaawansowane zdolności rozumowania z szybkością reakcji. Firma chce stworzyć agentów AI, nie tylko chatbota, który będzie odpowiadał na pytania.

GPT-5 został zaprojektowany do wykonywania konkretnych zadań w imieniu użytkownika. Może on na przykład generować aplikacje, analizować kalendarz czy tworzyć raporty badawcze. Aby uprościć obsługę, OpenAI zrezygnowało z konieczności wybierania ustawień przez użytkowników. GPT-5 wykorzystuje działający w czasie rzeczywistym router, który sam decyduje, czy udzielić szybkiej odpowiedzi, czy poświęcić więcej czasu na „przemyślenie” bardziej złożonego zapytania.

Dyrektor generalny OpenAI, Sam Altman, określił GPT-5 jako „najlepszy model na świecie” i „znaczący krok” w kierunku rozwoju ogólnej sztucznej inteligencji (AGI), która mogłaby przewyższyć ludzi w zadaniach o dużej wartości ekonomicznej.

Mniej halucynacji?

Firma twierdzi, że nowy model wykazuje znaczną poprawę w kwestii generowania fałyszywych informacji (tzw. halucynacje). Wewnętrzne testy wykazały, że GPT-5 (z funkcją myślenia) myli się w 4,8% przypadków, co jest ogromnym postępem w porównaniu do 22% dla modelu o3 i 20,6% dla GPT-4o.

Wraz z nowym modelem, ChatGPT zyskał cztery nowe „osobowości” do wyboru: cynik, robot, słuchacz i nerd, które modyfikują styl odpowiedzi. Użytkownicy darmowej wersji mają dostęp do GPT-5 z limitami. Subskrybenci planu Plus ($20 miesięcznie) otrzymują wyższe limity, a subskrybenci Pro ($200 miesięcznie) nieograniczony dostęp do GPT-5 oraz jego potężniejszej wersji, GPT-5 Pro.

Wydajność w testach porównawczych

Mimo wysokich oczekiwań, GPT-5 wykazuje niewielką, ale nie wszechstronną przewagę nad konkurencją. W teście kodowania SWE-bench Verified model uzyskał 74,9%, nieznacznie wyprzedzając Claude Opus 4.1 firmy Anthropic (74,5%) i znacznie Gemini 2.5 Pro od Google (59,6%). W dziedzinie pytań naukowych na poziomie doktoranckim (GPQA Diamond) GPT-5 Pro z wynikiem 89,4% pokonał zarówno Claude Opus 4.1 (80,9%), jak i Grok 4 Heavy (88,9%).

Jednak w teście Humanity’s Last Exam, mierzącym wydajność w matematyce i naukach humanistycznych, GPT-5 Pro (42%) ustąpił modelowi Grok 4 Heavy od xAI (44,4%). Mieszane wyniki odnotowano również w teście Tau-bench, symulującym nawigację po stronach internetowych, gdzie w niektórych zadaniach model okazał się słabszy od swojego poprzednika (o3) lub konkurencji (Claude Opus 4.1).

Cena

Dla programistów model będzie dostępny przez API w trzech wariantach: gpt-5, gpt-5-mini i gpt-5-nano, z kosztem ustalonego na 1,25 USD za milion tokenów wejściowych i 10 USD za milion tokenów wyjściowych. Wprowadzenie GPT-5 na rynek jest postrzegane jako kluczowy wskaźnik postępu w dziedzinie AI, a jego realne możliwości zostaną zweryfikowane dopiero w praktycznym zastosowaniu przez miliony użytkowników i deweloperów.

OpenAI wprowadza GPT-5 – ma działać jak agent, a nie tylko chatbot

Od chatbota do agenta

Mniej halucynacji?

Wydajność w testach porównawczych

Cena

Czytaj także:

Mam Startup

Nie przegap

OpenAI wprowadza GPT-5 – ma działać jak agent, a nie tylko chatbot

Od chatbota do agenta

Mniej halucynacji?

Wydajność w testach porównawczych

Cena

Czytaj także:

Mam Startup

Nie przegap

Sukcesy, inwestycje, pivoty i porażki. Polski rynek startupów w jednym e-mailu