Pilne
Sprawdź relację:
Dzieje się!
Newsy Technologia

ChatGPT 5 już jest. Więcej myśli i mniej kłamie

W nocy z czwartku na piątek polskiego czasu OpenAI opublikowało ChatGPT 5. Kolejna generacja jednego z najbardziej popularnych modeli generatywnej sztucznej inteligencji jest, zgodnie z deklaracją amerykańskiej firmy, najbardziej zaawansowanym modelem w historii.

Sam Altman, szef OpenAI, ogłosił uruchomienie ChatGPT w wersji 5. "To najlepszy model w historii".
Sam Altman, szef OpenAI, ogłosił uruchomienie ChatGPT w wersji 5. "To najlepszy model w historii". Fot.: Kevin Dietsch / Getty Images.

Z tego artykułu dowiesz się…

  1. Jak OpenAI chce sprawić, by czat sam wybierał pomiędzy błyskawiczną odpowiedzią a „dłuższym myśleniem”, i co to oznacza w codziennym użyciu narzędzia.
  2. Dlaczego GPT 5 ma mylić się rzadziej w trudnych rozmowach medycznych i jak wypada w nowych testach matematycznych oraz akademickich na tle wcześniejszych modeli.
  3. Co dokładnie zmienia się dla użytkowników bez subskrypcji i dla subskrybentów, oraz gdzie w ekosystemie Microsoftu pojawi się nowy model.

- GPT 5 to najinteligentniejszy model, jaki kiedykolwiek stworzyliśmy, ale najważniejszym elementem, na którym nam zależało, była praktyczna użyteczność i powszechna dostępność oraz przystępność cenowa. Możemy udostępnić o wiele, wiele inteligentniejsze modele i tak zrobimy, ale na obecnej wersji skorzysta ponad miliard ludzi - zadeklarował w serwisie X Sam Altman, szef OpenAI.

OpenAI opublikowało model, który ma być najbardziej zaawansowanym nie tylko w historii firmy, ale i świata generatywnej sztucznej inteligencji. ChatGPT 5 ma więcej myśleć i mniej kłamać. Firma opublikowała na to dowody.

ChatGPT 5. Czym różni się od poprzedników

ChatGPT 5 to nowa generacja systemu, która ma być „najlepszym dotąd” modelem firmy, z wyraźnymi skokami w inteligencji, szybkości i niezawodności. Jak deklaruje OpenAI, to nie „większy model”, ale zunifikowany system, którego celem jest poprawa problemów w użytkowaniu poprzednich wersji. Przykładowo, nowy model sam decyduje o tym, kiedy ma odpowiedzieć błyskawicznie, a kiedy „dłużej myśleć”. W praktyce użytkownik ma szybciej otrzymywać poprawne odpowiedzi.

Co ciekawe, system ten ma uczyć się na podstawie bieżącego korzystania przez użytkowników. Jest także „inteligentny” i będzie sam analizował poziom zadowolenia użytkowników. Samo OpenAI przedstawia sposób na to, by wymusić automatyczne uruchomienie trybu głębokiego myślenia. Wystarczy napisać „think hard about this” („pomyśl nad tym mocniej”).

Druga zmiana, która ma być szczególnie dostrzegalna przez użytkowników, to mocne ograniczenie halucynacji - czyli błędnych odpowiedzi.

- Poczyniliśmy spore postępy w celu redukcji halucynacji, trzymania się instrukcji użytkowników i ograniczenia pochlebstw, jednocześnie podnosząc jakość modelu w trzech głównych obszarach, w których jest wykorzystywany: pisania, kodowania i tematów zdrowotnych - napisało OpenAI.

ChatGPT 5 w praktyce

OpenAI zaprezentowało możliwości nowego modelu, pokazując przykład kodu gry wygenerowanego przy użyciu jednego prostego promptu. Poprawiono także decyzyjność modelu w zakresie designu aplikacji czy stron. Ma lepiej rozumieć znaczenie odstępów, odpowiedniej typografii czy pustych przestrzeni. Nowy model ma także pisać o wiele płynniej niż poprzednie.

Trzeci obszar to kwestie zdrowotne. OpenAI zauważa, że wielu użytkowników korzysta z czatu w formie doradztwa w zakresie zdrowia czy ogólnego dobrostanu. Nowa wersja czatu ma być znacznie bardziej precyzyjna w tych tematach w porównaniu do poprzednich. Ma także udzielać pewnych odpowiedzi. Jednocześnie firma podkreśla, że celem nie jest zastąpienie pracy lekarzy. Nowy czat ma być partnerem do zrozumienia potrzeb konkretnego człowieka.

OpenAI zaprezentowało także wyniki nowego modelu w benchmarkach. Miał on pobić rekordy w praktycznie wszystkich narzędziach.

Przykładowo, test AIME 2025 (matematyczny) zdaje w 100 proc. Dla porównania, model o3 robił to w 98,4 proc. przypadków, a 4o tylko w 42 proc. Zdaje także w 100 proc. test Harvard–MIT. Odpowiedzi na poziomie doktoratu nauk ścisłych udziela ze skutecznością 89,4 proc. Poprzednia wersja osiągała w tym zakresie 83,3 proc. skuteczności.

OpenAI zaprezentowało także wyniki benchmarków dla programowania. Tu również GPT 5 osiąga rekordowe wyniki.

Mniej kłamstw w AI

Prawdopodobnie największą zmianą z perspektywy zwykłego użytkownika ma być ograniczenie liczby halucynacji, czyli błędnych odpowiedzi. OpenAI opublikowało wyniki benchmarku HealthBench, w którym mierzy błędy w przypadku „wymagających rozmów medycznych”. Wersje o3 i 4o popełniały błędy odpowiednio w 13 i 16 proc. odpowiedzi. Nowy model robi to tylko w 1,6 proc. odpowiedzi przy użyciu głębokiego myślenia i w 3,6 proc. przy szybkich odpowiedziach.

Nowy model ma także dawać fałszywe odpowiedzi w 45 proc. mniejszej liczbie przypadków niż poprzednie modele przy „szybkich odpowiedziach”. W przypadku głębszego myślenia prawdopodobieństwo jest mniejsze o 80 proc.

GPT 5 jest także mniej wymagający pod względem efektywności myślenia. Oznacza to, że przygotowanie odpowiedzi na wyższym poziomie od poprzedników „kosztuje mniej” tokenów.

Koniec z pochlebstwami

GPT 5 jest także bardziej szczery w kontaktach z użytkownikami, szczególnie w obszarze zadań, które są niemożliwe do zrealizowania, albo w przypadku zbyt ogólnych poleceń. OpenAI potwierdziło to, stosując test, w którym „wymusiło” kłamstwo, usuwając zdjęcia, na podstawie których modele miały odpowiadać na pytania. GPT o3 dawał mimo to „pewne” odpowiedzi w 87 proc. przypadków. Model 5 robi to w 9 proc. przypadków.

Model ma także w szczery sposób informować użytkownika, dlaczego nie zrealizuje odpowiedzi. Dotyczy to szczególnie mocno szkodliwych poleceń czy zapytań.

Na koniec dobra wiadomość dla użytkowników LinkedIna. ChatGPT ma używać mniejszej liczby emotikon oraz być bardziej subtelny w komunikacji niż poprzednie.

- Użytkownicy będą bardziej czuli, że rozmawiają z pomocnym przyjacielem, posiadającym inteligencję na poziomie doktoratu, niż z AI - napisało OpenAI.

ChatGPT 5 dostępne dla wszystkich

Model jest dostępny od 8 sierpnia dla wszystkich użytkowników - także tych, którzy nie mają wykupionej subskrypcji. Jednocześnie jest modelem standardowym, zastępując wersje 4o i o3. Subskrybenci mają do dyspozycji większą liczbę zapytań i dostęp do trybu „głębokiego myślenia”.

Nowy model trafi także do ekosystemu Microsoftu. Jak poinformowała firma, dostęp do nowego modelu będzie możliwy np. w usłudze Copilot. Dostęp do GPT 5 będzie dostępny także dla programistów z poziomu GitHub Copilot czy Visual Studio Code.

Jak rozwija się ChatGPT

ChatGPT zadebiutował publicznie w wersji 3 w listopadzie 2022 r. Wcześniej naukowcy z OpenAI pracowali nad jego poprzednikami. Chatbot szybko zdobył popularność wśród milionów użytkowników. W marcu 2023 r. OpenAI opublikowało wersję 4. Był to duży skok jakościowy, umożliwiono np. obsługę obrazów czy poprawiono jakość odpowiedzi. W 2023 r. powstał także cały ekosystem wsparcia (API) dla ChatGPT. Kilka miesięcy później, w listopadzie, OpenAI uruchomiło customowe wtyczki.

W maju 2024 r. OpenAI uruchomiło wersję 4o, która była znacznie szybsza i tańsza od poprzednika. W kolejnych miesiącach publikowano inne wersje, obsługujące większy kontekst czy lepiej rozumiejące dłuższe polecenia użytkowników.

OpenAI podkreśla, że GPT 5 nie jest AGI („ogólna sztuczna inteligencja” - czyli AI, które potrafi samo się uczyć i rozwiązywać problemy w podobny sposób, jak człowiek) i wciąż nie uczy się z nowych interakcji. Mimo tysięcy godzin testów bezpieczeństwa model nadal może się mylić, a przejrzystość dotycząca danych treningowych pozostaje ograniczona.

Główne wnioski

  1. OpenAI ogłosiło ChatGPT 5 jako najbardziej zaawansowany model w swojej historii i postawiło na praktyczną użyteczność. System jest zunifikowany i ma sam decydować, kiedy odpowiadać błyskawicznie, a kiedy poświęcić więcej czasu na „głębokie myślenie”. Firma podkreśla, że nowy model lepiej trzyma się instrukcji użytkownika, ogranicza pochlebstwa i ma pisać płynniej. Wprowadza też prosty przełącznik trybu przez komendę „think hard about this”.
  2. Największy nacisk położono na redukcję halucynacji i poprawę jakości w trzech obszarach. Chodzi o pisanie, programowanie oraz tematy zdrowotne. W testach wewnętrznych i benchmarkach GPT 5 osiąga wyniki deklarowane jako rekordowe. Model zdaje AIME 2025 w 100 procentach i test Harvard–MIT również w 100 procentach. W odpowiedziach na poziomie doktoratu nauk ścisłych osiąga 89,4 procent. OpenAI raportuje spadek błędów w wymagających rozmowach medycznych do 1,6 procent przy głębokim myśleniu oraz 3,6 procent przy szybkich odpowiedziach.
  3. Model ma też rzadziej wytwarzać fałszywe, pewne siebie odpowiedzi. W trybie szybkich odpowiedzi spadek wynosi 45 procent względem poprzedników. W trybie głębokiego myślenia prawdopodobieństwo ma być mniejsze o 80 procent. GPT 5 ma oszczędniej gospodarować „myśleniem”, co przekłada się na niższy koszt tokenów. Jednocześnie OpenAI zastrzega, że to nie jest AGI. System nadal nie uczy się z bieżących interakcji i może się mylić. Firma nie zwiększyła też przejrzystości w zakresie danych treningowych.