ChatGPT-4o: co się podoba, co zaskakuje, czego brakuje? Poznaj opinie ekspertów

Dodane:

Przemysław Zieliński Przemysław Zieliński

ChatGPT-4o: co się podoba, co zaskakuje, czego brakuje? Poznaj opinie ekspertów

Udostępnij:

Zapytaliśmy znawców sztucznej inteligencji o ich opinię dotyczącą nowego modelu od OpenAI. Dowiedz się, co w Omni spodobało się im najbardziej, a czego jeszcze im brakuje.

Małgorzata Pietraszewska, CEO w 10Clouds

Twoje największe zaskoczenie przy korzystaniu z ChatGPT-4o to…?

Najbardziej zaskakującym aspektem korzystania z ChatGPT-4o jest jego zdolność omni-modalna, pozwalająca na płynne rozumienie i przetwarzanie tekstów, mowy oraz wideo, a także znacząco szybsza prędkość działania. Nie tylko otwiera to nowe możliwości zastosowań, ale także poprawia ogólną interakcję z modelem. Udoskonalono umiejętność prowadzenia naturalnie brzmiących konwersacji i zapamiętywania poprzednich interakcji w ramach sesji. Dzięki temu konwersacje z Chatem są teraz  bardziej intuicyjne i “ludzkie”.

Co według Ciebie zmieni Ciebie nowa wersja ChataGPT?

Wersja ChatGPT-4 Omni stanowi znaczący skok w dziedzinie sztucznej inteligencji, wprowadzając możliwości omni-modalne, które pozwalają na bezproblemową integrację przetwarzania dźwięku, obrazu i tekstu w czasie rzeczywistym. Ta innowacja nie tylko poprawia interakcje z użytkownikami, sprawiając, że konwersacje brzmią bardziej ludzko, ale także rozszerza bazę wiedzy AI o aktualizacje w czasie rzeczywistym, co pozwala na dokładniejsze odpowiedzi. Te funkcje ustanawiają nowy standard dla aplikacji AI w różnych sektorach, w tym obsługi klienta i edukacji, pokazując potencjał ChatGPT-4 Omni jako wszechstronnego narzędzia.

Chociaż te postępy są obiecujące, branża zauważa, że tempo przełomowych rozwojów może zwalniać, co wskazuje na rosnącą złożoność osiągnięć w dziedzinie AI. Kolejna faza ewolucji AI wymaga ustalania realistycznych oczekiwań i utrzymywania dialogu między innowatorami AI a społecznością biznesową. Takie podejście pozwoli skutecznie nawigować przyszłością technologii. W 10Clouds jesteśmy świadomi tych dynamik i pozostajemy zaangażowani w dostosowywanie naszych strategii, aby sprostać ewoluującemu krajobrazowi AI, zapewniając, że nadal oferujemy innowacyjne rozwiązania, które odpowiadają na potrzeby naszych klientów.

Czy jest coś, czego w Twojej opinii brakuje w Omni?

W najnowszej wersji ChatGPT-4o, choć funkcje głosowe są dostępne od kilku miesięcy, ostatnie prezentacje ujawniły nowości w postaci ciągłej (dynamicznej) i przerywanej komunikacji głosowej. Ważne jest, aby rozróżnić te nowe możliwości od wcześniej dostępnej wersji opartej na kolejnych turach dialogu. Obecność starszej wersji funkcji głosowej nie oznacza automatycznie dostępu do nowo zaprezentowanych ulepszeń. Niestety, najnowsza aktualizacja całkowicie usunęła funkcję głosową, pozostawiając jedynie możliwość transkrypcji.

Można przypuszczać, że jest to krok przygotowawczy do dodania nowej, dynamicznej wersji w przyszłej aktualizacji. Co więcej, chociaż funkcja czatu głosowego powróciła, jest szybsza niż wcześniej, ale nadal nie pozwala na przerywanie przez użytkownika i nie jest tak dynamiczna jak pokazano, nie wspominając już o braku możliwości wideo. Te zmiany i ograniczenia podkreślają, że najnowsze funkcje głosowe, takie jak te zaprezentowane, nie są jeszcze dostępne dla wszystkich użytkowników.

Do czego zamierzasz wykorzystywać nowy model od OpenAI?

Wykorzystanie nowego modelu od OpenAI, ChatGPT-4 Omni, to dla nas w 10Clouds zarówno ekscytująca możliwość, jak i wyzwanie do pokonania. Z jednej strony, zdolność modelu do przetwarzania różnych typów danych – od tekstu, przez mowę, po obrazy – otwiera przed nami nowe ścieżki w tworzeniu aplikacji edukacyjnych. W 10Clouds szczególnie interesują nas eksperymenty z tworzeniem cyfrowych bliźniaków, które mogą “zastąpić” nauczycieli w niektórych obowiązkach, a przez to wzbogacić proces nauczania. Z drugiej strony, jesteśmy świadomi, że pełne wykorzystanie tych możliwości wymaga od nas ciągłego uczenia się i dostosowywania. Podchodzimy do nowych możliwości z otwartością gotowi na eksplorację i przekraczanie granic tego, co możliwe dzięki nowym technologiom, jednocześnie zachowując krytyczne spojrzenie na ograniczenia i wyzwania, które przed nami stoją.

Anita Kijanka, założycielka hubu Come Creations Group

Twoje największe zaskoczenie przy korzystaniu z ChatGPT-4o to…?

W pierwszej kolejności – bezpłatny dostęp do zupełnie nowej jakości! W drugiej to całe mnóstwo wiele zaskoczeń, zarówno pozytywnych, jak i czasami wywołujących zdumienie.

Przy wersji 4o spędziłam jeszcze niewiele czasu. Ale często generował odpowiedzi, które są zaskakująco trafne, szczegółowe i przypominały mi rozmowy z prawdziwą osobą. Obserwuję to, w jaki sposób model reaguje na różne emocje w tonie wypowiedzi. To z jednej strony jest fascynujące, ale z drugiej przyprawia mnie o gęsią skórkę.

Co według Ciebie zmieni Ciebie nowa wersja ChataGPT?

Nowa wersja ChatGPT z całą pewnością przyniesie zmiany, które wpłyną na jej postrzeganie zarówno jako zabawki dla internautów, jak i jako potężnego narzędzia dla biznesu. Możliwości związane z analiza dźwięku i obrazu w czasie rzeczywistym to z pewnością wielki krok w branży komunikacyjnej i wypatruję pierwszych pomysłów na kampanię z zastosowaniem tych funkcjonalności.

Tłumaczenie symultaniczne sprawia, że cieszę się, że nie poszłam w stronę tłumaczeń. To bardzo wymagający zawód i mam tylko nadzieję, że nie zniknie za sprawą GPT-4o. Pewnie niejedyna śledzę temat odczytywanie emocji z ludzkiej twarzy – fascynująca zmiana i może to będzie dobry kierunek w stronę treningów wystąpień publicznych, diagnozy psychologicznej czy psychiatrycznej. Mimika to jeden z ważniejszych aspektów komunikacji międzyludzkiej. Według badan tylko 7% komunikacji stanowią słowa, cała reszta to właśnie nasz sposób mówienia, gesty, wyraz twarzy. Wkraczamy do zupełnie innego świata komunikacji i marketingu.

Czy jest coś, czego w Twojej opinii brakuje w Omni?

Dla mnie jeszcze za wcześnie na określenie czego mi brakuje. Prawdę mówiąc z każdym kolejnym modelem odkrywam możliwości, o których nie wiedziałam, że są możliwe. Tempo tych zmian jest tak szybkie, a środki finansowe, które giganci technologiczni przeznaczają na rozwój AI tak wielkie, że mogę się tylko domyślać, kolejnych zaskoczeń i niedowierzania w możliwościach.

Do czego zamierzasz wykorzystywać nowy model od OpenAI?

Nowy model od OpenAI może być wykorzystywany na wiele sposobów, aby poprawić efektywność i skuteczność działań PR. Ja traktuję go przede wszystkim jako źródło inspiracji i sparing partner w pomysłach na kampanie czy realizowane projekty.

Z pewnością będę chciała potestować, jak nowa wersja radzi sobie z danymi czy insightami, które często wykorzystujemy do tworzenia kampanii.

Wykorzystanie nowego modelu AI w komunikacji moim zdaniem pozwoli na znaczne zwiększenie efektywności operacyjnej, lepsze zrozumienie i reagowanie na potrzeby rynku. Umożliwi tworzenie bardziej angażujących i skutecznych kampanii. To sprawia z kolei, że możemy oferować klientom bardziej innowacyjne i precyzyjnie dopasowane usługi, co mam nadzieję przełoży się na lepsze wyniki i większą satysfakcję klientów.

Mateusz Chechliński, członek AI Chamber i CEO Appotype

Twoje największe zaskoczenie przy korzystaniu z ChatGPT-4o to…?

Myślę, że największym zaskoczeniem był sam fakt, że model ten został od razu udostępniony bezpłatnie, w odróżnieniu od swojego poprzednika, czyli wersji 4. Bezpłatne udostępnienie modelu może mieć na celu zwiększenie ilości interakcji, co pomaga w dalszym trenowaniu i ulepszaniu modelu. Jak mniemam, ma to na celu zgromadzenie jeszcze większej ilości danych do trenowania następnych modeli, w obliczu podejmowanych obecnie wysiłków na rzecz ograniczenia możliwości trenowania na podstawie treści ogólnodostępnych w Internecie.

Na przykład AI Act wymaga, aby dostawcy systemów AI ujawniali ogólne informacje o wykorzystanych danych do trenowania modeli, zwłaszcza jeśli są to systemy o wysokim ryzyku. Obejmuje to informacje o pochodzeniu danych, metodach ich zbierania i celach wykorzystania. Prywatne firmy, również podejmują kroki techniczne i prawne, aby chronić swoje dane przed nieautoryzowanym zbieraniem przez boty, co obejmuje zastosowanie mechanizmów blokujących boty i egzekwowanie warunków użytkowania.

Co według Ciebie zmieni Ciebie nowa wersja ChataGPT?

Nowa wersja stanowi naturalny kierunek rozwoju dla GPT, więc trudno powiedzieć, że coś się radykalnie zmieni, poza tym że oczywiście efekty są coraz bardziej imponujące. Czy będzie to zabawka dla internautów czy narzędzie? Oba. Korzystanie z tego narzędzia nie wymaga żadnej specjalistycznej wiedzy, a pisanie „promptów” nie jest skomplikowane – każdy może bawić się z Chatem, wykorzystując go w sposób dowolnie kreatywny.

Jednocześnie potęga tego narzędzia pozwala na jego skuteczne wykorzystanie w biznesie. W tym przypadku należy jednak pamiętać, że nie może ono pozostawać bez nadzoru człowieka. Chodzi zarówno o ryzyka związane z tzw. „halucynacjami” (nieprawdziwe informacje), jak i kwestie bezpieczeństwa (wycieki poufnych danych) oraz odpowiedzialności prawnej (plagiat, wpływ na decyzje diagnostyczne itp.).

Czy jest coś, czego w Twojej opinii brakuje w Omni?

Rąk i nóg (śmiech). Chciałbym, żeby AI mogło nas wyręczać w ciężkich, fizycznych pracach, a nie w tych przyjemnych, kreatywnych.

Do czego zamierzasz wykorzystywać nowy model od OpenAI?

Już teraz wykorzystujemy go jako asystenta programisty, content managera, analityka biznesowego i właściwie każdej osoby zatrudnionej w Appotype. Ale podkreślam jeszcze raz: asystenta. ChatGPT ma wspierać pracę człowieka, przyspieszać ją i ułatwiać – lecz nie jest w stanie go zupełnie zastąpić.

Jan Szumada, Investment Associate w Warsaw Equity Group

Twoje największe zaskoczenie przy korzystaniu z ChatGPT-4o to…?

Zaskoczyła mnie szeroka multimodalność modelu, czyli możliwość wykorzystywania innych typów danych niż sam tekst. Część z tych możliwości miał już GPT-4, ale wersja 4o radzi sobie w tym zakresie jeszcze lepiej. Dodatkowo, nowy model wydaje się być zauważalnie szybszy niż GPT-4.

Co według Ciebie zmieni Ciebie nowa wersja ChataGPT?

Poprzednie wersje Chatu GPT już udowodniły, że jest to potężne narzędzie. Ciężko obecnie znaleźć firmę, w której nikt nie korzysta z Chatu GPT. Dodatkowo, GPT-4o będzie zapewne w jeszcze większym stopniu niż poprzednie wersje wykorzystywany podczas nauki. Możliwości w tym zakresie pokazało OpenAI podczas demo, gdy model pomagał w rozwiązywaniu równania matematycznego. Uważam, że w perspektywie kilku lat będzie miało to ogromny wpływ na branżę edukacji.

Czy jest coś, czego w Twojej opinii brakuje w Omni?

Przydatna byłaby możliwość łatwego śledzenia konkretnych miejsc w dokumencie, z których czat pobiera informacje np. podczas interakcji z plikami PDF. Dodatkowo, Omni nadal nie adresuje w pełni problemu halucynacji, który według mnie jest jedną z największych wad LLMs.

Do czego zamierzasz wykorzystywać nowy model od OpenAI?

W mojej pracy największy potencjał widzę w syntezowaniu informacji z dłuższych dokumentów. Dotychczas korzystałem z rozwiązań firm trzecich współpracujących z poprzednimi wersjami modelu, ale nie działały one wystarczająco dobrze. Nowy model – Omni – radzi sobie z tym dużo lepiej. Z niecierpliwością czekam też na możliwość rozmowy z chatem w języku naturalnym, pokazana podczas demo ale jeszcze nie udostępniona użytkownikom. W niedalekiej przyszłości może być to główny sposób interakcji z modelami LLMs.

Czytaj także: Sztucznej inteligencji jest coraz więcej: Jan Szumada (WEG) aktualizuje swój landscape polskich firm pracujących nad AI

Mariusz Tarnaski, członek AI Chamber i CTO Develtio

Twoje największe zaskoczenie przy korzystaniu z ChatGPT-4o to…?

To co widzimy teraz pod adresem chatgpt.com w zakładce ChatGPT 4o to nie jest jeszcze rozwiązanie, które Open AI prezentowało na niedawnej konferencji. Na multimodalny model językowy z którym będziemy mogli swobodnie rozmawiać poczekamy jeszcze tygodnie, a może nawet miesiące, jak słyszymy z ostatnich doniesień.

A w samej prezentacji mnie osobiście najbardziej zaskoczyła szybkość i wydajność. To niesamowite jakiego postępu dokonano w ciągu roku czy dwóch. Te modele nie tylko są coraz bardziej inteligentne i potrafią operować na różnych danych, nie tylko tekstowych, ale także dostajemy już rozwiązania, które działają natychmiast. Taki interfejs głosowy to bardzo skomplikowany proces, od rozpoznania mowy człowieka i przekształcenia go w tekst (co AI robi już lepiej od ludzi!), poprzez analizę wszystkich danych przez multimodalny model aż po wygenerowanie mowy abyśmy mogli usłyszeć odpowiedź. Imponujące!

Co według Ciebie zmieni nowa wersja ChataGPT?

Dla osób bacznie śledzących rozwój AI nie było niespodzianką, że wkrótce na rynku pojawi się nowa generacja asystentów głosowych. Czasami możliwość porozmawiania z komputerem jest bardzo wygodna, np. podczas podróży autem. Innym razem wolimy pisać. To będzie więc szalenie ciekawy eksperyment czy możliwość rozmowy zrewolucjonizuje to w jaki sposób korzystamy z technologii czy jednak ograniczy się to do ciekawostki i przyda w nielicznych przypadkach.

Moim zdaniem to pierwsze i za kilka lat powszechne będzie, że z komputerem czy telefonem więcej rozmawiamy niż z nim piszemy. A to otwiera całkiem nowe możliwości i wpłynie na wszystko co do tej pory znamy, głównie na Internet. Adaptacja tych rozwiązań będzie szybsza niż niektórym może się wydawać, a niedowiarki przekonają się gdy pierwszy raz ich dzieci odrobią pracę domową przy pomocy ChatGPT. Dla biznesu rodzi to również ciekawe możliwości, chociaż taka rewolucja zbierze także swoje krwawe żniwo i wiele firm przestanie mieć rację bytu. Nie boję się użyć słowa, że czeka nas rewolucja.

Czy jest coś, czego w Twojej opinii brakuje w Omni?

Postęp w dziedzinie AI jest szalony i nie spodziewam się aby to miało w najbliższym czasie się zmienić. Dzisiaj rozmawiamy o czacie od OpenAI, ale Google również zaprezentowało już swoje rozwiązania. Oczekuję więc coraz szybszych i inteligentniejszych rozwiązań i coraz więcej integracji ze znanymi nam systemami i sprzętami. Po pierwszych zachwytach na pewno szybko dostrzeżemy ograniczenia Omni, ale szczerze powiedziawszy nie widzę jakichś szczególnych wad tego rozwiązania. Wszystko na koniec sprowadza się do tego jak bardzo inteligenta będzie sztuczna inteligencja i kiedy osiągniemy AGI.

Do czego zamierzasz wykorzystywać nowy model od OpenAI?

Na pewno będę szeroko korzystał z nowych możliwości analizy zdjęć i obrazu z kamery. Liczę na to, że zaoszczędzę dużo czasu na poszukiwaniu „takiej” koszuli i szukaniu informacji „o tym” produkcie. Z pewnością wypróbuję go również do swobodnej rozmowy na tematy, które mnie interesują lub nad którymi pracuję. Nie mogę się już doczekać gdy pierwszy raz będę mógł swobodnie porozmawiać z komputerem na jakiś temat, z czego model od OpenAI zrobi potem notatki i pierwszy draft dla nowego artykułu na naszego firmowego bloga.

Czytaj także: