Firma OpenAI ogłosiła we wtorek najnowszą wersję swojego modelu sztucznej inteligencji. GPT-4 to obecnie najbardziej zaawansowany system OpenAI, „produkujący” bezpieczniejsze i bardziej użyteczne odpowiedzi. Wszystkie cechy i umiejętności poprzednich wersji, którymi zachwycał się cały świat, zostały rozszerzone oraz stały się jeszcze bardziej dopracowane, GPT-4 jest bardziej kreatywny i nastawiony na współpracę, niż kiedykolwiek wcześniej.
- GPT-4 to najnowszy kamień milowy w wysiłkach OpenAI na rzecz rozwoju sztucznej inteligencji
- GPT-4 potrafi z większą dokładnością rozwiązywać trudne zadania, dzięki szerszej wiedzy ogólnej i umiejętności rozwiązywania problemów
- Aktualnie najbardziej popularne stają się umiejętności prawnicze dzieła OpenAI
- Autorzy chatbota przewidują w przyszłości zaoferowanie pewnej ilość darmowych zapytań GPT-4, dla każdego użytkownika
ChatGPT nie przestaje się rozwijać
W zwykłej rozmowie różnica między GPT-3,5 a GPT-4 może być subtelna. Różnica ujawnia się, gdy złożoność zadania osiąga wystarczający próg – GPT-4 jest bardziej niezawodny, kreatywny i zdolny do obsługi znacznie bardziej zniuansowanych instrukcji niż GPT-3,5.
Wyniki GPT-4 stawiają go w dobrej pozycji do przyjęcia do 20 najlepszych szkół prawniczych i jest tylko kilka krótki od wyników potrzebnych, do przyjęcia do prestiżowych szkół, takich jak Harvard, Stanford, Princeton lub Yale. GPT-4 może zdawać testy w szkołach średnich i egzaminy prawnicze z wynikami plasującymi się w 90. percentylu i posiada nowe możliwości przetwarzania, które nie były możliwe w poprzedniej wersji.
Dane pokazują, że GPT-4 osiągnął wynik 163 punktów i znalazł się w 88 percentylu na egzaminie LSAT – teście, który studenci college’u muszą zdać w Stanach Zjednoczonych, aby zostać przyjętym na studia prawnicze. Poprzednia wersja ChatGPT uzyskała tylko 149 punktów na LSAT, co plasuje ją w dolnych 40% zdających.
GPT-4 uzyskał również 298 punktów na 400 możliwych w Uniform Bar Exam – teście podejmowanym przez niedawno ukończonych studentów prawa, pozwalającym im na wykonywanie zawodu prawnika w każdej jurysdykcji w USA. Stara wersja ChatGPT skończyła test w dolnych 10% z wynikiem 213 na 400.
Dane z testów GPT-4 zostały udostępnione 14 marca przez twórcę OpenAI, ujawniając, że może on również konwertować wejścia obrazu, dźwięku i wideo na tekst, a także obsługiwać “znacznie bardziej zniuansowane instrukcje”, bardziej kreatywnie i niezawodnie. Innymi słowy Chat GPT nie przestaje się rozwijać.
Announcing GPT-4, a large multimodal model, with our best-ever results on capabilities and alignment: https://t.co/TwLFssyALF pic.twitter.com/lYWwPjZbSg
— OpenAI (@OpenAI) March 14, 2023
– Spędziliśmy 6 miesięcy na iteracyjnym dopasowywaniu GPT-4, wykorzystując wnioski z naszego programu testowania adwersarzy oraz ChatGPT, co zaowocowało najlepszymi w historii wynikami (choć dalekimi od doskonałości) w zakresie rzeczowości, sterowalności i odmowy wychodzenia poza barierę ochronną –można przeczytać na openai.com.
– W miarę jak będziemy skupiać się na niezawodnym skalowaniu, będziemy doskonalić naszą metodologię, aby pomóc nam przewidywać i przygotowywać się do przyszłych możliwości z coraz większym wyprzedzeniem – co uważamy za kluczowe dla bezpieczeństwa – dodano.
Bariera językowa również wydaje się nie stanowić problemu. Wiele istniejących benchmarków ML jest napisanych w języku angielskim. Aby uzyskać wstępny obraz możliwości w innych językach, przetłumaczono benchmark MMLU – zestaw 14 000 problemów wielokrotnego wyboru obejmujących 57 tematów – na różne języki za pomocą Azure Translate.
W 24 z 26 testowanych języków, GPT-4 przewyższa angielskojęzyczną wydajność GPT-3.5, dotyczy to również języków o niskich zasobach, takich jak łotewski, walijski i suahili.
To również może Cię zainteresować:
- ChatGPT buduje portfel dywidendowy GPW. Wskazał pięć spółek z WIG20
- ChatGPT uważa Warrena Buffetta za najlepszego inwestora w historii
GPT-4 nie ustrzegł się jednak wad
GPT-4 nadal ma wiele znanych ograniczeń. Pokazują to między innymi dość przeciętne wyniki w teście AP Calculus, który obejmuje zagadnienia matematyczne – podstawowe wprowadzenie do granic, pochodnych i całek, plasujące się w przedziale od 43 do 59 percentyla. Innym obszarem, w którym GPT-4 nie radziło sobie z egzaminami to zakres literatury angielskiej. Wyniki w dwóch oddzielnych testach, umiejscowiły sztuczną inteligencję w przedziale od 8 do 44 percentyla.
OpenAI powiedziało, że GPT-4 i GPT-3.5 wzięły te testy z egzaminów praktycznych 2022-2023, i że “żadne specyficzne szkolenie” nie zostało podjęte przez narzędzia do przetwarzania języka:
– Nie przeprowadziliśmy żadnego szczególnego szkolenia do tych egzaminów. Mniejszość problemów na egzaminach została dostrzeżona przez model podczas szkolenia, ale uważamy, że wyniki są reprezentatywne – można przeczytać na openai.com.
Pomimo swoich możliwości GPT-4 ma podobne ograniczenia jak wcześniejsze modele GPT. Co najważniejsze, wciąż nie jest w pełni wiarygodny (“omamia” fakty i popełnia błędy w rozumowaniu), przez co należy zachować dużą ostrożność przy korzystaniu z danych wyjściowych modelu językowego.
Choć nadal jest to realny problem, GPT-4 znacząco zmniejsza fałszywe informacje w stosunku do poprzednich modeli (które same poprawiały się z każdą iteracją). GPT-4 uzyskał wynik o 40% wyższy niż GPT-3.5 w wewnętrznych ocenach.
GPT-4 generalnie nie zna wydarzeń, które miały miejsce po tym, jak większość jego danych zostanie odcięta (wrzesień 2021). Czasami popełnia proste błędy w rozumowaniu, które nie wydają się zgodne z kompetencjami w tak wielu dziedzinach, lub jest zbyt łatwowierny w przyjmowaniu oczywistych fałszywych stwierdzeń od użytkownika. Może również nie radzić sobie z trudnymi problemami w taki sam sposób jak ludzie, np. wprowadzając luki bezpieczeństwa do tworzonego przez siebie kodu.
Mówiąc o wadach sztucznej inteligencji nie należy zapominać o konsekwencjach tak „doskonałych” rozwiązań, które nieodwracalnie mogą wpłynąć na system edukacji na całym świecie. Takiego zdania jest między innymi Nick Almond, założyciel FactoryDAO, który wprost mówi o zawaleniu się światowego systemu edukacji.
They’ve basically trained it to pass all the tests that we use in the education system, and it does, ace them.
So… we either need a new way of measuring intelligence, or 90% of us are dumber than the machines. https://t.co/1UCRS7ANSh
— drnick 🗳️² (@DrNickA) March 14, 2023
Wady i niedociągnięcia dotyczą również rozwiązań systemowych GPT-4, tych obecnych oraz dopiero co wprowadzanych. Twórcy są świadomi takiego stanu rzeczy i nieustanie pracują nad kolejnymi udoskonaleniami. Zachęcają również użytkowników do jak najszerszego wykorzystywania GPT-4 i wyrażania opinii oraz wskazywania błędów. Służy do tego OpenAI Evals, narzędzie do automatycznej oceny wydajności modeli AI, które umożliwia każdemu zgłaszanie niedociągnięć w modelach OpenAI i ma pomóc w ich dalszym doskonaleniu.
Dalsza część tekstu pod materiałem wideo:
GPT-4 – aktualnie najlepsza dostępna wersja modelu sztucznej inteligencji
Nie zmienia to jednak faktu, iż GPT-4 to najdoskonalsza dotychczasowa wersja dzieła od OpenAI.
– Model może mieć różne błędy w swoich wynikach – poczyniliśmy postępy w tym zakresie, ale wciąż jest wiele do zrobienia.
– Od początku szkolenia udoskonalamy GPT-4, aby uczynić go bezpieczniejszym i lepiej dopasowanym. Działania te obejmują selekcję i filtrowanie danych przed szkoleniem, oceny i zaangażowanie ekspertów, poprawę bezpieczeństwa modelu oraz monitorowanie i egzekwowanie – można przeczytać na stronie twórców: openai.com
Poprawki znacząco poprawiły wiele właściwości bezpieczeństwa GPT-4 w porównaniu do GPT-3.5. Zmniejszono tendencję modelu do reagowania na prośby o niedozwolone treści o 82% w porównaniu z GPT-3.5, a GPT-4 odpowiada na wrażliwe prośby (np. porady medyczne i samookaleczenia) zgodnie z polityką OpenAI o 29% częściej.
GPT-4 i następne modele mają potencjał, by znacząco wpłynąć na społeczeństwo w sposób zarówno korzystny, jak i szkodliwy. Twórcy zdają się być tego świadomi i zależy im na jak najbardziej pozytywnym wpływie ich produktu:
– Współpracujemy z zewnętrznymi naukowcami, aby poprawić sposób, w jaki rozumiemy i oceniamy potencjalny wpływ, a także aby stworzyć oceny niebezpiecznych możliwości, które mogą pojawić się w przyszłych systemach. Wkrótce podzielimy się większą ilością naszych przemyśleń na temat potencjalnych społecznych i ekonomicznych skutków GPT-4 i innych systemów AI.
Subskrybenci ChatGPT Plus otrzymają dostęp GPT-4 na chat.openai.com z limitem użycia. Dokładny limit użycia będzie dostosowany w zależności od zapotrzebowania i wydajności systemu w praktyce. Twórcy spodziewają się poważnych problemów z ograniczoną pojemność, związaną z ogromną popularnością GPT-4.
Można usłyszeć również o możliwości wprowadzenia nowego poziomu subskrypcji, który umożliwi większy dostęp do GPT-4. Pozytywną informacją są plany dotyczące zaoferowania pewnej ilość darmowych zapytań GPT-4, dzięki którym osoby bez subskrypcji będą mogły również wypróbować najnowszą wersję chatbota ze sztuczną inteligencją.
Autor poleca również:
- Czym jest ChatGPT od OpenAI? Sprawdź jak zainwestować w sztuczną inteligencję
- Meta zlikwiduje kolejne 10 tys. miejsc pracy. Tymczasem akcje spółki ponad 7% wyżej
- Wall Street wraca do wzrostów. Obecnie cała nadzieja w Fed
- Martwimy się o inflację w Polsce? W Argentynie przekroczyła właśnie 102,5%!