Naga Markets

OpenAI się nie zatrzymuje. GPT-4 – najnowsza wersja chatbota ze sztuczną inteligencjąFirma OpenAI ogłosiła we wtorek najnowszą wersję swojego modelu sztucznej inteligencji. GPT-4 to obecnie najbardziej zaawansowany system OpenAI, „produkujący” bezpieczniejsze i bardziej użyteczne odpowiedzi. Wszystkie cechy i umiejętności poprzednich wersji, którymi zachwycał się cały świat, zostały rozszerzone oraz stały się jeszcze bardziej dopracowane, GPT-4 jest bardziej kreatywny i nastawiony na współpracę, niż kiedykolwiek wcześniej.

  • GPT-4 to najnowszy kamień milowy w wysiłkach OpenAI na rzecz rozwoju sztucznej inteligencji
  • GPT-4 potrafi z większą dokładnością rozwiązywać trudne zadania, dzięki szerszej wiedzy ogólnej i umiejętności rozwiązywania problemów
  • Aktualnie najbardziej popularne stają się umiejętności prawnicze dzieła OpenAI
  • Autorzy chatbota przewidują w przyszłości zaoferowanie pewnej ilość darmowych zapytań GPT-4, dla każdego użytkownika

ChatGPT nie przestaje się rozwijać

W zwykłej rozmowie różnica między GPT-3,5 a GPT-4 może być subtelna. Różnica ujawnia się, gdy złożoność zadania osiąga wystarczający próg – GPT-4 jest bardziej niezawodny, kreatywny i zdolny do obsługi znacznie bardziej zniuansowanych instrukcji niż GPT-3,5.Wyniki GPT-4 stawiają go w dobrej pozycji do przyjęcia do 20 najlepszych szkół prawniczych i jest tylko kilka krótki od wyników potrzebnych, do przyjęcia do prestiżowych szkół, takich jak Harvard, Stanford, Princeton lub Yale. GPT-4 może zdawać testy w szkołach średnich i egzaminy prawnicze z wynikami plasującymi się w 90. percentylu i posiada nowe możliwości przetwarzania, które nie były możliwe w poprzedniej wersji.

Wyniki egzaminacyjne GPT-4 i GPT-3,5 na szeregu ostatnich egzaminów w USA.
Wyniki egzaminacyjne GPT-4 i GPT-3,5. Źródło: OpenAI

Dane pokazują, że GPT-4 osiągnął wynik 163 punktów i znalazł się w 88 percentylu na egzaminie LSAT – teście, który studenci college’u muszą zdać w Stanach Zjednoczonych, aby zostać przyjętym na studia prawnicze. Poprzednia wersja ChatGPT uzyskała tylko 149 punktów na LSAT, co plasuje ją w dolnych 40% zdających.

GPT-4 uzyskał również 298 punktów na 400 możliwych w Uniform Bar Exam – teście podejmowanym przez niedawno ukończonych studentów prawa, pozwalającym im na wykonywanie zawodu prawnika w każdej jurysdykcji w USA. Stara wersja ChatGPT skończyła test w dolnych 10% z wynikiem 213 na 400.

Dane z testów GPT-4 zostały udostępnione 14 marca przez twórcę OpenAI, ujawniając, że może on również konwertować wejścia obrazu, dźwięku i wideo na tekst, a także obsługiwać “znacznie bardziej zniuansowane instrukcje”, bardziej kreatywnie i niezawodnie. Innymi słowy Chat GPT nie przestaje się rozwijać.

Spędziliśmy 6 miesięcy na iteracyjnym dopasowywaniu GPT-4, wykorzystując wnioski z naszego programu testowania adwersarzy oraz ChatGPT, co zaowocowało najlepszymi w historii wynikami (choć dalekimi od doskonałości) w zakresie rzeczowości, sterowalności i odmowy wychodzenia poza barierę ochronną –można przeczytać na openai.com.

W miarę jak będziemy skupiać się na niezawodnym skalowaniu, będziemy doskonalić naszą metodologię, aby pomóc nam przewidywać i przygotowywać się do przyszłych możliwości z coraz większym wyprzedzeniem – co uważamy za kluczowe dla bezpieczeństwa – dodano.

Bariera językowa również wydaje się nie stanowić problemu. Wiele istniejących benchmarków ML jest napisanych w języku angielskim. Aby uzyskać wstępny obraz możliwości w innych językach, przetłumaczono benchmark MMLU – zestaw 14 000 problemów wielokrotnego wyboru obejmujących 57 tematów – na różne języki za pomocą Azure Translate.

W 24 z 26 testowanych języków, GPT-4 przewyższa angielskojęzyczną wydajność GPT-3.5, dotyczy to również języków o niskich zasobach, takich jak łotewski, walijski i suahili.

To również może Cię zainteresować:

GPT-4 nie ustrzegł się jednak wad

GPT-4 nadal ma wiele znanych ograniczeń. Pokazują to między innymi dość przeciętne wyniki w teście AP Calculus, który obejmuje zagadnienia matematyczne – podstawowe wprowadzenie do granic, pochodnych i całek,  plasujące się w przedziale od 43 do 59 percentyla. Innym obszarem, w którym GPT-4 nie radziło sobie z egzaminami to zakres literatury angielskiej. Wyniki w dwóch oddzielnych testach, umiejscowiły sztuczną inteligencję w przedziale od 8 do 44 percentyla.

OpenAI powiedziało, że GPT-4 i GPT-3.5 wzięły te testy z egzaminów praktycznych 2022-2023, i że “żadne specyficzne szkolenie” nie zostało podjęte przez narzędzia do przetwarzania języka:

Nie przeprowadziliśmy żadnego szczególnego szkolenia do tych egzaminów. Mniejszość problemów na egzaminach została dostrzeżona przez model podczas szkolenia, ale uważamy, że wyniki są reprezentatywne – można przeczytać na openai.com.

Pomimo swoich możliwości GPT-4 ma podobne ograniczenia jak wcześniejsze modele GPT. Co najważniejsze, wciąż nie jest w pełni wiarygodny (“omamia” fakty i popełnia błędy w rozumowaniu), przez co należy zachować dużą ostrożność przy korzystaniu z danych wyjściowych modelu językowego.

Choć nadal jest to realny problem, GPT-4 znacząco zmniejsza fałszywe informacje w stosunku do poprzednich modeli (które same poprawiały się z każdą iteracją). GPT-4 uzyskał wynik o 40% wyższy niż GPT-3.5 w wewnętrznych ocenach.

GPT-4 generalnie nie zna wydarzeń, które miały miejsce po tym, jak większość jego danych zostanie odcięta (wrzesień 2021). Czasami popełnia proste błędy w rozumowaniu, które nie wydają się zgodne z kompetencjami w tak wielu dziedzinach, lub jest zbyt łatwowierny w przyjmowaniu oczywistych fałszywych stwierdzeń od użytkownika. Może również nie radzić sobie z trudnymi problemami w taki sam sposób jak ludzie, np. wprowadzając luki bezpieczeństwa do tworzonego przez siebie kodu.

Mówiąc o wadach sztucznej inteligencji nie należy zapominać o konsekwencjach tak „doskonałych” rozwiązań, które nieodwracalnie mogą wpłynąć na system edukacji na całym świecie. Takiego zdania jest między innymi Nick Almond, założyciel FactoryDAO, który wprost mówi o zawaleniu się światowego systemu edukacji.

Wady i niedociągnięcia dotyczą również rozwiązań systemowych GPT-4, tych obecnych oraz dopiero co wprowadzanych. Twórcy są świadomi takiego stanu rzeczy i nieustanie pracują nad kolejnymi udoskonaleniami. Zachęcają również użytkowników do jak najszerszego wykorzystywania GPT-4 i wyrażania opinii oraz wskazywania błędów. Służy do tego OpenAI Evals, narzędzie do automatycznej oceny wydajności modeli AI, które umożliwia każdemu zgłaszanie niedociągnięć w modelach OpenAI i ma pomóc w ich dalszym doskonaleniu.

Dalsza część tekstu pod materiałem wideo:

GPT-4 – aktualnie najlepsza dostępna wersja modelu sztucznej inteligencji

Nie zmienia to jednak faktu, iż GPT-4 to najdoskonalsza dotychczasowa wersja dzieła od OpenAI.

Model może mieć różne błędy w swoich wynikach – poczyniliśmy postępy w tym zakresie, ale wciąż jest wiele do zrobienia.

Porównanie GPT-4 (zielony) z trzema pierwszymi wersjami ChatGPT (100% oznacza, że odpowiedzi modelu są zgodne z idealnymi odpowiedziami człowieka na wszystkie pytania w ocenie).
Porównanie GPT-4 (zielony) z trzema pierwszymi wersjami ChatGPT (100% oznacza, że odpowiedzi modelu są zgodne z idealnymi odpowiedziami człowieka na wszystkie pytania w ocenie). Źródło: openai.com

Od początku szkolenia udoskonalamy GPT-4, aby uczynić go bezpieczniejszym i lepiej dopasowanym. Działania te obejmują selekcję i filtrowanie danych przed szkoleniem, oceny i zaangażowanie ekspertów, poprawę bezpieczeństwa modelu oraz monitorowanie i egzekwowanie – można przeczytać na stronie twórców: openai.com

Poprawki znacząco poprawiły wiele właściwości bezpieczeństwa GPT-4 w porównaniu do GPT-3.5. Zmniejszono tendencję modelu do reagowania na prośby o niedozwolone treści o 82% w porównaniu z GPT-3.5, a GPT-4 odpowiada na wrażliwe prośby (np. porady medyczne i samookaleczenia) zgodnie z polityką OpenAI o 29% częściej.

GPT-4 i następne modele mają potencjał, by znacząco wpłynąć na społeczeństwo w sposób zarówno korzystny, jak i szkodliwy. Twórcy zdają się być tego świadomi i zależy im na jak najbardziej pozytywnym wpływie ich produktu:

Współpracujemy z zewnętrznymi naukowcami, aby poprawić sposób, w jaki rozumiemy i oceniamy potencjalny wpływ, a także aby stworzyć oceny niebezpiecznych możliwości, które mogą pojawić się w przyszłych systemach. Wkrótce podzielimy się większą ilością naszych przemyśleń na temat potencjalnych społecznych i ekonomicznych skutków GPT-4 i innych systemów AI.

Subskrybenci ChatGPT Plus otrzymają dostęp GPT-4 na chat.openai.com z limitem użycia. Dokładny limit użycia będzie dostosowany w zależności od zapotrzebowania i wydajności systemu w praktyce. Twórcy spodziewają się poważnych problemów z ograniczoną pojemność, związaną z ogromną popularnością GPT-4.

Można usłyszeć również o możliwości wprowadzenia nowego poziomu subskrypcji, który umożliwi większy dostęp do GPT-4. Pozytywną informacją są plany dotyczące zaoferowania  pewnej ilość darmowych zapytań GPT-4, dzięki którym osoby bez subskrypcji będą mogły również wypróbować najnowszą wersję chatbota ze sztuczną inteligencją.

Autor poleca również:Śledź nas w Google News. Szukaj to co ważne i bądź na bieżąco z rynkiem! Obserwuj nas >>

  • Powiązane zagadnienia:
Poprzedni artykułCo dalej z notowaniami euro? Upadek SVB nie powinien zatrzymać EBC
Następny artykułDolar pociągnie w górę? Świat walut Marka Rogalskiego
Student drugiego roku studiów magisterskich na Uniwersytecie Ekonomicznym w Poznaniu. Jego zainteresowania koncentrują się wokół szeroko pojętych finansów i ekonomii. Swoją wiedzę stara się przekazywać innym, jest autorem licznych artykułów, poruszających tematykę giełdową oraz inwestycyjną.