11.08.2023

Naukowcy: ChatGPT popełnia tyle błędów, że rzut monetą da nam lepsze odpowiedzi

Sztuczną inteligencję Sama Altmana krytykują badacze z Purdue University.

ChatGPT w miarę dobrze radzi sobie z ogólnymi poradami, ale czy kiedykolwiek stosowaliście go do konkretnych naukowych zadań, np. do pisania kodu? Cóż, jeśli tak, naukowcy z amerykańskiego Purdue University nie mają dla was dobrych wiadomości: w przypadku pytań dotyczących programowania, ChatGPT odpowiada poprawnie… w 48% przypadków. Oznacza to, że jeśli macie wątpliwości w kwestii kodu, bardziej opłaca się wylosować odpowiedź poprzez rzut monetą.

https://twitter.com/itvoice/status/1689622967649480704

Przekonujący, ale błędny

O raporcie badaczy informuje The Register. Przeanalizowali oni odpowiedzi ChatGPT do 517 pytań zadanych na Stack Overflow, platformie, która umożliwia konsultowanie kodu z innymi programistami. Porównali je z odpowiedziami autorstwa ludzkich użytkowników Stack Overflow.

Okazuje się, że 52% odpowiedzi ChatGPT było po prostu niepoprawne. W dodatku 77% porad, których udzieliła sztuczna inteligencja, okazało się niepotrzebnie rozwlekłe.

Ciekawe są jednak ustalenia naukowców w kwestii preferencji użytkowników odnośnie do odpowiedzi – ludzie w 39% przypadków wolą czytać porady ChatGPT, gdyż są one… lepiej zredagowane. Autorzy badania wskazują, że sztuczna inteligencja jest często dużo milsza niż użytkownicy Stack Overflow, w dodatku styl, w którym napisane są odpowiedzi, sprawia wrażenie dużego przekonania w kwestii poprawności i sporej wiedzy chatbota. Badacze zauważyli, że odbiorcy są w stanie zidentyfikować błąd w odpowiedzi tylko wtedy, gdy jest on oczywisty; jeśli jednak ukrywa się on w meandrach rozwlekłych tyrad ChatGPT, w większości przypadków trudno go wykryć. Gdy odpowiedź AI wydawała się odpowiednio wnikliwa, uczestnicy badania byli w stanie zignorować zawarte w niej błędy.

https://twitter.com/richardshiggins/status/1688861856939511808

Autorzy mają jeszcze kilka ciekawych obserwacji. Przykładowo: twierdzą, że popełniane przez sztuczną inteligencję błędy wynikają częściej z niezrozumienia przez bota pytania niż z faktycznego braku wiedzy.

Trzeba jednak pamiętać, że badanie przeprowadzone zostało na wyjątkowo małej grupie osób (mowa o 12 uczestnikach). Autorzy zdają sobie z tego sprawę i zachęcają do ponowienia eksperymentu na większej próbce przez innych badaczy.

Czytaj dalej

3 odpowiedzi do “Naukowcy: ChatGPT popełnia tyle błędów, że rzut monetą da nam lepsze odpowiedzi”

Oin 11 sierpnia 2023 o 13:39

Nienaukowcy: Darkling winien zatrudnić się na jakimś innym portalu znanym z całkowicie losowych newsów o wszystkim i o niczym.

Odpowiedz
RaiL 11 sierpnia 2023 o 14:18

ChatGPT jest świetny w wychwytywaniu błędów kodu, coś co przeoczy człowiek, bot wyłapie od razu – literówki, jakiś błąd w składni którego edytor nie wychwyci itd. Z rozwiązywaniem problemów praktycznych z kodem jest faktycznie nieco gorzej, ale odpowiednio zadając pytanie, można uzyskać dobre rezultaty. Opieranie badań na pytaniach ze Stacka, na którym często ludzie pytają sami nie bardzo wiedząc o co, jest IMO bez sensu, bo to nijak nie pokazuje „wiedzy” ChatGTP, a bardziej jego rozumienie dziwnie zadawanych pytań 😉

Odpowiedz
jacekxmor 13 sierpnia 2023 o 20:03

Redaktor powinien przemyslec pisanie tekstow o nauce, bo sam nic o niej nie wie z artykulu……🤣

Odpowiedz

Naukowcy: ChatGPT popełnia tyle błędów, że rzut monetą da nam lepsze odpowiedzi

Przekonujący, ale błędny

Czytaj dalej

Gwiazdor „Top Guna” wróci na ekran dzięki AI. Wizerunek aktora zostanie wykorzystany w filmie „As Deep as the Grave”

Nvidia próbuje bezczelnie wepchnąć AI slop do gamedevu i nie pojmuję, dlaczego rości sobie takie prawo wbrew twórcom gier

Tester Fallouta 4 popsuł grę do takiego stopnia, że nie bałby się o utratę pracy przez AI. „Jestem zawodowym idiotą”

Inwestorzy są rozczarowani, że twórcy gier odrzucają AI. Tylko 7% developerów uważa sztuczną inteligencję za coś dobrego dla branży

3 odpowiedzi do “Naukowcy: ChatGPT popełnia tyle błędów, że rzut monetą da nam lepsze odpowiedzi”

Skomentuj Anuluj pisanie odpowiedzi