Stenfordas zinātnieki atklāj, ka laika gaitā GPT-4 kļūst dumjāks
Literārs Mistrojums / / July 20, 2023
ChatGPT maksas versijas precizitāte bija zemāka nekā bezmaksas tērzēšanas robotam.
Jauns pētījums Stenfordas universitātes zinātnieki apstiprināja to, par ko interneta lietotāji ir sūdzējušies nedēļām ilgi: ChatGPT Plus, pamatojoties uz GPT-4 patiešām ir kļuvis dumjāks - atšķirībā no GPT-3.5, kurā darbojas bezmaksas tērzēšanas robota versija.
Savā pētījumā autori salīdzināja atbildes uz dažādiem tērzēšanas robota pieprasījumiem, pamatojoties uz GPT-4 un GPT-3.5. Viņi atklāja, ka tērzēšanas robota darbība un atbilžu precizitāte uz dažiem pieprasījumiem jaunajā versijā ir ievērojami pasliktinājās.
Autori salīdzināja martā un janvārī izdotos GPT-4 un GPT-3.5 valodu modeļus. Viņi atklāja, ka šajā laikā GPT-4 precizitāte ievērojami samazinājās, bet GPT-3.5, gluži pretēji, palielinājās.
Piemēram, atbildes precizitāte uz jautājumu, vai 17077 ir pirmskaitlis, samazinājās par 95,2%, savukārt GPT-3,5, gluži pretēji, palielinājās no 7,4% līdz 86,8%. Tāpat abu modeļu pašreizējās versijās ir samazinājusies iespēja veiksmīgi izpildīt neironu tīkla rakstīto kodu.
Iepriekš OpenAI viceprezidents Pīters Velinders jau ir to darījis atbildēja uz ChatGPT Plus lietotāju apsūdzībām:
Nē, mēs nepadarījām GPT-4 dumjāku. Viss ir tieši otrādi: katru jauno versiju mēs padarām gudrāku par iepriekšējo.
Tagad mums ir šāda hipotēze: kad jūs lietojat kaut ko aktīvāk, jūs sākat pamanīt problēmas, kuras jūs iepriekš neredzējāt.
Pīters Velinders
OpenAI produktu viceprezidents
Vienā no atbildēm uz šo tvītu Velinders prasīja sniedz pierādījumus, ka tērzēšanas robots ir kļuvis sliktāks. Stenfordas zinātnieku pētījums parādījās 5 dienas pēc tam, un no OpenAI vēl nav saņemta atbilde.
Šī nav pirmā reize, kad GPT-4 tiek apsūdzēts nepatiesas informācijas sniegšanā. Martā NewsGuard analītiķi atklājaka ChatGPT, kura pamatā ir GPT-4, ir vieglāk likt melot – savukārt pati OpenAI apgalvo, ka atbilžu precizitāte ir palielinājusies par 40%, salīdzinot ar GPT-3.5. IN jo īpaši NewsGuard testos jaunajai neironu tīkla versijai bija mazāka iespēja atspēkot nepatiesu informāciju, tostarp nepatiesus datus par mūsdienu notikumiem un teorijām. sazvērestības.
Izlasi arī🧐
- 6 ChatGPT analogi
- Džeimss Kamerons par AI briesmām: "Es tevi brīdināju 1984. gadā, bet jūs neklausījāties"
- 8 mākslīgā intelekta mīti, kuriem tic pat programmētāji