Süni İntellekt
GPT-5 Yeni Modeldən Daha Zəif Olduğu Məlum Oldu
2
Süni İntellekt
Oxumaq vaxt alır?
Məqalələri dinləyə bilərsizLmarena vebsaytı dil modellərinin yenilənmiş reytinqini təqdim edib. Bu reytinqdə müxtəlif GPT-5 versiyaları ayrıca qiymətləndirilib və yeni modelin əvvəlki versiyadan zəif olduğu ortaya çıxıb. Bu barədə Day.Az, Gazeta.ru-ya istinadən məlumat yayıb.
Lmarena-nın dil modelləri reytinqi istifadəçilərin qiymətləndirmələrinə əsaslanır. İştirakçılara anonim şəkildə bir suala iki cavab təqdim edilir və onlar daha yaxşı olanı seçirlər. Reytinqin lideri isə hələ də yüksək düşünmə qabiliyyətinə malik olan və maksimal ayarlarla işləyən GPT-5-high modelidir. Bu model Google-un Gemini 2.5 Pro versiyasını az fərqlə qabaqlayır. Bununla belə, ChatGPT Plus abunəliyi çərçivəsində təqdim olunan GPT-5-medium versiyasının ayrıca nəticələri reytinqdə göstərilməyib. Lakin bənçmark testləri bu modelin yalnız cüzi şəkildə geri qaldığını göstərir.
Digər tərəfdən, sürətli cavablar və çat-bot formatında işləmək üçün nəzərdə tutulan GPT-5-chat modeli, çoxmərhələli dialoqlar, mətn yaradılması, proqramlaşdırma və uzun sorğuların işlənməsi sahələrində GPT-4o modelindən zəif olub. Bununla belə, riyaziyyat və təlimatlara əməl etmək sahələrində daha yaxşı nəticələr göstərib. Araşdırma həmçinin GPT-5-chat modelinin rus dili üzrə ciddi şəkildə geri qaldığını üzə çıxarıb: bu model 1418 bal toplayıb, halbuki GPT-4o modeli 1441 bal əldə edib.