GPT-5.2: Süni intellektdə gözlənilən inqilab niyə baş vermədi? - Tech Xəbər

GPT-5.2: Süni intellektdə gözlənilən inqilab niyə baş vermədi?

5
Link kopyalandı

355

Dünən, 21:36

Süni intellekt

Oxumaq vaxt alır?

Məqalələri dinləyə bilərsiz

GPT-5.2 modeli təqdim olundu

OpenAI-nin son modeli GPT-5.2, 'peşəkar bilik işləri üçün ən güclü seriya' kimi təqdim olunsa da, testlərdə gözlənilən performansı göstərmədi. Şirkət bu modeli Plus abunəlik ilə aylıq 20 dollar müqabilində təqdim edir. Ancaq testlər nəticəsində məlum olub ki, GPT-5.2-nin performansı GPT-5.1-dən çox da fərqlənmir.

Testlərdəki nəticələr

GPT-5.2 modeli 14 müxtəlif testdən keçirildi: 10 mətn əsaslı və 4 şəkil əsaslı test. Mətn testlərində model 100 mümkün baldan 92, şəkil testlərində isə 20 mümkün baldan 17 toplayıb. Bu nəticələr GPT-5.1 ilə müqayisədə yalnız kiçik bir irəliləyiş göstərir.

Kodlama sahəsində geriləmə

Testlər göstərdi ki, GPT-5.2 kodlama sahəsində ciddi səhvlərə yol verir. Məsələn, dollar və sent formatını yoxlama funksiyası düzgün işləməyib, boş girişləri səhvən sıfır dəyəri kimi qəbul edib. Üstəlik, qeyri-numerik məlumat daxil edildikdə funksiya çöküb. Bu cür səhvlər modelin kodlama sahəsindəki etibarlılığını şübhə altına alır.

Qısa cavablar və təsdiq istəkləri

GPT-5.2-nin cavabları çox qısa və bəzən lazımsız təsdiq istəkləri ilə müşayiət olunur. Bu, istifadəçilərin işini çətinləşdirə bilər. Məsələn, model uzun cavab tələb edən bir sual üçün istifadəçidən 'davam etmək üçün təsdiq' istəyir. Bu xüsusiyyət peşəkar istifadəçilər üçün vaxt itkisinə səbəb ola bilər.

Şəkil testlərində nəticələr

Şəkil testlərində model ümumilikdə yaxşı nəticə göstərsə də, bəzi detallar düzgün işlənməyib. Məsələn, Marvel üslublu helikopter gəmisində turbofanların istiqaməti düzgün təsvir edilməyib. Bununla belə, dizel-pank üslublu robot və digər təsvirlərdə yüksək keyfiyyət müşahidə olunub.

İnsanlar üçün təsiri

GPT-5.2-nin performansı peşəkar istifadəçilər üçün məyusedici ola bilər. Kodlama səhvləri proqramçılar üçün ciddi problemlər yarada bilər, qısa cavablar isə məlumatı tam şəkildə əldə etmək istəyən istifadəçiləri çətin vəziyyətdə qoya bilər. Plus abunəlik üçün əlavə ödəniş tələb olunması isə modelin dəyərini sual altına alır.

Nəticə

OpenAI-nin GPT-5.2 modeli gözləntiləri tam doğrultmadı. Testlər göstərdi ki, bu model yalnız kiçik irəliləyişlər təqdim edir və bəzi sahələrdə geriləmələr var. Kodlama səhvləri və qısa cavablar peşəkar istifadəçilər üçün ciddi narahatlıq yaradır. GPT-5.2-nin Plus abunəlik ilə təqdim olunması isə onun dəyərini müzakirə mövzusuna çevirir.

5
Link kopyalandı