Süni İntellekt
Süni intellekt analoq saatları oxumaqda çətinlik çəkir
37
Süni intellekt
Oxumaq vaxt alır?
Məqalələri dinləyə bilərsizSüni intellekt modelləri analoq saat oxumaqda zəifdir
ClockBench adlı tədqiqat, süni intellekt sistemlərinin vizual tapşırıqları yerinə yetirməkdə ciddi məhdudiyyətlərə malik olduğunu aşkar etdi. Bu araşdırma Google, OpenAI, Anthropic və digər iri AI laboratoriyalarının 11 qabaqcıl modelini insanlar ilə müqayisə edərək həyata keçirildi. İnsanlar analoq saatları oxumaqda 89.1% dəqiqlik əldə edərkən, Google-un Gemini 2.5 Pro modeli yalnız 13.3% dəqiqlik nümayiş etdirdi.
Tədqiqatın məqsədi və metodologiyası
Araşdırma Alek Safar tərəfindən aparılıb və 180 xüsusi dizayn edilmiş analoq saat üzərində testlərə əsaslanıb. Tədqiqat süni intellekt modellərinin saat əqrəblərini tanıma, onların əlaqələrini anlama və vizual mövqeyi rəqəmsal zamana çevirmə kimi tapşırıqları necə yerinə yetirdiyini araşdırıb. Safar qeyd edir ki, analoq saatları oxumaq vizual sahədə məntiqi düşünmə üçün yüksək standart qoyur.
Əsas tapıntılar
- İnsanların üstünlüyü: İnsanlar səhv etdikdə orta səhv yalnız üç dəqiqə idi. Süni intellekt modelləri isə bir-dən üç saat arasında səhv edirdi, bu isə 12 saatlıq saat üzərində təsadüfi təxminə bərabərdir.
- Süni intellekt modellərinin zəif nöqtələri:
- Roma rəqəmləri: 3.2% dəqiqlik.
- Tərs və ya güzgülü saat üzləri.
- Rəngarəng fonlar və mürəkkəb dizaynlar.
- İkinci əqrəbləri oxumaq üçün dəqiqlik tələb edən saatlar.
Sənaye performansının müqayisəsi
Google-un Gemini 2.5 Pro modeli 13.3% dəqiqliklə liderlik edir, Gemini 2.5 Flash isə 10.5%-ə çatır. OpenAI GPT-5 modeli 8.4%, Anthropic Claude 4 Sonnet modeli isə 4.2% dəqiqlik nümayiş etdirib. Claude 4.1 Opus modeli 5.6%, xAI Grok 4 isə 0.7% dəqiqliklə ən aşağı nəticəni göstərib. Grok 4-ün zəif performansı, saatların 63%-ni qeyri-mümkün zaman olaraq yanlış olaraq işarələməsi ilə izah edilir.
Süni intellekt inkişafında geniş nəticələr
Tədqiqat göstərir ki, süni intellekt sistemləri biliyə əsaslanan tapşırıqları uğurla yerinə yetirsələr də, vizual məntiqi düşünmədə ciddi çətinliklər yaşayırlar. Safar hesab edir ki, analoq saatlar AI təlim məlumatlarında kifayət qədər təmsil olunmaya bilər, bu da vizual saat təsvirlərini məntiqə çevirməkdə əlavə çətinliklər yaradır.
Yeni yanaşmaların ehtiyacı
Araşdırma, mövcud AI inkişaf paradigmasının vizual məntiqi düşünmə boşluqlarını həll edib-etməyəcəyini və ya tamamilə yeni yanaşmaların lazım olacağını sual altına qoyur. Hazırda analoq saatlar süni intellekt üçün gözlənilməz bir maneə olaraq qalır, insan tərəfindən asanlıqla oxunsa da, ən qabaqcıl AI sistemlərini çaşdırır.