Süni İntellektin Sınandığı An: İnsanla Maşın Arasındakı Həqiqi Fərq Nədir?
...
Süni intellekt
Oxumaq vaxt alır?
Məqalələri dinləyə bilərsizSüni intellektin ən çətin sınağı
Tədqiqatçılar süni intellektin insan zəka səviyyəsinə nə qədər yaxın olduğunu ölçmək üçün "Humanity's Last Exam" (HLE) adlı ən çətin imtahanı hazırlayıblar. Bu test 2,500 sualdan ibarətdir və riyaziyyat, humanitar elmlər, təbii elmlər, qədim dillər və digər ixtisaslaşmış sahələri əhatə edir.
İmtahanın məqsədi və hazırlanması
İmtahanın sualları hazırkı AI modellərinin həll edə bilmədiyi səviyyədə hazırlanıb. Təxminən 1,000 ekspert, o cümlədən Texas A&M Universitetindən Dr. Tung Nguyen, imtahanın hazırlanmasında iştirak edib. Nguyen 73 sualı özü yazıb, əsasən riyaziyyat və kompüter elmləri sahəsində.
AI modellərinin nəticələri
İmtahanın ilkin nəticələrinə görə, GPT-4o modeli 2.7%, Claude 3.5 Sonnet 4.1%, OpenAI-nin o1 modeli isə 8% düzgün cavab verib. Daha güclü modellər olan Gemini 3.1 Pro və Claude Opus isə 40-50% arasında nəticə göstərib.
İnsan və süni intellekt arasındakı fərq
İmtahanın sualları internetdə asan tapılmamaq üçün xüsusi hazırlanıb və yalnız bir dəqiq, yoxlanıla bilən cavabı var. Məqsəd insan test iştirakçılarını aldatmaq deyil, AI sistemlərinin zəif tərəflərini aşkar etməkdir. Dr. Nguyen bildirir ki, "AI sistemləri insan standartlarında yaxşı nəticə göstərməyə başlayanda, onların insan səviyyəsində anlamağa yaxınlaşdığı düşünülür. Amma bu, dərinlik, kontekst və ixtisaslaşmış bilik tələb edir."
Gələcək üçün əsas göstərici
Layihədə tarixçilər, fiziklər, dilçilər və digər sahə mütəxəssisləri də iştirak edib. "Bu yarış süni intellektə qarşı deyil," deyə vurğulanır. HLE süni intellekt və insan zəka arasındakı fərqi ən aydın şəkildə ölçən testlərdən biridir və gələcəkdə AI-nin inkişafını qiymətləndirmək üçün əsas göstərici olacaq.
Bu imtahan süni intellektin hələ də insan zəka səviyyəsinə tam yaxınlaşmadığını göstərir və insan biliklərinin dərinliyini ön plana çıxarır. İnsanların ixtisaslaşmış sahələrdəki biliyi və konteksti anlama qabiliyyəti hələ də AI üçün böyük çağırışdır.