Süni İntellekt
OpenAI yeni süni intellekt modelini təqdim etdi: gpt-oss
3
Süni İntellekt
Oxumaq vaxt alır?
Məqalələri dinləyə bilərsizOpenAI şirkəti süni intellekt sahəsində mühüm addım ataraq yeni böyük dil modeli (LLM) olan gpt-oss-ni təqdim edib. Bu model, şirkətin adını doğruldaraq ilk 'məntiqi düşünmə qabiliyyətinə malik' və 'açıq çəkiyə' (open-weight) sahib süni intellekt sistemi olaraq tanınır. Yeni modelin açıq çəkiyə sahib olması tədqiqatçılara onu yükləmək, dəyişdirmək və öz ehtiyaclarına uyğunlaşdırmaq imkanı verir.
San-Fransisko, Kaliforniyada yerləşən OpenAI, gpt-oss-ni 5 avqustda yayımladığı bloq yazısı və texniki təsvirlə təqdim edib. Bu model bəzi tapşırıqlarda şirkətin ən güclü modelləri ilə müqayisə edilə biləcək performans nümayiş etdirir. Model iki fərqli ölçüdə mövcuddur, kiçik ölçülü versiyası sadəcə bir laptopda işləyə bilər. Bununla yanaşı, bu modellər offline rejimdə də fəaliyyət göstərə bilir, yəni bulud hesablaması və ya onlayn interfeys tələb olunmur. Bu xüsusiyyət onların həssas məlumatları analiz etmək və ya yenidən təlim keçirmək üçün istifadə edilməsinə imkan verir.
Oksford Universitetindən riyaziyyatçı və kompüter alimi Simon Frieder bu yenilik barədə fikirlərini bölüşərək, “Mən çox həyəcanlıyam. Açıq mənbəli böyük dil modelləri arasında rəqabət artıq güclüdür və bu yenilik tədqiqat cəmiyyətinə böyük fayda verəcək,” deyə vurğulayıb.
Gpt-oss-nin təqdimatı, xüsusilə Çin şirkətləri tərəfindən inkişaf etdirilən güclü açıq model sistemlərinin artan populyarlığı fonunda baş verir. Hangzhou mərkəzli DeepSeek və Pekində yerləşən Moonshot AI kimi Çin şirkətlərinin modelləri artıq ABŞ-da hazırlanmış Llama (Meta şirkəti tərəfindən) kimi modelləri performans və yükləmə sayına görə geridə qoymağa başlayıb. Seattle, Vaşinqtonda Allen Süni İntellekt İnstitutunda çalışan maşın öyrənmə tədqiqatçısı Nathan Lambert tərəfindən aparılan analizə əsasən, Çin modellərinin üstünlüyü gpt-oss-nin buraxılmasından əvvəl də müşahidə olunmuşdur.
ABŞ prezidenti Donald Trampın administrasiyası keçən ay yayımladığı Süni İntellekt Fəaliyyət Planında açıq çəkiyə sahib süni intellekt modellərinin akademik tədqiqat üçün “vacib” olduğunu vurğulamışdı. OpenAI şirkətinin təsisçilərindən biri olan Greg Brockman, gpt-oss-nin təqdimatından əvvəl jurnalistlərə verdiyi açıqlamada, bu qərarın Çin modellərinin uğuruna cavab olaraq qəbul edilmədiyini bildirmişdir. “Bu, əvvəldən etmək istədiyimiz bir şey idi,” deyə Brockman əlavə edib.
Açıq çəkiyə sahib modellərin yaradıcılarının müxtəlifliyi istifadəçilər üçün faydalıdır, deyə Frieder qeyd edib. “Qərb şirkətindən yeni bir yüksək performanslı model əldə edilməsi, açıq model sahəsində hansı şirkətlərin üstünlük təşkil etdiyini balanslaşdırmaq baxımından mühüm addımdır,” deyə o fikrini ifadə edib.
OpenAI əvvəllər əsasən mülkiyyət hüququna sahib modellər yayımlasa da, 2019-cu ildə GPT-2 modelini açıq mənbəli olaraq təqdim etmişdi. Gpt-oss modelləri məntiqi düşünmə bacarığına malikdir və “düşüncə prosesini” təqlid edərək addım-addım nəticə çıxarmaq üçün təlim keçmişdir. Bu modellər elm və riyaziyyat problemlərinin həllində üstün performans göstərmişdir. Alimlər bu modellərdən kompüter kodu yazmaq, akademik ədəbiyyatı nəzərdən keçirmək və hətta süni intellekt “həmkarları” kimi tədqiqatları sürətləndirmək üçün istifadə edirlər.
Performans baxımından, OpenAI-nin açıq modelləri şirkətin ən qabaqcıl, ödənişli modellərinə çox yaxın görünür. Gpt-oss ölçü baxımından daha kiçik və yalnız mətnlə işləyir (şəkil və video ilə işləyə bilmir). Lakin bu model vebdə axtarış edə bilir, kod yazır və proqram təminatını idarə edir. Şirkət bildirir ki, gpt-oss məntiqi düşünmə tapşırıqlarında oxşar ölçülü açıq modellərə nisbətən daha yaxşı nəticə göstərir.
Gpt-oss, AIME 2025 adlı süni intellektlərin çətin riyaziyyat problemlərini həll etmə bacarığını qiymətləndirən testdə DeepSeek-in R1 modeli kimi mövcud açıq modelləri üstələyir. Həmçinin, Humanity's Last Exam adlı 3,000 suallıq testdə iki modeldən biri aparıcı açıq rəqiblərlə eyni səviyyədə nəticə göstərmişdir.
Bu modelin təqdimatı süni intellekt tədqiqatları üçün yeni imkanlar açır və elm sahəsində daha geniş tətbiqlərə yol açır.