Qwen3-Coder-480B-A35B-Instruct: Ən Yaxşı Kodlaşdırma Modeli Olmağa Namizəd - Tech Xəbər

Süni İntellekt

Qwen3-Coder-480B-A35B-Instruct: Ən Yaxşı Kodlaşdırma Modeli Olmağa Namizəd

12
Link kopyalandı

18

24.07.2025, 12:00

Süni intellekt

Oxumaq vaxt alır?

Məqalələri dinləyə bilərsiz

Çinli e-ticarət nəhəngi Alibaba-nın "Qwen Team" adlı tədqiqat qrupu növbəti dəfə diqqət mərkəzinə düşüb. Bir neçə gün əvvəl açıq mənbə lisenziyası ilə təqdim edilən və hazırda dünyada ən yüksək performanslı, qeyri-rezonanslı böyük dil modeli (LLM) olan Qwen3-235B-A22B-2507-nin ardınca, komanda yeni bir model təqdim edib: Qwen3-Coder-480B-A35B-Instruct.

Bu yeni açıq mənbəli dil modeli proqram təminatı hazırlanmasında kömək məqsədilə dizayn edilib. Model mürəkkəb çoxaddımlı kodlaşdırma işlərini yerinə yetirə bilir və tam funksional tətbiqləri saniyələr və ya dəqiqələr ərzində yarada bilir. Qwen3-Coder, agent əsaslı kodlaşdırma tapşırıqlarında, o cümlədən Claude Sonnet-4 kimi mülkiyyətçi modellərlə rəqabət aparmağa qadirdir. Model hazırda Hugging Face, GitHub, Qwen Chat, Alibaba-nın Qwen API platformalarından və digər üçüncü tərəf kodlaşdırma və süni intellekt alətləri platformalarından əldə edilə bilər.

Qwen3-Coder-in açıq mənbə Apache 2.0 lisenziyası ilə təqdim olunması onun kommersiya tətbiqlərində pulsuz istifadəsinə imkan yaradır. Şirkətlər bu modeli yükləyib, dəyişdirib, öz tətbiqlərində istifadə edə və heç bir ödəniş etmədən tətbiq edə bilərlər. Model həmçinin üçüncü tərəf göstəricilərində yüksək nailiyyətlər əldə edib və "vibe coding" (formal inkişaf prosesləri olmadan təbii dil vasitəsilə kodlaşdırma) kimi istifadə sahələrində təcrübəli istifadəçilərin diqqətini çəkib.

Modelin texniki xüsusiyyətlərinə gəldikdə, Qwen3-Coder 480 milyard ümumi parametrdən ibarət olan Mixture-of-Experts (MoE) modelidir. Modelin hər bir sorğu üçün 35 milyard aktiv parametri və 160 ekspertdən 8-ni aktiv şəkildə istifadə etmə xüsusiyyəti var. O, 256K token kontekst uzunluğunu dəstəkləyir və YaRN (Yet another RoPE extrapolatioN) texnikası vasitəsilə 1 milyon tokenə qədər extrapolyasiya edə bilir. Bu, modelə böyük kod bazalarını və ya uzun sənədləri bir keçiddə başa düşmək və idarə etmək imkanı verir.

Model, həmçinin kod yaradılması, SQL proqramlaşdırma, kod redaktəsi və təlimat izləmə kimi sahələrdə yüksək performans nümayiş etdirib. Qwen3-Coder-in əlavə xüsusiyyətlərinə Node.js mühitlərini dəstəkləyən və kodlaşdırma iş axınlarına inteqrasiyanı asanlaşdıran Qwen Code adlı CLI aləti daxildir.

Qwen3-Coder-in istifadəsi ilə bağlı ilkin rəylər müsbətdir. Süni intellekt tədqiqatçıları və mühəndislər modelin performansını və mövcud kodlaşdırma iş axınlarına inteqrasiya qabiliyyətini yüksək qiymətləndiriblər. Modelin gələcəkdə daha kiçik ölçülü versiyalarının hazırlanacağı və öz performansını real istifadə vasitəsilə təkmilləşdirmək üçün yeni metodların araşdırılacağı gözlənilir.

12
Link kopyalandı

Bir istifadəçi, ChatGPT-ni kalkulyatorda işə salmağı bacarıb! (VİDEO)