Süni İntellekt
DeepSeek V3.2-Exp: Uzun Kontekstlər üçün Yeni Model
10
Süni İntellekt
Oxumaq vaxt alır?
Məqalələri dinləyə bilərsizDeepSeek şirkəti 29 sentyabr 2025-ci ildə yeni V3.2-Exp modelini təqdim edib. Bu model əvvəlki V3.1-Terminus versiyasının bazasında hazırlanıb və əsas yenilik olaraq DeepSeek Sparse Attention (DSA) texnologiyasını təklif edir. Bu texnologiya uzun mətn ardıcıllıqlarını yüksək sürətlə və aşağı qiymətlə emal etməyə imkan yaradır, eyni zamanda keyfiyyəti bazar liderləri ilə müqayisə edilə biləcək səviyyədə saxlayır.
Texnologiyanın üstünlükləri
V3.2-Exp modeli minlərlə tokeni emal etməyi tələb edən tapşırıqlar üçün nəzərdə tutulub. Bu tapşırıqlara sənəd analizi, proqram kodlarının araşdırılması və çoxmərhələli elmi təhlillər daxildir. Benchmark testlərində yeni model əvvəlki versiya ilə müqayisədə bənzər nəticələr göstərib, bəzi hallarda isə onu üstələyib. Xüsusən internet axtarışı və kod generasiyası sahələrində daha üstün göstəricilər əldə olunub.
İstifadə imkanları və qiymətlər
DeepSeek, V3.2-Exp modelini geniş istifadəçi kütləsi üçün əlçatan etmək məqsədilə bir neçə platformada istifadəyə verib. Model DeepSeek-in veb versiyası, mobil tətbiqlər və API vasitəsilə istifadə oluna bilər. Qiymətlər əvvəlki versiya ilə müqayisədə 50%-dən çox azaldılıb. Məsələn, giriş tokenlərinin qiyməti cache hit zamanı milyon başına $0,028 (təxminən 0,05 AZN), cache miss zamanı isə $0,28 (təxminən 0,47 AZN), çıxış tokenləri isə $0,42 (təxminən 0,70 AZN) təşkil edir. V3.1-Terminus versiyası 15 oktyabr 2025-ci ilə qədər mövcud olacaq.
Açıq mənbə və sənədləşmə
DeepSeek, V3.2-Exp modelini Hugging Face platformasında MIT lisenziyası altında açıq mənbə kimi təqdim edib. Texniki hesabat GitHub-da dərc olunub və DSA texnologiyasının iş prinsiplərini ətraflı izah edir.
Performans və nəticələr
Modelin təlim və inferens konfiqurasiyası əvvəlki V3.1-Terminus versiyası ilə uyğunlaşdırılıb. Test nəticələri göstərir ki, yeni model əsas metriklərdə sabit keyfiyyət təmin edir və kodlama, agent tapşırıqları kimi sahələrdə üstün nəticələr göstərir.
Əhəmiyyəti və gələcək perspektivlər
Modelin parametrlərinin həcmi 685 milyarda çatıb, lakin Sparse Attention texnologiyası sayəsində uzun ardıcıllıqlar üzərində hesablama xərcləri azalıb. Bu, elmi və biznes sahələrində ucuz və sürətli həllərin inkişafına yol açır. DeepSeek, V3.2-Exp-i startaplar, tədqiqatçılar və iri klasterlərə maliyyə imkanı olmayan şirkətlər üçün əlverişli bir seçim olaraq təqdim edir. Model, gələcək nəsl süni intellekt texnologiyalarına keçid üçün aralıq bir addım kimi qiymətləndirilir.