Süni İntellekt

DeepSeek V3.2-Exp: Uzun Kontekstlər üçün Yeni Model

...

Link kopyalandı

...

29.09.2025, 04:04

Süni intellekt

Oxumaq vaxt alır?

Məqalələri dinləyə bilərsiz

DeepSeek şirkəti 29 sentyabr 2025-ci ildə yeni V3.2-Exp modelini təqdim edib. Bu model əvvəlki V3.1-Terminus versiyasının bazasında hazırlanıb və əsas yenilik olaraq DeepSeek Sparse Attention (DSA) texnologiyasını təklif edir. Bu texnologiya uzun mətn ardıcıllıqlarını yüksək sürətlə və aşağı qiymətlə emal etməyə imkan yaradır, eyni zamanda keyfiyyəti bazar liderləri ilə müqayisə edilə biləcək səviyyədə saxlayır.

Texnologiyanın üstünlükləri

V3.2-Exp modeli minlərlə tokeni emal etməyi tələb edən tapşırıqlar üçün nəzərdə tutulub. Bu tapşırıqlara sənəd analizi, proqram kodlarının araşdırılması və çoxmərhələli elmi təhlillər daxildir. Benchmark testlərində yeni model əvvəlki versiya ilə müqayisədə bənzər nəticələr göstərib, bəzi hallarda isə onu üstələyib. Xüsusən internet axtarışı və kod generasiyası sahələrində daha üstün göstəricilər əldə olunub.

İstifadə imkanları və qiymətlər

DeepSeek, V3.2-Exp modelini geniş istifadəçi kütləsi üçün əlçatan etmək məqsədilə bir neçə platformada istifadəyə verib. Model DeepSeek-in veb versiyası, mobil tətbiqlər və API vasitəsilə istifadə oluna bilər. Qiymətlər əvvəlki versiya ilə müqayisədə 50%-dən çox azaldılıb. Məsələn, giriş tokenlərinin qiyməti cache hit zamanı milyon başına $0,028 (təxminən 0,05 AZN), cache miss zamanı isə $0,28 (təxminən 0,47 AZN), çıxış tokenləri isə $0,42 (təxminən 0,70 AZN) təşkil edir. V3.1-Terminus versiyası 15 oktyabr 2025-ci ilə qədər mövcud olacaq.

Açıq mənbə və sənədləşmə

DeepSeek, V3.2-Exp modelini Hugging Face platformasında MIT lisenziyası altında açıq mənbə kimi təqdim edib. Texniki hesabat GitHub-da dərc olunub və DSA texnologiyasının iş prinsiplərini ətraflı izah edir.

Performans və nəticələr

Modelin təlim və inferens konfiqurasiyası əvvəlki V3.1-Terminus versiyası ilə uyğunlaşdırılıb. Test nəticələri göstərir ki, yeni model əsas metriklərdə sabit keyfiyyət təmin edir və kodlama, agent tapşırıqları kimi sahələrdə üstün nəticələr göstərir.

Əhəmiyyəti və gələcək perspektivlər

Modelin parametrlərinin həcmi 685 milyarda çatıb, lakin Sparse Attention texnologiyası sayəsində uzun ardıcıllıqlar üzərində hesablama xərcləri azalıb. Bu, elmi və biznes sahələrində ucuz və sürətli həllərin inkişafına yol açır. DeepSeek, V3.2-Exp-i startaplar, tədqiqatçılar və iri klasterlərə maliyyə imkanı olmayan şirkətlər üçün əlverişli bir seçim olaraq təqdim edir. Model, gələcək nəsl süni intellekt texnologiyalarına keçid üçün aralıq bir addım kimi qiymətləndirilir.

...

Link kopyalandı