HOLY SMOKES! A new, 200% faster DeepSeek R1-0528 variant appears from German lab TNG Technology Consulting GmbH - Tech Xəbər

Texnoloji İnkişaf

HOLY SMOKES! A new, 200% faster DeepSeek R1-0528 variant appears from German lab TNG Technology Consulting GmbH

17
Link kopyalandı

23

06.07.2025, 20:00

Süni intellekt

Oxumaq vaxt alır?

Məqalələri dinləyə bilərsiz

Almaniyanın TNG Technology Consulting GmbH şirkəti, süni intellekt sahəsində böyük irəliləyiş hesab olunan yeni modelini - DeepSeek-TNG R1T2 Chimera-nı təqdim edib. Bu model, əvvəlki versiyalara nisbətən 200% daha sürətlidir və yüksək performans göstəriciləri ilə diqqət çəkir. Model, süni intellekt sahəsində tədqiqat və kommersiya məqsədli tətbiqlər üçün geniş imkanlar yaradır.

DeepSeek R1T2 Chimera modeli, DeepSeek-R1-0528, DeepSeek-R1 və DeepSeek-V3-0324 kimi üç əsas modelin birləşdirilməsi ilə yaradılıb. Bu yeni "Tri-Mind" konfiqurasiyası, modelin yüksək məntiqi düşünmə qabiliyyətini qoruyaraq hesablama xərcini əhəmiyyətli dərəcədə azaldır. TNG-nin təqdim etdiyi məlumatlara əsasən, R1T2 modeli, DeepSeek-R1-0528 modelinin intellektual göstəricilərinin 90%-dən çoxunu təmin edir, lakin cavabları daha qısa və konkret tərzdə təqdim edir. Bu, həm hesablama xərclərinin, həm də cavab müddətinin azalmasına səbəb olur.

TNG şirkətinin "Assembly-of-Experts" (AoE) metodu bu modelin yaradılmasında əsas rol oynayıb. Bu metod, müxtəlif əvvəlcədən təlim keçmiş modellərin çəki parametrlərini birləşdirərək yeni bir model yaratma texnikasıdır. Bu yanaşma, modelin yüksək məntiqi düşünmə qabiliyyətini qoruyarkən performansını artırmağa imkan verir. TNG-nin təqdim etdiyi məlumatlara görə, R1T2 modeli, əvvəlki versiyalara nisbətən 60% daha az söz istifadə edərək cavablar təqdim edir ki, bu da real vaxt rejimində və yüksək yüklü sistemlərdə istifadəyə yararlılığını artırır.

R1T2 modeli açıq mənbə (open source) olaraq təqdim edilir və MIT lisenziyası ilə yayımlanır. Bu, istifadəçilərə modeli kommersiya məqsədləri üçün sərbəst şəkildə istifadə etməyə və ona dəyişikliklər etməyə imkan verir. Model, hazırda ümumi məntiqi düşünmə tapşırıqları üçün tövsiyə olunur, lakin funksional çağırışlar və alət istifadəsi kimi xüsusi hallarda məhdudiyyətlər mövcuddur. Bu məhdudiyyətlərin gələcək yeniləmələrdə aradan qaldırılması gözlənilir.

Avropa İttifaqının Avropa Süni İntellekt Aktı ilə əlaqədar olaraq, TNG Avropa İttifaqında fəaliyyət göstərən istifadəçilərə uyğunluq tələblərini nəzərdən keçirməyi tövsiyə edir. ABŞ-da və digər ölkələrdə fəaliyyət göstərən şirkətlər isə bu tələblərə məruz qalmadan modeli sərbəst şəkildə istifadə edə bilərlər.

TNG Technology Consulting GmbH, 2001-ci ildə Bavariyada təsis edilib və süni intellekt, proqram təminatı inkişafı və bulud xidmətləri sahəsində ixtisaslaşmışdır. Şirkət, açıq mənbə icmalarına töhfələr verir və innovativ texnologiyalar üzərində işləyir. R1T2 modeli, TNG-nin süni intellekt sahəsindəki qabaqcıl mövqeyini daha da gücləndirir və kommersiya müəssisələri üçün yeni imkanlar yaradır.

17
Link kopyalandı

Bir istifadəçi, ChatGPT-ni kalkulyatorda işə salmağı bacarıb! (VİDEO)