DeepSeek-in yeni modeli: Vizual sıxılma ilə AI təkmilləşir - Tech Xəbər

Süni İntellekt

DeepSeek-in yeni modeli: Vizual sıxılma ilə AI təkmilləşir

0
Link kopyalandı

850

23.10.2025, 19:38

Süni intellekt

Oxumaq vaxt alır?

Məqalələri dinləyə bilərsiz

DeepSeek-in yeni modeli: Vizual sıxılma ilə AI təkmilləşir

Çin süni intellekt araşdırma şirkəti DeepSeek, mətnləri vizual təsvirlərə çevirərək 10 dəfə daha effektiv sıxılma təmin edən DeepSeek-OCR adlı açıq mənbəli modelini təqdim etdi. Bu yanaşma AI texnologiyalarında əsas qəbul edilən mətn-təsvir emalı prinsiplərini köklü şəkildə dəyişir.

Modelin əsas üstünlükləri

DeepSeek-OCR, ənənəvi mətn emal metodlarından fərqli olaraq, məlumatları vizual təsvirlər vasitəsilə sıxır və bu yolla daha geniş kontekst pəncərələri təmin edir. Şirkətin texniki hesabatına görə, model 97% dəqiqliklə mətnləri vizual təsvirlərdən deşifrə edə bilir. Burada əsas yenilik, mətnlərdən daha az yer tutan təsvirlərlə 10 milyon tokenlik kontekst pəncərələrinin mümkün olmasıdır.

Texnologiyanın arxasında nələr dayanır?

DeepSeek-OCR modeli iki əsas komponentdən ibarətdir: 380 milyon parametrlik DeepEncoder görüntü kodlayıcısı və 3 milyard parametrlik dil dekoderi. Model, Meta-nın Segment Anything Model (SAM) və OpenAI-nin CLIP texnologiyalarını birləşdirərək sıxılma effektivliyini təmin edir. Fox benchmark testlərində model, 100 vizual token ilə 700-800 mətn tokenini sıxaraq 97.3% dəqiqlik əldə edib.

İnsanlara və sənayeyə təsiri

Bu texnologiya sənaye sahələrində böyük dəyişikliklər vəd edir. DeepSeek-OCR bir Nvidia A100-40G GPU ilə gündə 200000 səhifə emal edə bilir. Şirkət, 20 serverdən ibarət bir klaster ilə gündəlik 33 milyon səhifə emalını təmin edir. Bu, süni intellekt üçün sürətli təlim datasetlərinin yaradılmasında əhəmiyyətli bir sıçrayışdır.

Ekspertlərin fikirləri

AI sahəsində tanınmış mütəxəssislər, DeepSeek-in bu yanaşmasını yüksək qiymətləndiriblər. OpenAI-nin təsisçisi Andrej Karpathy qeyd edir ki, 'Bəlkə də süni intellekt modellərinin bütün girişləri yalnız şəkillər olmalıdır. Mətnlər belə, əvvəlcə təsvirə çevrilib sonra modellərə təqdim edilsə, daha effektiv ola bilər.'

Gələcək perspektivlər

DeepSeek-in bu yeniliyi süni intellekt modellərində daha geniş kontekst pəncərələrinin açılmasını və mətnlərin vizual təsvirlərə çevrilərək emalını mümkün edir. Lakin mütəxəssislər qeyd edirlər ki, bu metodun AI modellərinin məntiqi düşünmə qabiliyyətinə necə təsir edəcəyi hələ tam məlum deyil.

DeepSeek bu yanaşma ilə süni intellekt sahəsində yeni sərhədləri aşmağa çalışır. Açıq mənbəli modelin təqdimatı, texnologiyanın daha geniş araşdırılmasını və AI sistemlərində tətbiq edilməsini sürətləndirəcək.

0
Link kopyalandı

Bir istifadəçi, ChatGPT-ni kalkulyatorda işə salmağı bacarıb! (VİDEO)