Süni İntellekt
Liquid AI-dən sürətli LFM2-VL modeli
23
Süni intellekt
Oxumaq vaxt alır?
Məqalələri dinləyə bilərsizLiquid AI, LFM2-VL adlı görmə-dil modeli təqdim edib. Bu model, mobil telefonlardan tutmuş geyilə bilən cihazlara qədər müxtəlif texnologiyalarda istifadə üçün nəzərdə tutulub və aşağı gecikmə ilə yüksək dəqiqlik təmin edir.
LFM2-VL modelinin xüsusiyyətləri
LFM2-VL modeli, Liquid AI-nin bir ay əvvəl təqdim etdiyi LFM2 arxitekturası üzərində qurulub. Şirkət bu modeli "ən sürətli cihazda işləyən əsas modellər" kimi təqdim edir. Model, hər bir giriş üçün çəkiləri dinamik şəkildə yaratmaqla (LIV sistemi) işləyir və həm mətn, həm də şəkil girişlərini müxtəlif çözünürlüklərdə emal edə bilir.
Liquid AI-nin verdiyi məlumata görə, bu model, GPU sürətində iki dəfə artım təmin edir və ümumi testlərdə yüksək nəticələr göstərir. Şirkətin həmtəsisçisi və CEO-su Ramin Hasani bildirib ki, "Effektivlik bizim məhsulumuzdur".
İki fərqli variant
LFM2-VL modeli iki ölçüdə təqdim edilir:
- LFM2-VL-450M: Yarım milyard parametrlə məhdud resurslarda işləmək üçün nəzərdə tutulmuşdur.
- LFM2-VL-1.6B: Daha yüksək imkanlara malik model, tək GPU və cihaz əsaslı tətbiqlərdə istifadə üçün kifayət qədər yüngüldür.
Hər iki model, şəkilləri 512x512 piksel çözünürlükdə emal edə bilir və daha böyük şəkillər üçün qeyri-örtüşən parçalara bölərək qlobal kontekst üçün kiçik şəkil əlavə edir.
Liquid AI şirkətinin arxa planı
Liquid AI, MIT CSAIL-dən keçmiş tədqiqatçılar tərəfindən qurulmuşdur. Şirkət, ənənəvi transformator modellərindən fərqli olaraq dinamik sistemlər, siqnal emalı və sayısal xətti cəbr prinsiplərinə əsaslanan AI arxitekturaları inkişaf etdirir.
Şirkətin Liquid Foundation Models (LFMs) adlı əsas məhsulu, mətn, video, audio və zaman ardıcıllığı kimi müxtəlif verilənlər üzərində işləyə bilir. LFMs, az yaddaş tələb edərək real vaxtda uyğunlaşa bilir və həm böyük müəssisələr, həm də məhdud resurslu cihazlar üçün uyğundur.
LEAP platforması və Apollo tətbiqi
İyul ayında şirkət, Liquid Edge AI Platform (LEAP) adlı SDK təqdim edib. Bu platform, tərtibatçılara mobil və quraşdırılmış cihazlarda kiçik dil modelləri işlətməyi asanlaşdırır. LEAP, iOS və Android üçün dəstək, həm Liquid AI modelləri, həm də digər açıq mənbəli modellərlə inteqrasiya təmin edir.
Apollo adlı tətbiq isə tərtibatçılara modelləri tamamilə offline rejimdə test etməyə imkan verir. Bu, Liquid AI-nin məxfilik və aşağı gecikmə prinsipinə uyğun gəlir.
Texniki dizayn və performans
LFM2-VL, dil modeli əsasını, SigLIP2 NaFlex görmə kodlayıcı və multimodal proyektorunu birləşdirən modul arxitekturadan istifadə edir. Proyektor, pikseli açaraq görüntü tokenlərinin sayını azaldır və emal sürətini artırır.
Model, 100 milyard multimodal token üzərində təlim keçmişdir və RealWorldQA, InfoVQA və OCRBench kimi testlərdə yüksək nəticələr əldə etmişdir. GPU emal sürətində də öz sinfində ən sürətli hesab edilir.
Lisensiya və əlçatanlıq
LFM2-VL modelləri Hugging Face platformasında mövcuddur və Colab-da nümunə kodları ilə birlikdə təqdim edilir. Modellər "LFM1.0 lisensiyası" altında təqdim olunur, lakin tam mətni hələ dərc edilməyib. Şirkət, kommersiya istifadəsi üçün fərqli şərtlər təklif edir.
Liquid AI, LFM2-VL modeli ilə yüksək performanslı multimodal AI-ni daha əlçatan etməyi hədəfləyir.