Google DeepMind Gemini Omni: Yeni multimodal video yaradıcı modeli necə inqilab edir?
...
Süni intellekt
Oxumaq vaxt alır?
Məqalələri dinləyə bilərsizGoogle DeepMind Gemini Omni: Yeni multimodal video modeli
Google DeepMind 20 may 2026-cı il tarixində yeni Omni model ailəsini təqdim etdi. Gemini Omni görüntü, audio, video və mətn daxil etmələrindən istifadə edərək yüksək keyfiyyətli videolar yaratmaq və redaktə etmək üçün nəzərdə tutulub.
Omni-nun əsas xüsusiyyətləri
Gemini Omni müxtəlif növ girişləri qarışdıraraq videolar yaradır və redaktə edir. Redaktələr dialoq şəklində aparılır, yəni hər yeni təlimat əvvəlkilərə əlavə olunur və səhnə ardıcıllığı, xarakterlər qorunur. Bu, modelin fiziki qanunları, o cümlədən cazibə, kinetik enerji və maye dinamikasını daha yaxşı başa düşməsinə imkan verir.
Omni ailəsinin ilk modeli olan Gemini Omni Flash eyni gündə istifadəyə verildi və Google AI Plus, Pro və Ultra abunəçiləri üçün, həmçinin YouTube Shorts və YouTube Create tətbiqlərində pulsuz təqdim olunur. Flash səviyyəsində yaradılan videolar maksimum 10 saniyə uzunluqdadır.
Rəqəmsal avatarlar və əlavə imkanlar
Omni ailəsinə rəqəmsal avatar yaratma funksiyası əlavə olunub. İstifadəçilər öz səsini və görünüşünü qeyd etməklə unikal avatarlar yarada bilərlər. Bu proses istifadəçinin özünü qeyd etməsini və müəyyən rəqəmləri səsləndirməsini tələb edir. Ümumi audio və nitq redaktəsi isə hələlik Omni daxilində təqdim edilmir, Google bu funksiyanı məsuliyyətlə təqdim etmək üçün əlavə testlər aparır.
Texniki və kommersiya detalları
Google Omni-nun qiymət siyasəti, hesablama resursları və API girişi barədə məlumatlar hələ açıqlanmayıb. API girişi yaxın həftələrdə inkişaf etdiricilər və müəssisə müştəriləri üçün açılacaq.
İnsanlara təsiri və təhlükəsizlik
SynthID adlı görünməz rəqəmsal su nişanı Omni ilə yaradılan bütün videolarda avtomatik olaraq yerləşdirilir. Bu, videoların süni intellekt tərəfindən yaradıldığını təsdiqləməyə imkan verir və müəlliflik hüquqlarının qorunmasına xidmət edir. OpenAI də oxşar texnologiyadan istifadə edir.
Google DeepMind Gemini Omni video yaradıcı alətlərdə yeni dövrün başlanğıcını qoyur və gələcəkdə daha geniş tətbiq sahələri gözlənilir.