Süni İntellekt Dungeons & Dragons-də Uzunmüddətli Strategiya Sınağını Necə Keçdi?
...
Süni intellekt
Oxumaq vaxt alır?
Məqalələri dinləyə bilərsizSüni İntellekt və Dungeons & Dragons: Yeni Sınaq Sahəsi
Süni intellekt modelləri artıq yalnız mətn və şəkil yaratmaqla kifayətlənmir. Onlar indi Dungeons & Dragons (D&D) kimi mürəkkəb, qayda əsaslı və yaradıcılıq tələb edən oyunlarda öz bacarıqlarını sınayırlar. Bu, AI-nin uzunmüddətli planlama, ünsiyyət və yaddaş qabiliyyətlərini yoxlamaq üçün unikal bir meydan yaradır.
NeurIPS 2025 Konfransında Yeni Təqdimat
2-7 dekabr 2025-ci il tarixlərində San Dieqoda keçirilən NeurIPS konfransında təqdim olunan tədqiqatda D&D oyunu, AI modellərinin həm Dungeon Master (DM), həm də qəhrəman rolunu oynaya bilməsi ilə diqqət çəkir. Bu oyun çərçivəsi, tədqiqatçılar tərəfindən "Dungeons & Dragons çoxaddımlı planlama, qaydalara riayət və komanda strategiyasını qiymətləndirmək üçün təbii bir sınaq meydanıdır" kimi qiymətləndirilir.
D&D Agents Çərçivəsi və Simulyasiya
D&D Agents adlı çərçivə insan və AI oyunçularını bir araya gətirir. Simulyasiya "Lost Mine of Phandelver" adlı əvvəlcədən yazılmış macəranın döyüş səhnələrinə fokuslanır və hər epizod 10 dövrədən ibarətdir. Bu, modellərin taktiki qərarvermə və xarakterdə qalma bacarıqlarını ölçmək üçün zəngin imkanlar yaradır.
AI Modellərinin Performansı
Simulyasiyada üç əsas AI modeli sınanıb: DeepSeek-V3, Claude Haiku 3.5 və GPT-4. Claude Haiku 3.5 çətin döyüş səhnələrində ən yüksək effektivliyi nümayiş etdirib. DeepSeek-V3 isə ən çox çətinlik çəkən model kimi seçilib. Modellərin xarakterdə qalma keyfiyyəti "Acting Quality" metrikası ilə ölçülüb. DeepSeek-V3 daha çox qısa, birinci şəxsdə ifadələr yaratdığı halda, Claude Haiku 3.5 oyunçu sinfinə uyğun ifadələr işlədib. GPT-4 isə xarakter və taktiki ifadələrin qarışığını istifadə edərək balanslı performans göstərib.
İnsan və Süni İntellektin Qarışığı
Bu tədqiqat süni intellektin yalnız texniki bacarıqlarını deyil, həm də yaradıcılıq və insanlarla qarşılıqlı əlaqə qabiliyyətlərini önə çıxarır. Canavar rollarında modellər fərqli şəxsiyyətlər yaradaraq oyuna dərinlik qatırlar. Məsələn, goblinlər döyüş zamanı "Heh — parlaq adam qanayacaq!" kimi ifadələr səsləndirirlər. Bu, oyun təcrübəsini daha zəngin və maraqlı edir.
Nəticə
Raj Ammanabrolu və komandası üçün Dungeons & Dragons çoxaddımlı planlama və insan-makina qarşılıqlı əlaqəsi üçün ideal sınaq meydanıdır. Bu tədqiqat süni intellektin gələcəkdə daha mürəkkəb və insan mərkəzli tapşırıqlarda necə inkişaf edə biləcəyinə işıq tutur. İnsanların oyun təcrübələrini zənginləşdirən bu yenilik, texnologiyanın insan həyatına inteqrasiyasının yeni mərhələsini göstərir.