Süni İntellekt

R-Zero: Süni İntellekt Özünü Necə Təlim Edir?

...

Link kopyalandı

...

08.09.2025, 11:04

Süni intellekt

Oxumaq vaxt alır?

Məqalələri dinləyə bilərsiz

R-Zero ilə Süni İntellektin Özünü Təlimi

Tencent AI Lab və Washington Universiteti tədqiqatçıları tərəfindən hazırlanan R-Zero adlı yeni çərçivə, süni intellekt modellərinin insan etiketi olmadan özünü təlim etməsinə imkan yaradır. Bu inqilabi texnologiya, süni intellekt sistemlərinin öz təlim məlumatlarını sıfırdan yaratmasını təmin edir və mürəkkəb AI sistemlərinin inkişafında əsas maneəni aradan qaldırır.

R-Zero Necə İşləyir?

R-Zero çərçivəsi iki müstəqil modelin birgə inkişafına əsaslanır: "Çağırışçı" və "Həll Edici". Çağırışçı, Həll Edicinin mövcud bacarıqlarının sərhədində yeni tapşırıqlar yaradır. Həll Edici isə bu tapşırıqları həll etmək üçün mükafatlandırılır. Bu dövri proses, insan müdaxiləsi olmadan iki modelin bir-birini inkişaf etdirməsi ilə nəticələnir.

Tədqiqatçılar, R-Zero-nun açıq mənbəli LLM-lərdə, o cümlədən Qwen3 və OctoThinker modellərində test edildiyini bildirirlər. Nəticələr, R-Zero-nun modeldən asılı olmayan və effektiv bir çərçivə olduğunu göstərir. Məsələn, Qwen3-4B-Base modelinin nəticələri +6.49 bal artmışdır.

Əsas Tapıntılar

R-Zero-nun ən böyük üstünlüklərindən biri onun "sıfır məlumat" yanaşmasıdır. Bu yanaşma, xüsusi sahələrdə yüksək keyfiyyətli məlumatın çatışmadığı hallarda AI inkişafını sürətləndirə bilər. Tədqiqatçılar qeyd edirlər ki, bu çərçivə, insan bilikləri və məlumatlarının məhdudluğundan artıq təsirlənməyən AI sistemlərinin yaradılmasına yol açır.

Bununla yanaşı, R-Zero-nun uzunmüddətli performansında bəzi problemlər də mövcuddur. Məsələn, Çağırışçı daha mürəkkəb tapşırıqlar yaratdıqca, Həll Edicinin etibarlı cavablar vermə qabiliyyəti azalır. İlk iterasiyada doğru cavabların etibarlılığı 79% olsa da, üçüncü iterasiyada bu göstərici 63%-ə düşmüşdür.

Gələcək Perspektivlər

R-Zero hazırda obyektiv sahələr, məsələn, riyaziyyat üçün daha uyğundur. Subyektiv sahələrdə, məsələn, marketinq məzmununun yaradılması üçün genişləndirilməsi üçün "Tənqidçi" adlı üçüncü AI agentin əlavə olunması təklif edilir. Bu, daha mürəkkəb və keyfiyyətə əsaslanan qiymətləndirmələrə imkan yarada bilər.

Bu çərçivə süni intellekt araşdırmalarında yeni bir dövr açır, həm obyektiv, həm də subyektiv sahələrdə AI sistemlərinin tam avtonom inkişafını mümkün edə bilər.

...

Link kopyalandı