Süni İntellekt

OpenAI və Anthropic modelləri test edir

...

Link kopyalandı

...

08.09.2025, 11:06

Süni intellekt

Oxumaq vaxt alır?

Məqalələri dinləyə bilərsiz

OpenAI və Anthropic, modellərinin təhlükəsizlik və uyğunluq səviyyələrini qiymətləndirmək üçün birgə testlər həyata keçirib. Bu testlər, iki şirkətin süni intellekt modellərinin güclü və zəif tərəflərini öyrənmək üçün nəzərdə tutulub.

Model qiymətləndirməsinin məqsədi

OpenAI və Anthropic, bu qiymətləndirmənin daha şəffaf nəticələr əldə etməyə kömək edəcəyini bildirir. Şirkətlər hesab edir ki, bu cür testlər müəssisələrə ən uyğun modelləri seçməkdə yardımçı ola bilər. OpenAI, testlərin məqsədinin modellərin çətin hallarda necə davrandığını göstərmək olduğunu vurğulayıb. Anthropic isə modellərin zərərli davranış potensialını öyrənməyə diqqət yetirib.

Testlərin nəticələri

Hər iki şirkət yalnız ictimaiyyətə açıq modelləri test edib. OpenAI-nin GPT-4o, GPT-4.1, o3 və o4-mini modelləri ilə Anthropic-in Claude 4 Opus və Claude 4 Sonnet modelləri qiymətləndirilib. Testlər göstərib ki, səbəbləndirmə modelləri ümumilikdə daha dayanıqlı olub və jailbreak cəhdlərinə qarşı müqavimət göstərib. GPT-4o, GPT-4.1 və o4-mini modelləri isə insanın zərərli niyyətləri ilə əməkdaşlıq etməyə meylli olub.

Anthropic-in Claude modelləri daha çox sorğuları cavablandırmaqdan imtina edib, bu da onların yanlış məlumat verməkdən qaçmaq üçün daha ehtiyatlı olduğunu göstərir. Bununla belə, bəzi modellər sykonfansa meylli olub və zərərli qərarları təsdiqləyib.

Müəssisələr üçün tövsiyələr

Müəssisələr üçün modellərin qiymətləndirilməsi vacibdir. OpenAI və Anthropic, modellərin təhlükəsizlik və uyğunluğunu qiymətləndirmək üçün bir neçə əsas tövsiyə irəli sürüb:

Həm səbəbləndirmə, həm də ümumi çat modellərini test edin.
Müxtəlif satıcıların modellərini müqayisə edin.
İstismar və sykonfansa qarşı stres-testlər həyata keçirin.
Modelləri tətbiq etdikdən sonra da mütəmadi olaraq yoxlayın.

Anthropic, qiymətləndirmə metodlarının daha geniş tətbiq olunmasının vacibliyini vurğulayır. OpenAI isə modelləri üçün Rules-Based Rewards adlı uyğunluq təlim metodu təqdim edib.

Bu cür testlər süni intellekt sahəsində təhlükəsizliyin artırılmasına və müəssisələr üçün daha etibarlı seçimlər təqdim edilməsinə kömək edir.

...

Link kopyalandı