Xəbər lenti

Süni intellekt ən çətin riyaziyyat testində insanlara uduzdu
Texnologiya 22:05 17.06.2026

Süni intellekt ən çətin riyaziyyat testində insanlara uduzdu

Süni intellektin təbii dil emalı və proqramlaşdırma sahəsində sürətli inkişafına baxmayaraq, ən qabaqcıl modellər mürəkkəb elmi riyaziyyat problemlərinin həllində hələ də insan mütəxəssislərdən geri qalır.

Qaynarinfo xəbər verir ki, bu nəticə "First Proof” layihəsi çərçivəsində aparılan və süni intellektin riyazi qabiliyyətlərini qiymətləndirmək üçün ən sərt testlərdən biri hesab edilən araşdırmada ortaya çıxıb. Nəticələr WION tərəfindən yayımlanıb.

Test çərçivəsində dörd qabaqcıl süni intellekt modeli qarşısına araşdırma səviyyəsində on mürəkkəb riyaziyyat tapşırığı qoyulub. Xüsusilə qeyd olunur ki, suallar modellərin təlim məlumat bazasında mövcud olmayıb və cavablar müstəqil riyaziyyatçılar tərəfindən yoxlanılıb. Bu da sistemlərin "hazır cavablardan istifadə etməsinin” qarşısını alıb.

Təcrübə tam avtomatlaşdırılmış şəkildə aparılıb və insan müdaxiləsi minimuma endirilib. İştirakçılar arasında "OpenAI"ın "ChatGPT 5.5 Pro” modeli və Kaliforniya, Prinston və Sürix Federal Texnologiya İnstitutundan akademik qruplar yer alıb. Bu komandalar "harness” adlanan xüsusi sistemlər hazırlayaraq modelləri cavablarını dəfələrlə yoxlamağa və dəqiqləşdirməyə məcbur ediblər.

Nəticələr göstərib ki, ən yaxşı sistem 10 tapşırıqdan yalnız 6-nı həll edə bilib. Bütün məsələlərin əvvəlcə peşəkar riyaziyyatçılar tərəfindən həll edildiyi nəzərə alınaraq, bu nəticə insan mütəxəssislərin hələ də yeni və tədqiqat xarakterli riyazi problemlərdə üstün olduğunu təsdiqləyib.

Mütəxəssislər bildirirlər ki, süni intellekt sistemləri hələ uzun müddət riyaziyyatçılar üçün tam etibarlı tədqiqat köməkçisi və ya sübut yoxlayıcı roluna yüksələ bilməyəcək.

Son dövrdə bəzi texnoloji şirkətlər süni intellektin sürətli inkişafının riskləri barədə xəbərdarlıq edir və onun tənzimlənməsi ilə bağlı çağırışlar edirlər. Xüsusilə qeyd olunur ki, yeni modellərin özünü təkmilləşdirmə potensialı gələcəkdə ciddi təhlükələr yarada bilər.

Aydın
--> -->