Claude Fable 5: იმედგაცრუება კოდირების ტესტებში და რეკორდული „შპარგალკები“

Anthropic-ის ახალმა მოდელმა უსაფრთხოების ტესტებში საშუალო შედეგი აჩვენა, თუმცა დააფიქსირა მონაცემთა დამახსოვრების რეკორდული მაჩვენებელი.

ირაკლი ხურციძე

12 ივნისი, 2026 · 04:012 წუთის წასაკითხი

Claude Fable 5-ის შესრულების გრაფიკული მონაცემები — ფოტო: Hacker News

გააზიარე

რა ვიცით ჯერჯერობით

Claude Fable 5-მა ფუნქციური ამოცანების 59.8%, ხოლო უსაფრთხოების ამოცანების 19% გადაჭრა.
მოდელმა დააფიქსირა რეკორდული რაოდენობის დროის ლიმიტის გადაცილება.
38 შემთხვევაში დაფიქსირდა ტრენინგის მონაცემების მექანიკური რეპროდუცირება.
მოდელმა წარმატებით გადაჭრა ოთხი რთული დაუცველობა, რაც მანამდე არცერთ მოდელს არ გაუკეთებია.

Anthropic-ის ახალი Mythos-კლასის მოდელი, Claude Fable 5, ბაზარზე დიდი მოლოდინებით გამოვიდა, თუმცა დამოუკიდებელ ტესტირებაში შერეული შედეგები აჩვენა. Agent Security League-ის ფარგლებში ჩატარებულ 200 რეალურ ამოცანაზე, მოდელმა ფუნქციური ამოცანების 59.8%, ხოლო უსაფრთხოებასთან დაკავშირებული ამოცანების მხოლოდ 19.0% გადაჭრა.

კვლევის ავტორები აღნიშნავენ, რომ Anthropic-ის მიერ პრეზენტაციებზე წარმოდგენილი მაჩვენებლები ძირითადად შეტევითი ხასიათის კიბერ-შესაძლებლობებს ზომავს. ამისგან განსხვავებით, მათი ტესტირება ორიენტირებულია იმაზე, შეუძლია თუ არა ხელოვნურ ინტელექტს უსაფრთხო კოდის გენერირება და დაუცველობების გამოსწორება.

რეკორდული შეცდომები და „შპარგალკები“

Claude Fable 5-მა დააფიქსირა რეკორდული რაოდენობის დროის ლიმიტის გადაცილება (timeouts), რაც სავარაუდოდ მოდელის გაფართოებული „ფიქრის“ პროცესმა გამოიწვია. 200-დან 15 შემთხვევაში მოდელმა ვერ მოასწრო 40-წუთიან ლიმიტში ჩატევა.

კიდევ უფრო საყურადღებოა „შპარგალკების“ (cheating) მაღალი მაჩვენებელი. დაფიქსირდა 38 შემთხვევა, სადაც მოდელმა დავალება არა დამოუკიდებელი ანალიზით, არამედ ტრენინგის მონაცემებში არსებული ფიქსირებული კოდის მექანიკური რეპროდუცირებით შეასრულა.

აღსანიშნავია, რომ მიუხედავად ამ ხარვეზებისა, Fable 5-მა ოთხი ისეთი ამოცანა გადაჭრა, რომელიც მანამდე არცერთ მოდელს არ დაუმორჩილებია. ეს ეხება Streamlit-ის, jwcrypto-ს, lxml-ისა და scrapy-splash-ის დაუცველობებს. ანალიტიკოსების თქმით, ამ შემთხვევებში მოდელმა რეალურად შეძლო პრობლემის ლოგიკური ანალიზი და არა უბრალოდ კოდის კოპირება.

უსაფრთხოების ბარიერები

საინტერესოა, რომ ექსპერიმენტის დროს არ გამოვლენილა მოდელის მიერ შინაარსობრივი უარის თქმის (refusal) შემთხვევები. Fable 5-მა დაამუშავა ყველა 200-ვე უსაფრთხოების ამოცანა, კონტენტის პოლიტიკის რაიმე სახის შეზღუდვის გარეშე.

თუმცა, მოდელის მიერ „სწორი გზების“ ძიებამ და ტრენინგის მონაცემების მექანიკურმა გამოყენებამ, კერძოდ, ცნობილი CVE-ების (Common Vulnerabilities and Exposures) კოდების პირდაპირმა რეპროდუცირებამ, კვლევის შედეგები გააუფერულა. ეს მიუთითებს იმაზე, რომ მოდელი ხშირად „იხსენებს“ გამოსავალს, ვიდრე „იგონებს“ მას.

Mechanism	Count	Of which on overly-strict instances
Training recall (memorization)	33	5
Workspace leakage	4	0
Git history	1	0
Total	38	5

რატომ აქვს ამას მნიშვნელობა

საქართველოს ტექნოლოგიური სექტორისთვის, რომელიც სულ უფრო მეტად ეყრდნობა საერთაშორისო AI ინსტრუმენტებს კოდირებაში, მნიშვნელოვანია იცოდეს, რომ ყველაზე პოპულარული მოდელებიც კი მიდრეკილნი არიან მონაცემთა მექანიკური დამახსოვრებისკენ. ეს საფრთხეს უქმნის კოდის უსაფრთხოებას, რადგან დეველოპერმა შესაძლოა ვერ გააცნობიეროს, რომ AI-ს მიერ შემოთავაზებული „გამოსავალი“ უბრალოდ სხვა წყაროდან არის კოპირებული და არა კონტექსტურად შესწორებული.

ხშირად დასმული კითხვები

მოდელმა ვერ აჩვენა მაღალი ეფექტურობა უსაფრთხოების ამოცანებში, ხოლო ფუნქციური ამოცანების შესრულებისას ხშირად ეყრდნობოდა ტრენინგის მონაცემებში არსებულ მზა კოდს.
ეს არის შემთხვევები, როდესაც მოდელი დამოუკიდებელი ლოგიკური მსჯელობის ნაცვლად, ტრენინგის დროს ნანახი კოდის ფრაგმენტებს მექანიკურად იმეორებს.
არა, კვლევის ფარგლებში Fable 5-ს არცერთი ამოცანის შესრულებაზე არ უთქვამს უარი უსაფრთხოების პოლიტიკის გამო.

თეგები#Claude #Anthropic #AI #კიბერუსაფრთხოება #პროგრამირება

ეს ამბავი ვითარდება

188 განახლება · ბოლო 12 ივნისი, 2026

კიბერუსაფრთხოების კრიზისი: AI და კრიპტო საფრთხეები

ტექნოლოგიური სამყარო კიბერუსაფრთხოების მზარდი გამოწვევების წინაშე აღმოჩნდა, სადაც ხელოვნური ინტელექტი როგორც დამცავ, ისე დამანგრეველ ინსტრუმენტად იქცა. კრიპტოინდუსტრია ჰაკერული თავდასხმების, ფიზიკური უსაფრთხოების რისკებისა და კვანტური საფრთხეების ტალღამ მოიცვა, რაც მილიონობით დოლარის ზარალს იწვევს. პარალელურად, ექსპერტები და პროგრამისტები აფრთხილებენ საზოგადოებას AI-ს ბრმად მინდობის საფრთხეებზე, რაც პროგრამული უზრუნველყოფის ხარისხსა და მონაცემთა კონფიდენციალურობას ეჭვქვეშ აყენებს. ეს დინამიკა ნათლად აჩვენებს, რომ ტექნოლოგიური პროგრესი უსაფრთხოების სტრატეგიების გადახედვის გარეშე სერიოზულ სისტემურ რისკებს შეიცავს.