Claude Fable 5-მა გამოცდილი პროგრამისტებიც კი გააოცა. სიმონ უილისონის დაკვირვებით, ახალი მოდელი გამოირჩევა „დაუოკებელი პროაქტიულობით“ — ის არ კმაყოფილდება მხოლოდ რჩევების მიცემით და დამოუკიდებლად იღებს ზომებს დასახული მიზნის მისაღწევად.

ექსპერიმენტის დროს, როდესაც უილისონმა მოდელს სთხოვა Datasette Agent-ში არსებული ვიზუალური ხარვეზის (ჰორიზონტალური სქროლბარი) შესწავლა, Claude-მა მოულოდნელი გზები აირჩია. მან დამოუკიდებლად დაიწყო პროექტის დამოკიდებულებების ანალიზი და პრობლემის რეპროდუცირება.

ყველაზე შთამბეჭდავი იყო ის, თუ როგორ „გაატარა“ Claude-მა სისტემაში საკუთარი სკრიპტები. მოდელმა Python-ის მეშვეობით შეძლო კომპიუტერში არსებული ბრაუზერების ფანჯრების იდენტიფიცირება, რათა ეკრანის ანაბეჭდები გადაეღო. მან საკუთარი HTML გვერდებიც კი შექმნა ხარვეზის შესამოწმებლად.

Claude-მა ბრაუზერში კლავიატურის ბრძანებების სიმულაციისთვის კოდიც კი შეცვალა, რათა საჭირო დიალოგური ფანჯარა ავტომატურად გახსნილიყო. მან შექმნა პატარა Python-ზე დაფუძნებული სერვერი, რათა მონაცემები რეალურ დროში შეეგროვებინა და გაეანალიზებინა. შედეგად, მან არა მხოლოდ იპოვა შეცდომა, არამედ შემოგვთავაზა მისი გამოსწორების კონკრეტული გზაც.

მიუხედავად იმისა, რომ პროცესის ბოლოს მოდელმა რესურსების გამო თავი Claude Opus-ზე გადართო, მან შეინარჩუნა დაწყებული სამუშაო და წარმატებით დაასრულა დავალება. ეს შემთხვევა ნათლად აჩვენებს, რომ AI აგენტებს უკვე შეუძლიათ შეასრულონ კომპლექსური ტექნიკური დავალებები, რისთვისაც ადრე ადამიანის მუდმივი ზედამხედველობა იყო საჭირო.

თუმცა, ასეთი ავტონომიურობა უსაფრთხოების კუთხითაც აჩენს კითხვებს. თუ მოდელს შეუძლია ასეთი მასშტაბით მანიპულირება მოახდინოს მომხმარებლის სისტემაზე, ნებისმიერი არასწორი ან მავნე მითითება შეიძლება სერიოზულ საფრთხედ იქცეს. უილისონის თქმით, კოდირების აგენტების ქვიშის ყუთის (sandbox) გარეთ გაშვება კვლავ სარისკო ნაბიჯად რჩება.