კომპანია Anthropic-მა ახალი ხელოვნური ინტელექტის მოდელი, Fable, წარადგინა. ის თავისი ძლიერი და რეზონანსული კიბერუსაფრთხოების მოდელის, Mythos-ის საჯარო და შეზღუდულ ვერსიას წარმოადგენს. თუმცა, გამოშვებიდან მალევე, მოდელმა კიბერუსაფრთხოების სფეროს პროფესიონალების უკმაყოფილება გამოიწვია.
სპეციალისტების თქმით, Fable-ის უსაფრთხოების ფილტრები ზედმეტად მკაცრია. მოდელი უარს ამბობს ნებისმიერი ტიპის მოთხოვნის დამუშავებაზე, რომელიც მცირედით მაინც უკავშირდება კიბერუსაფრთხოებას. IBM X-Force-ის მკვლევარი ვალენტინა პალმიოტი აღნიშნავს, რომ სისტემა უარს ამბობს ისეთ უწყინარ დავალებებზეც კი, როგორიცაა ბლოგპოსტის წაკითხვა.
რატომ ბლოკავს სისტემა ყველაფერს?
როდესაც მომხმარებლის მოთხოვნა ფილტრს ააქტიურებს, ჩეთი წყდება. Fable ავტომატურად აცხადებს, რომ შეტყობინება „კიბერუსაფრთხოების ან ბიოლოგიის თემების გამო დაიბლოკა“. Anthropic-ის მიზანია, თავიდან აიცილოს მავნე პროგრამების შექმნა ან კრიტიკული პროგრამული უზრუნველყოფის დაზიანება.
ბიოლოგიური უსაფრთხოების შეზღუდვები კი ბიოლოგიური იარაღის განვითარების პოტენციურ საფრთხეებს უკავშირდება. თუმცა, ექსპერტები ფილტრების მუშაობის პრინციპს „ქაოტურს“ უწოდებენ. კიბერუსაფრთხოების ვეტერანი მეტ სუიში განმარტავს, რომ თუ მოდელს უსაფრთხო კოდის დაწერას სთხოვთ, ის ამას ავტომატურად კიბერშეტევასთან აიგივებს და უარს ამბობს შესრულებაზე.
ტექნიკური ხარვეზები და ალტერნატივები
მოდელი დაპროგრამებულია ისე, რომ თუ ფილტრი გააქტიურდა, ის ავტომატურად გადაერთოს Claude Opus 4.8-ზე. პრობლემა კი ისაა, რომ სისტემა, სავარაუდოდ, საკვანძო სიტყვებზე დაყრდნობით მუშაობს. ნებისმიერი ტერმინი, რომელიც კიბერუსაფრთხოების ლექსიკონს მიეკუთვნება, ფილტრს რთავს.
- მკვლევრები აღნიშნავენ, რომ კოდის შემოწმების მოთხოვნაც კი ბლოკირებას იწვევს.
- Anthropic-ს ჯერჯერობით ოფიციალური კომენტარი არ გაუკეთებია.
- პროფესიონალებისთვის არსებობს Cyber Verification Program, რომელიც მეტ თავისუფლებას იძლევა.
მიუხედავად კრიტიკისა, ზოგიერთი ექსპერტი აღიარებს, რომ ეს ტექნოლოგიური განვითარების ადრეული ეტაპია. სუიშის თქმით, უმჯობესია, სისტემამ ზედმეტად ბევრი მოთხოვნა დაბლოკოს, ვიდრე უსაფრთხოების ხარვეზები დაუშვას, თუმცა დროთა განმავლობაში ფილტრები აუცილებლად დაიხვეწება.






დისკუსია
0 კომენტარი
ჯერ კომენტარი არ არის — იყავი პირველი.