ხელოვნური ინტელექტის ერთ-ერთმა წამყვანმა კომპანიამ, Anthropic-მა, საჯაროდ აღიარა, რომ მის ახალ მოდელში, Claude Fable 5-ში, განხორციელებული ცვლილებები შეცდომა იყო. მომხმარებლებმა პლატფორმაში ფარული ცენზურის ნიშნები აღმოაჩინეს, რამაც საზოგადოების მწვავე რეაქცია გამოიწვია.

რა მოხდა რეალურად?

მომხმარებელთა ნაწილმა შენიშნა, რომ Claude Fable 5 გარკვეულ თემებზე პასუხის გაცემას უარს ეუბნებოდა, მიუხედავად იმისა, რომ მოთხოვნა არ არღვევდა კომპანიის უსაფრთხოების პოლიტიკას. აღმოჩნდა, რომ სისტემაში დანერგილი იყო ფარული მექანიზმები, რომლებიც ავტომატურად ბლოკავდა კონკრეტულ შინაარსს.

კომპანიის განცხადებით, ეს ქმედება მიზნად ისახავდა მოდელის „უსაფრთხოების გაძლიერებას“, თუმცა მათ აღიარეს, რომ ამ პროცესმა დაარღვია გამჭვირვალობის პრინციპი და შეზღუდა მომხმარებლის გამოცდილება.

გამოსწორების გზა და ახალი კითხვები

Anthropic-მა საჯაროდ მოიხადა ბოდიში და პირობა დადო, რომ შეზღუდვებს შეამსუბუქებს. თუმცა, ტექნოლოგიურ საზოგადოებაში უკვე გაჩნდა ეჭვები, რადგან კომპანიის მიერ შემოთავაზებული „გამოსწორების“ მექანიზმი კვლავ ბუნდოვანია.

ექსპერტები აღნიშნავენ, რომ მსგავსი ინციდენტები AI მოდელების სანდოობას უთხრის ძირს. როდესაც კომპანია მომხმარებლისგან მალავს, თუ როგორ ზღუდავს მოდელის შესაძლებლობებს, ეს ნდობის ფაქტორს ამცირებს.

„ჩვენი მიზანია შევქმნათ უსაფრთხო, მაგრამ ღია სისტემები. ვაღიარებთ, რომ ამ კონკრეტულ შემთხვევაში ჩვენი მიდგომა არ იყო გამჭვირვალე“, - ნათქვამია Anthropic-ის განცხადებაში.

მომავალი ნაბიჯები

კომპანია აცხადებს, რომ მომავალში უფრო მეტ ყურადღებას დაუთმობს მომხმარებელთა უკუკავშირს. თუმცა, ბაზარზე კონკურენცია იზრდება და ნებისმიერი ტიპის ცენზურა შეიძლება გახდეს მიზეზი იმისა, რომ მომხმარებლებმა ალტერნატიულ მოდელებზე გადაინაცვლონ.

საბოლოო ჯამში, Anthropic-ის ეს ნაბიჯი კიდევ ერთხელ შეახსენებს ინდუსტრიას, რომ ხელოვნური ინტელექტის განვითარება მხოლოდ ტექნიკური პროცესი არ არის; ეს არის ბალანსის პოვნა უსაფრთხოებასა და თავისუფალ წვდომას შორის.