ხელოვნური ინტელექტის განვითარება ახალი გამოწვევის წინაშეა. Financial Times-ისა და უსაფრთხოების ჯგუფ Alice-ის ერთობლივმა ტესტირებამ აჩვენა, რომ Meta-სა და Google-ის მიერ შემუშავებული ღია კოდის მოდელების უსაფრთხოების ფილტრები სულ რაღაც 10 წუთში იხსნება. ამისთვის საჭირო არ არის სპეციალიზებული აპარატურა — საკმარისია საჯაროდ ხელმისაწვდომი პროგრამული ინსტრუმენტები.
რა საფრთხეს ქმნის დაცვის სისტემების მოხსნა?
ტესტირების შედეგად, მოდიფიცირებულმა სისტემებმა დაიწყეს ისეთი მოთხოვნების შესრულება, რომლებზეც თავდაპირველად უარს ამბობდნენ. მათ შორის იყო ინსტრუქციები მავნე პროგრამების შექმნაზე, ქიმიური საფრთხეების შესახებ ინფორმაციასა და ბიოლოგიურ იარაღთან დაკავშირებულ საკითხებზე. ეს ადასტურებს, რომ დეველოპერების მიერ ჩადებული უსაფრთხოების მექანიზმები მოდელის გავრცელების შემდეგ სუსტდება.
რეგულაციების კრიზისი
არსებული სამართლებრივი ჩარჩოები, როგორიცაა ევროკავშირის AI Act, ძირითადად მოდელის შექმნის ეტაპზეა ფოკუსირებული. თუმცა, როგორც ექსპერტები აღნიშნავენ, მას შემდეგ, რაც მოდელის „წონები“ (weights) საჯარო ხდება, მისი კონტროლი შეუძლებელი ხდება. ღია კოდის სისტემების ჩამოტვირთვა და მოდიფიცირება ნებისმიერ მსურველს შეუძლია, რაც ტრადიციულ რეგულაციებს უსარგებლოს ხდის.
„როგორც კი მოდელები საჯარო სივრცეში ხვდება, კონტროლი მყისიერად იკარგება“, — აცხადებს XYO-ს თანადამფუძნებელი მარკუს ლევინი.
სად უნდა გადავიდეს აქცენტი?
ექსპერტების ნაწილი მიიჩნევს, რომ პოლიტიკოსებმა ყურადღება მოდელის დიზაინიდან დისტრიბუციის არხებზე უნდა გადაიტანონ. CertiK-ის აღმასრულებელი დირექტორი რონგჰუი გუ თვლის, რომ რეგულაციები უფრო ეფექტიანი იქნება კომერციული ჰოსტინგისა და საწარმოო დანერგვის ეტაპებზე. მისი თქმით, უსაფრთხოების სტანდარტები უნდა ვითარდებოდეს ისე, რომ შესაძლებელი იყოს მავნე ქცევის იდენტიფიცირება რეალურ დროში, მესამე მხარის ხელსაწყოების გამოყენებისას.
საბოლოო ჯამში, დებატები იმის შესახებ, თუ ვინ არის პასუხისმგებელი AI-ს უსაფრთხოებაზე, გრძელდება. ნათელია, რომ მხოლოდ დეველოპერების მიერ დაწესებული შეზღუდვები საკმარისი აღარ არის, რადგან ტექნოლოგიური პროგრესი და ინფორმაციის თავისუფალი გავრცელება არღვევს ძველ მოდელებზე აგებულ უსაფრთხოების ბარიერებს.






დისკუსია
0 კომენტარი
ჯერ კომენტარი არ არის — იყავი პირველი.