Google DeepMind-მა განგაშის ზარი შემოჰკრა. კომპანია მოუწოდებს სამეცნიერო საზოგადოებას, დროულად შეისწავლონ ის რისკები, რომლებიც მილიონობით ავტონომიური ხელოვნური ინტელექტის აგენტის ურთიერთქმედებას უკავშირდება. საუბარია სისტემებზე, რომლებსაც ადამიანის ზედამხედველობის გარეშე შეუძლიათ ამოცანების შესრულება და სხვა აგენტებისგან ინსტრუქციების მიღება.

ახალი კლასის საფრთხეები

როჰინ შაჰი, Google DeepMind-ის ხელოვნური ინტელექტის უსაფრთხოების მიმართულების დირექტორი, განმარტავს, რომ აგენტების მასობრივი დანერგვა რისკების სრულიად ახალ კატეგორიას ქმნის. როდესაც ასეთი სისტემები ერთმანეთთან იწყებენ კომუნიკაციას, შესაძლოა მივაღწიოთ „გარდატეხის წერტილს“, სადაც თეორიული საფრთხეები რეალობად იქცევა.

სპეციალისტები მიიჩნევენ, რომ რისკები ძირითადად უკავშირდება ინტერნეტში უკვე არსებული პრობლემების, მაგალითად, თაღლითობებისა და კიბერშეტევების „სუპერ-ვერსიებს“. განსაკუთრებით საშიშია ე.წ. prompt injection-ის შემთხვევები, როდესაც აგენტი იღებს მავნე ინსტრუქციას და გარდაიქმნება თვითმართვად მავნე პროგრამად.

10 მილიონი დოლარი უსაფრთხოებისთვის

ამ გამოწვევებთან გასამკლავებლად, Google DeepMind-მა 10 მილიონი დოლარის ფონდი შექმნა. ინიციატივას უერთდებიან Schmidt Sciences, ბრიტანეთის მთავრობის სააგენტო ARIA, Cooperative AI Foundation და Google.org. მიზანი აკადემიური წრეების ჩართვაა, რადგან ინდუსტრიული ლაბორატორიებისგან განსხვავებით, მეცნიერებს აქვთ შესაძლებლობა, გრძელვადიან პერსპექტივაზე ფოკუსირდნენ.

„ჩვენ გვაქვს ციფრული სივრცე, რომელიც საზოგადოების ფუნქციონირებისთვის კრიტიკულად მნიშვნელოვანია. ჩვენ უნდა დავრწმუნდეთ, რომ ეს სისტემა აბსოლუტურ ანარქიაში არ გადაიზრდება,“ — აცხადებს ჯეიმს ფოქსი, Schmidt Sciences-ის წარმომადგენელი.

რატომ ვერ ვმართავთ აგენტებს ინდივიდუალურად?

ექსპერტები თანხმდებიან, რომ ერთი აგენტის ან მცირე ჯგუფის შესწავლა საკმარისი არ არის. საფრთხე კომპლექსურობაშია: როდესაც სისტემები მასშტაბურად ურთიერთქმედებენ, მათი ქცევა ხშირად არაპროგნოზირებადი ხდება. აგენტები არ მოქმედებენ მხოლოდ რაციონალურად; ისინი მსჯელობენ, იმპროვიზირებენ და შესაძლოა ადვილად იქნენ გატეხილი.

კიბერუსაფრთხოების სპეციალისტი რაფაელ ანჯელი აღნიშნავს, რომ ტრადიციული უსაფრთხოების მოდელები, რომლებიც ადამიანის მიერ დაწერილ ფიქსირებულ კოდზე იყო დაფუძნებული, აგენტების ეპოქაში მწყობრიდან გამოდის. „აგენტი არღვევს ყველა ძველ ვარაუდს, რადგან მას შეუძლია საკუთარი ქცევის შეცვლა,“ — ამბობს ის.

მიუხედავად იმისა, რომ ზოგიერთი მკვლევარი ამ რისკებს ჰიპოთეტურს უწოდებს, DeepMind-ის გუნდი დარწმუნებულია: მომავალი იმაზე სწრაფად მოდის, ვიდრე ველოდით. კვლევის მთავარი მეთოდი კი რეალისტური სიმულაციები იქნება, სადაც აგენტებს „სენდბოქს“ გარემოში გამოსცდიან.