ხელოვნური ინტელექტის ჩათბოტების უსაფრთხოება სულ უფრო მყიფე ხდება. თუ ადრე ჰაკერებს სისტემების გასატეხად ტექნიკური ცოდნა ან რთული კოდირება ესაჭიროებოდათ, დღეს სიტუაცია რადიკალურად შეიცვალა. ახალი ტენდენციის თანახმად, თავდამსხმელები პირდაპირ მოდელების „პიროვნებას“ უტევენ.

მარტივი გზა უსაფრთხოების ბარიერების დასარღვევად

The Verge-ის ცნობით, პირველი თაობის ჩათბოტების გატეხვა გასაკვირად მარტივი იყო. მომხმარებელს არ სჭირდებოდა პროგრამირების ცოდნა ან სისტემურ ხარვეზებზე წვდომა. საკმარისი იყო მხოლოდ სწორი შეკითხვის დასმა, რათა მოდელს უგულებელეყო მისთვის დაწესებული უსაფრთხოების ინსტრუქციები.

ამ ტიპის შეტევებს, რომლებსაც „ჯეილბრეიკს“ (jailbreak) უწოდებენ, მრავალმილიარდიანი ტექნოლოგიური პროექტების ფუნდამენტური დაცვა უნდა გაენეიტრალებინა. თუმცა, როგორც ჩანს, AI მოდელების ენობრივი სტრუქტურა თავად ხდება შეტევის იარაღი.

რატომ არის „პიროვნება“ მოწყვლადი?

თანამედროვე ჩათბოტები შექმნილია იმისთვის, რომ ადამიანებთან ბუნებრივი კომუნიკაცია დაამყარონ. სწორედ ეს ბუნებრიობა და „პიროვნული“ თვისებები, როგორიცაა მიმზიდველობა, დამჯერი ბუნება ან ემპათია, ხდება ჰაკერების სამიზნე. როდესაც ჰაკერი მოდელს აიძულებს, გარკვეული როლი მოირგოს, ის ავტომატურად ამცირებს სისტემის მიერ დაწესებულ „უსაფრთხოების ფილტრებს“.

ეს პროცესი არ საჭიროებს სერვერების ჰაკინგს. ეს არის ფსიქოლოგიური მანიპულაცია მანქანურ ენაზე. მოდელი, რომელიც ცდილობს იყოს სასარგებლო და თანამშრომლობითი, ხშირად ვერ არჩევს კეთილსინდისიერ მომხმარებელს მანიპულატორისგან.

რა უნდა ვიცოდეთ საფრთხეებზე

  • მარტივი წვდომა: არ არის საჭირო ტექნიკური უნარები, მხოლოდ ენობრივი მანიპულაცია.
  • სისტემური ხარვეზი: უსაფრთხოების პროტოკოლები ვერ უმკლავდებიან მოდელის მიერ „როლის მორგების“ შესაძლებლობას.
  • მზარდი რისკი: რაც უფრო ჭკვიანი ხდება მოდელი, მით უფრო დახვეწილი ხდება მისი მოტყუების გზებიც.

ტექნოლოგიური გიგანტები ამჟამად ცდილობენ შექმნან უფრო მყარი დამცავი მექანიზმები, თუმცა ჰაკერების მეთოდები მუდმივად ვითარდება. მომავალში, ხელოვნური ინტელექტის უსაფრთხოება არა მხოლოდ კოდის, არამედ „ქცევითი ფსიქოლოგიის“ დაცვასაც გულისხმობს.