თანამედროვე ხელოვნური ინტელექტის განვითარება ძირითადად ეყრდნობა ტრანსფორმერულ არქიტექტურას, თუმცა მეცნიერებმა ამ სისტემების კრიტიკული ხარვეზი გამოავლინეს. PNAS Nexus-ში გამოქვეყნებული კვლევა მიუთითებს, რომ ე.წ. „ყურადღების მექანიზმი“ (attention mechanism), რომელიც ამ მოდელების საფუძველია, ვერ ახერხებს სათანადო აღმასრულებელ კონტროლს.

რა არის აღმასრულებელი კონტროლის დეფიციტი?

ადამიანური აზროვნებისგან განსხვავებით, სადაც აღმასრულებელი ფუნქციები გვეხმარება მიზნების დასახვაში, პრიორიტეტების განსაზღვრასა და ამოცანების თანმიმდევრულ შესრულებაში, ტრანსფორმერები ამას ვერ ახერხებენ. კვლევის თანახმად, მოდელები ინფორმაციას სტატისტიკური ალბათობებით ამუშავებენ, მაგრამ მათ აკლიათ „ზედამხედველის“ ფუნქცია.

ეს ნიშნავს, რომ კომპლექსური დავალებების შესრულებისას სისტემამ შეიძლება დაკარგოს კონტექსტი ან უგულებელყოს მნიშვნელოვანი დეტალები. ტრანსფორმერები არ ფლობენ შიდა მექანიზმს, რომელიც მიღებულ ინფორმაციას დასახული მიზნის შესაბამისად გაფილტრავს და დააკორექტირებს.

პრობლემის ტექნიკური მხარე

  • სტრუქტურული შეზღუდვები: ყურადღების მექანიზმი ორიენტირებულია მონაცემთა შორის კავშირების პოვნაზე და არა გადაწყვეტილების მიღების პროცესის მართვაზე.
  • კონტექსტური ბრმად ყოფნა: მოდელს არ შეუძლია დინამიურად შეცვალოს თავისი სტრატეგია, თუ დავალების პირობები შეიცვლება.
  • ლოგიკური წყვეტები: აღმასრულებელი კონტროლის გარეშე, მოდელი ხშირად „ჰალუცინაციებს“ აკეთებს ან ეწინააღმდეგება საკუთარ დასკვნებს.

კვლევის ავტორები ხაზს უსვამენ, რომ ეს არ არის მხოლოდ პროგრამული შეცდომა, არამედ არქიტექტურული ხარვეზი. ტრანსფორმერები შექმნილია მონაცემთა მასიური დამუშავებისთვის და არა მიზანმიმართული მსჯელობისთვის.

მომავლის გამოწვევები

მიუხედავად იმისა, რომ ტრანსფორმერებმა რევოლუცია მოახდინეს ენობრივ მოდელებში, აღმასრულებელი კონტროლის დეფიციტი მათ გამოყენებას საპასუხისმგებლო სფეროებში ართულებს. ავტონომიური სისტემები ან გადაწყვეტილების მიმღები AI აგენტები ამ ხარვეზის გამო რისკის ქვეშ რჩებიან.

სამეცნიერო საზოგადოება ახლა ეძებს გზებს, თუ როგორ შეიძლება არსებულ არქიტექტურას დაემატოს კონტროლის დამატებითი ფენა. თუმცა, ჯერჯერობით უცნობია, შესაძლებელია თუ არა ამის გაკეთება ტრანსფორმერების ფუნდამენტური პრინციპების შეცვლის გარეშე.