Google-ის საძიებო სისტემაში ჩაშენებული AI Overview ფუნქცია, რომელიც კომპანიის გენერაციული ხელოვნური ინტელექტის მთავარი პროდუქტია, კვლავ სკანდალში ეხვევა. მომხმარებლები სოციალურ ქსელებში აქტიურად აზიარებენ მტკიცებულებებს იმის შესახებ, თუ როგორ ვერ ახერხებს სისტემა ელემენტარული სიტყვების სწორად დამარცვლას.

შეცდომები, რომლებიც უკვირს მომხმარებელს

მაგალითად, კითხვაზე, თუ რამდენი ასო „p“ არის სიტყვა „Google“-ში, AI პასუხობს, რომ ორი. ანალოგიურად, სისტემამ დაუშვა შეცდომა სიტყვა „journalism“-ის დამარცვლისას, ხოლო აშშ-ის პრეზიდენტის გვარის დაწერისას, „Trump“-ის ნაცვლად გამოიყენა ფორმა „t-r-p-u-m“.

ეს პირველი შემთხვევა არ არის, როდესაც Google-ის AI-მ საზოგადოების კრიტიკა დაიმსახურა. მანამდე, საძიებო სისტემის პასუხები ეყრდნობოდა სატირულ პორტალებს, რის გამოც მომხმარებლებს არასწორ და სახიფათო რჩევებს აძლევდა, მაგალითად, პიცაზე წებოს წასმასთან დაკავშირებით.

რატომ ვერ სწავლობს AI მართლწერას?

Google-ის განცხადებით, მათ იციან, რომ სიტყვებში ასოების დათვლა დიდი ენობრივი მოდელებისთვის (LLM) გამოწვევას წარმოადგენს და პრობლემის გამოსწორებაზე მუშაობენ. თუმცა, მკვლევარები აღნიშნავენ, რომ ეს არ არის მხოლოდ „ტექნიკური ხარვეზი“, არამედ სისტემის არქიტექტურული თავისებურება.

  • ტოკენიზაცია: ხელოვნური ინტელექტი ტექსტს არ კითხულობს ისე, როგორც ადამიანი. ის იყენებს ტოკენებს — რიცხვით კოდებს, რომლებიც შეიძლება იყოს სიტყვის ნაწილი, მარცვალი ან ასო.
  • არქიტექტურული შეზღუდვა: მოდელი ვერ ხედავს სიტყვას, როგორც ასოების თანმიმდევრობას. მისთვის ეს არის მათემატიკური კოდი, რომელშიც ცალკეული ასოები დაკარგულია.

ალბერტას უნივერსიტეტის პროფესორი მეთიუ გუზდაილი განმარტავს, რომ ტრანსფორმატორებზე დაფუძნებული მოდელები არ კითხულობენ ტექსტს, ისინი გარდაქმნიან მას კოდირებად. შესაბამისად, მათ არ გააჩნიათ ინფორმაცია იმის შესახებ, თუ რა ასოებისგან შედგება კონკრეტული სიტყვა.

არის თუ არა ეს გადაჭრადი პრობლემა?

ექსპერტები სკეპტიკურად უყურებენ ამ ხარვეზის სრულად აღმოფხვრას. შერიდან ფოიხტი, ჩრდილო-აღმოსავლეთის უნივერსიტეტის დოქტორანტი, აღნიშნავს, რომ არ არსებობს „იდეალური ტოკენიზატორი“, რადგან სიტყვების დაყოფის პროცესი თავისთავად მოქნილი და ბუნდოვანია. ამიტომ, ხელოვნური ინტელექტის მიერ მართლწერაში დაშვებული შეცდომები, სავარაუდოდ, კიდევ დიდხანს დარჩება ტექნოლოგიური სამყაროს ნაწილად.

მიუხედავად იმისა, რომ ეს პრობლემა სასაცილოდ გამოიყურება, ის გვახსენებს მთავარ ჭეშმარიტებას: ხელოვნური ინტელექტი არ არის ყოვლისმცოდნე. მომხმარებლებმა არ უნდა მიიღონ მისი პასუხები კრიტიკული გადამოწმების გარეშე, რადგან სისტემას, რომელიც რთულ პროგრამულ კოდს წერს, შესაძლოა გაუჭირდეს მარტივი სიტყვის სწორად დაწერა.