ხელოვნური ინტელექტის (AI) ბუმი აქამდე ერთ მარტივ დაშვებას ეფუძნებოდა: რაც უფრო დიდია მოდელი, მით უფრო მძლავრია ის და გამარჯვებულიც სწორედ ასეთი სისტემებია. თუმცა, ინდუსტრია ახლა იმ ეტაპზეა, როდესაც ეს დაშვება შესაძლოა საფუძველშივე შეიცვალოს.

მზარდი ხარჯების ფონზე, ბიზნესები იძულებულნი გახდნენ, უფრო პატარა და ბიუჯეტურ მოდელებს დააკვირდნენ. ეს ტენდენცია სრულიად ახალია და მისი გავლენა ტექნოლოგიურ სექტორზე, სავარაუდოდ, მასშტაბური იქნება.

პროგნოზი: 80% იაფ მოდელებზე გადადის

Coinbase-ის თანადამფუძნებელმა ბრაიან არმსტრონგმა სოციალურ ქსელ X-ზე გაავრცელა პროგნოზი, რომლის მიხედვითაც, მომდევნო 12-18 თვეში სამუშაო დატვირთვების 80% 99%-ით უფრო იაფ მოდელებზე გადაინაცვლებს. დარჩენილი 20% კვლავ ახალი თაობის, მაღალი ინტელექტის მქონე სისტემებზე იმუშავებს.

თუ ეს პროგნოზი გამართლდა, ეს იქნება სერიოზული დარტყმა ისეთი გიგანტებისთვის, როგორებიც არიან OpenAI და Anthropic. განსაკუთრებით საყურადღებოა, რომ ეს ცვლილება იმ პერიოდს ემთხვევა, როდესაც აღნიშნული კომპანიები IPO-სთვის (პირველადი საჯარო შეთავაზება) ემზადებიან.

ხარისხი vs ეფექტურობა

იურიდიული AI-ინსტრუმენტის, Harvey-ს ცდებმა აჩვენა, რომ სწორი სისტემური მიდგომით, ხარისხის დაკარგვის გარეშე, ხარჯების სამჯერ შემცირება შესაძლებელია. Harvey-მ Fireworks AI-თან პარტნიორობით მოდელები ისე დააკავშირა, რომ რთული ამოცანებისთვის ძლიერ სისტემებს იყენებენ, ხოლო დანარჩენისთვის — უფრო იაფ ვერსიებს.

„ხარისხი პირველ ადგილზეა, თუმცა მისი განსაზღვრება იცვლება“, — განაცხადა Harvey-ს თანადამფუძნებელმა გეიბ პერეირამ. მისი თქმით, მთავარი აღარ არის ყველაზე ძლიერი მოდელის გამოყენება ყველა საქმისთვის; მთავარია, შეარჩიო საუკეთესო მოდელი, რომელიც კონკრეტულ ამოცანას ყველაზე ეფექტურად ასრულებს.

რატომ არის ეს მნიშვნელოვანი?

აქამდე ტექნოლოგიური ლაბორატორიები ერთმანეთს მხოლოდ „სიმძლავრით“ ეჯიბრებოდნენ. ინვესტორების მიერ სუბსიდირებული ფასების პირობებში, მომხმარებელს არ ჰქონდა მოტივაცია, უფრო ეკონომიური ვარიანტები აერჩია. ახლა, როდესაც ტოკენების ფასები იზრდება, ხოლო სუბსიდიები მცირდება, კლიენტები იძულებულნი არიან, ხარჯები ოპტიმიზაციას გაუწიონ.

ეს ტენდენცია აჩენს კითხვას: რამდენად გამართლებულია მომავალში უზარმაზარი რესურსების დახარჯვა ყველაზე მასშტაბური მოდელების ტრენირებაზე, თუ მცირე მოდელები იმავე სამუშაოს თანაბარი ხარისხით ასრულებენ?