დღევანდელი ხელოვნური ინტელექტის ეკოსისტემა არაეფექტურობის მახეშია გაბმული. როდესაც სხვადასხვა AI აგენტი ერთსა და იმავე დოკუმენტს კითხულობს, თითოეული მათგანი პროცესს ნულიდან იწყებს. ისინი ხელახლა ატარებენ ე.წ. prefill პროცედურას — ყველაზე რესურსტევად ეტაპს, რათა ააგონ Key-Value (KV) ქეში. შედეგად, ერთი და იგივე ინფორმაცია მილიონჯერ ითვლება, რაც აბსურდულ ხარჯებს და ენერგიის ფლანგვას იწვევს.
ახალი კვლევა, რომელიც arXiv-ზე გამოქვეყნდა, გვთავაზობს მარტივ, მაგრამ რადიკალურ გამოსავალს: გამოვთვალოთ ერთხელ და გამოვიყენოთ მრავალჯერ. ავტორების იდეა მდგომარეობს იმაში, რომ გამომცემელმა ან პროვაიდერმა წინასწარ დააგენერიროს დოკუმენტის KV ქეში, ხოლო სხვა აგენტებმა შეიძინონ მასზე წვდომის უფლება. ეს საშუალებას მისცემს მათ, სრულად გამოტოვონ prefill ეტაპი.
ტექნიკური თვალსაზრისით, ეს მეთოდი იდეალურად ზუსტია. წინასწარ გამოთვლილი ქეშის ჩატვირთვა არანაირ გავლენას არ ახდენს შედეგის სიზუსტეზე — ის იდენტურია ნულიდან დაწყებული გამოთვლისა. Qwen3-4B მოდელზე ჩატარებულმა ტესტებმა აჩვენა, რომ ქეშის ხელახალი გამოყენება 9-დან 50-ჯერ უფრო იაფია, ვიდრე თავიდან გამოთვლა. რაც უფრო გრძელია დოკუმენტი, მით უფრო იზრდება ეკონომია, რადგან prefill-ის ყურადღების მექანიზმი კვადრატულად მასშტაბირდება.
პრობლემა: სად შევინახოთ მონაცემები?
მკვლევრები აღნიშნავენ, რომ KV ქეშის პირდაპირი გადაგზავნა მომხმარებელთან ეფექტური არ არის, რადგან ის რთულად იკუმშება და მისი გადაცემის ხარჯები ხშირად აღემატება დაზოგილი გამოთვლის ღირებულებას. გამოსავალი არის მონაცემების პროვაიდერის სერვერებზე შენახვა, რაც სრულად ხსნის ტრაფიკის ხარჯებს.
| Subjects: | Artificial Intelligence (cs.AI); Computational Engineering, Finance, and Science (cs.CE); Multiagent Systems (cs.MA) |
| Cite as: | arXiv:2606.13361 [cs.AI] |
| (or arXiv:2606.13361v1 [cs.AI] for this version) | |
| https://doi.org/10.48550/arXiv.2606.13361 arXiv-issued DOI via DataCite (pending registration) |
შედეგები შთამბეჭდავია: 3774-ტოკენიანი დოკუმენტის 80 მილიონ აგენტთან დამუშავება, ტრადიციული მეთოდით, დაახლოებით 1.5 მილიონი დოლარი ჯდება. ახალი მეთოდით, ეს ხარჯი 0.03 მილიონამდე მცირდება. ეს ქმნის შესაძლებლობას, შეიქმნას „აგენტზე ორიენტირებული prefill CDN“ (Content Delivery Network), რომელიც ხელოვნური ინტელექტის მომსახურების ფასს რადიკალურად შეამცირებს.





დისკუსია
0 კომენტარი
ჯერ კომენტარი არ არის — იყავი პირველი.