თანამედროვე მანქანური სწავლების დატვირთვების უმეტესობა გრაფიკულ პროცესორებზე (GPU) სრულდება. მიუხედავად იმისა, რომ GPU-ები ეფექტურია პარალელური გამოთვლებისთვის, ისინი ვერ აკმაყოფილებენ ულტრა-დაბალი შეყოვნების მოთხოვნებს, რაც კრიტიკულია გარკვეული სპეციალიზებული აპლიკაციებისთვის. აქ ერთვება FPGA (Field-Programmable Gate Array) ტექნოლოგია.

Input ($x,y$)$x\text{ AND }y$
000
010
100
111
\(q_{l-1}(x_l)\)\(q_l(x_{l+1})\)
00000
01011
10100
11111

FPGA არის კონფიგურირებადი ციფრული ლოგიკური მოწყობილობა, რომელიც საშუალებას იძლევა, ნეირონული ქსელები პირდაპირ ციფრულ ლოგიკად გარდაიქმნას. ეს მიდგომა გამორიცხავს პროცესორებისთვის დამახასიათებელ შეფერხებებს, როგორიცაა ინსტრუქციების დაგეგმვა და მეხსიერებაზე დინამიური წვდომა.

კვლევის ავტორებმა ყურადღება გაამახვილეს Kolmogorov-Arnold Networks-ის (KAN) არქიტექტურაზე. ტრადიციული მრავალშრიანი პერცეპტრონებისგან (MLP) განსხვავებით, KAN იყენებს სასწავლ აქტივაციის ფუნქციებს, რაც მას LUT-ზე დაფუძნებული ნეირონული ქსელებისთვის (LUT-NN) იდეალურ კანდიდატად აქცევს.

KAN-ის არქიტექტურა საშუალებას იძლევა, მრავალგანზომილებიანი ფუნქციები დაიშალოს უნივარიანტულ კომპონენტებად. ეს კი თავიდან გვაცილებს ექსპონენციალურ სირთულეს, რაც ხშირად ახასიათებს LUT-ზე დაფუძნებულ მიდგომებს. შედეგად, მოდელი ხდება უფრო რესურს-ეფექტური და ადვილად სწავლადი.

კვლევის ფარგლებში შემუშავდა არქიტექტურა, რომელიც წინასწარ გაწვრთნილ KAN-ებს FPGA-ზე ახორციელებს. პროცესი იყენებს ფიქსირებული წერტილის კვანტიზაციას და აქტივაციის ფუნქციების პარალელურ გამოთვლას.

შედეგები შთამბეჭდავია: ახალი ჩარჩო 2700-ჯერ უფრო სწრაფია, ვიდრე წინა KAN-FPGA განხორციელებები. ეს მიღწევა განსაკუთრებით მნიშვნელოვანია ისეთ სფეროებში, როგორიცაა კვანტური კონტროლი ან ბირთვული ფიზიკა, სადაც საჭიროა მოდელის ადაპტაცია მიკროწამებზე ნაკლებ დროში.

ავტორები აგრძელებენ მუშაობას ონლაინ-სწავლების მიმართულებით, სადაც FPGA-ს მეხსიერება პირდაპირ იცვლება შემომავალი მონაცემების შესაბამისად. ეს ნიშნავს, რომ მოდელი არა მხოლოდ ასრულებს დასკვნებს, არამედ რეალურ დროში სწავლობს ახალ ინფორმაციას.