ნორვეგია საკუთარ LLM-ს ქმნის: 2 პეტაბაიტი Huawei-ს მეხსიერება

ნორვეგიის ეროვნული ბიბლიოთეკა ქვეყნის კულტურული მემკვიდრეობის დასაცავად და ხელოვნური ინტელექტის განსავითარებლად მასშტაბურ პროექტს იწყებს.

SPREEDi

25 მაისი, 2026 · 20:262 წუთის წასაკითხი

ნორვეგიის ეროვნული ბიბლიოთეკის სერვერული სისტემა — ფოტო: Hacker News

გააზიარე

ნორვეგიის ეროვნული ბიბლიოთეკა (Nasjonalbiblioteket) საკუთარი ენის მქონე დიდი ენობრივი მოდელის (LLM) შექმნაზე მუშაობს. პროექტის მიზანია, ქვეყანამ თავიდან აიცილოს დამოკიდებულება საერთაშორისო, ძირითადად ინგლისურენოვან AI მოდელებზე, რომლებიც ნორვეგიულ კულტურულ კონტექსტს, ისტორიასა და ნიუანსებს ვერ ფარავენ.

ტექნოლოგიური გამოწვევა და Huawei-ს როლი

პროექტის ხელმძღვანელი მარიუს ჰუსნესი აღნიშნავს, რომ მთავარი შემაფერხებელი ფაქტორი არა გამოთვლითი სიმძლავრე, არამედ მონაცემთა ხარისხი და მათი დამუშავების პროცესია. ამ მიზნით, ბიბლიოთეკამ Huawei-ს OceanStor Dorado ფლეშ-მეხსიერების სისტემები შეარჩია, რომელთა საერთო მოცულობა 2 პეტაბაიტს შეადგენს.

ეს სისტემა უზრუნველყოფს მონაცემთა მილსადენის (pipeline) მაღალ გამტარობასა და დაბალ ლატენტურობას, რაც აუცილებელია მონაცემთა გასაწმენდად, დუბლიკატების მოსაშორებლად და ფორმატის ნორმალიზებისთვის.

მონაცემთა მასშტაბები და არქივირება

ბიბლიოთეკა 2005 წლიდან ახორციელებს კოლექციების ციფრულ ფორმატში გადატანას. დღეისთვის დაგროვილია 20 პეტაბაიტი უნიკალური მონაცემი, რაც სარეზერვო ასლების გათვალისწინებით 60 პეტაბაიტამდე აღწევს. ეს მონაცემები მოიცავს წიგნებს, გაზეთებს, ვებგვერდებს, აუდიო და ვიდეო მასალებს.

მონაცემთა მომზადების შემდეგ, პროცესი ნორვეგიის ეროვნულ სუპერკომპიუტერზე, Sigma2 Olivia-ზე გადადის. ეს სისტემა აღჭურვილია 448 გრაფიკული პროცესორით (GPU) და 64,512 CPU ბირთვით.

AI-ს სჭირდება პატრონები და არა მხოლოდ შემქმნელები, - აცხადებს მარიუს ჰუსნესი.

რატომ არის ეს პროექტი უნიკალური?

ნორვეგიული მოდელის უპირატესობა საავტორო უფლებებით დაცულ კონტენტზე წვდომაშია. ბიბლიოთეკამ მიაღწია შეთანხმებას ადგილობრივ მედიასთან, რაც მათ საშუალებას აძლევს, მოდელი გაწვრთნან ისეთ მასალებზე, რომლებზეც კერძო კომპანიებს ხელი არ მიუწვდებათ.

ჰუსნესის განცხადებით, ნორვეგია პატარა ქვეყანაა, რომელიც იმ გამოწვევას პასუხობს, რომლის წინაშეც ყველა არასაენგლისურენოვანი ერი დგას: როგორ შევქმნათ AI, რომელიც რეალურად ასახავს ჩვენს ენას, ისტორიასა და ღირებულებებს.

რატომ აქვს ამას მნიშვნელობა

ქართული ენის ციფრული მომავლისთვის ნორვეგიის გამოცდილება კრიტიკულად მნიშვნელოვანია. საქართველო, ისევე როგორც ნორვეგია, მცირე ენობრივი არეალის მქონე ქვეყანაა, რომლისთვისაც გლობალური AI მოდელები ხშირად არასრულფასოვანია. ეს მაგალითი გვიჩვენებს, რომ სუვერენული AI-ს შექმნა არ მოითხოვს მხოლოდ უზარმაზარ ფულს, არამედ კულტურული მონაცემების სისტემურ დაცვას, დამუშავებასა და სახელმწიფოებრივ ხედვას.

თეგები#ხელოვნური ინტელექტი #ნორვეგია #Huawei #ტექნოლოგიები #LLM

ხშირად დასმული კითხვები

საერთაშორისო მოდელებს არ გააჩნიათ ნორვეგიული კულტურული, ისტორიული და ენობრივი სიღრმე, რაც აუცილებელია ქვეყნის სუვერენული ციფრული გარემოსთვის.
მონაცემთა დამუშავების მილსადენს სჭირდება უაღრესად მაღალი სიჩქარე და დაბალი ლატენტურობა, რასაც ტრადიციული საარქივო სისტემები ვერ უზრუნველყოფენ.
მოდელი იწვრთნება ბიბლიოთეკის მიერ დაცულ წიგნებზე, გაზეთებზე, ვებგვერდებსა და მულტიმედიურ მასალებზე, მათ შორის საავტორო უფლებებით დაცულ კონტენტზე.

დისკუსია

0 კომენტარი

ჯერ კომენტარი არ არის — იყავი პირველი.

გააგრძელე კითხვა

მეტი ტექნოლოგია

თანამედროვე მაღალი ტექნოლოგიების მიკროსქემა და პროცესორი

ტექნოლოგია

ტექნოლოგიური გამოწვევა და Huawei-ს როლი

მონაცემთა მასშტაბები და არქივირება

რატომ არის ეს პროექტი უნიკალური?

ხშირად დასმული კითხვები

გააგრძელე კითხვა

ხელოვნური ინტელექტის ჩიპების ფასი: რატომ ძვირდება მეხსიერება?

Nvidia ახალ, 200-მილიარდიან ბაზარს იპყრობს: ჯენსენ ჰუანგის ახალი გეგმა

შეძლებს თუ არა ხელოვნური ინტელექტი რეალური სამყაროს აღქმას?

Spotify და Universal Music ხელოვნური ინტელექტის რემიქს-ხელსაწყოს უშვებენ