RTX 5080 და 3090 ერთ სისტემაში: როგორ მივაღწიოთ 80+ ტოკენს წამში

ენთუზიასტმა ორი სხვადასხვა თაობის ვიდეო ბარათის გაერთიანებით ადგილობრივი LLM-ების წარმადობა რეკორდულად გაზარდა.

გელა ჩიქოვანი

13 ივნისი, 2026 · 15:401 წუთის წასაკითხი

გააზიარე

ადგილობრივი დიდი ენობრივი მოდელების (LLM) გაშვება საკუთარ კომპიუტერზე სულ უფრო პოპულარული ხდება, თუმცა რესურსების ოპტიმიზაცია ხშირად რთულ გამოწვევად რჩება. ერთ-ერთმა ტექნოლოგიურმა ენთუზიასტმა წარმატებით დააკავშირა RTX 5080 და RTX 3090, რათა Qwen 3.6 27B Q8 მოდელის გაშვებისას წამში 80-ზე მეტი ტოკენი მიეღო.

ტექნიკური კონფიგურაცია

თავდაპირველად ავტორმა RTX 5080 გამოიყენა, თუმცა 16GB მეხსიერება თანამედროვე მოდელებისთვის საკმარისი არ აღმოჩნდა. გამოსავალი მეორადი RTX 3090-ის (24GB) დამატება გახდა. სისტემის სტაბილური მუშაობისთვის საჭირო იყო დედაპლატა, რომელიც PCIe 16x არხს ორ 8x-ად გაყოფდა. არჩევანი Asus Prime X570-Pro-ზე შეჩერდა.

BIOS და დრაივერების სირთულეები

პროცესი მოითხოვდა BIOS-ის სპეციფიკურ პარამეტრებს. აუცილებელი იყო OS-ის არა MBR, არამედ UEFI რეჟიმში გაშვება. სხვადასხვა თაობის ბარათების გამოყენების გამო, ავტორმა უარი თქვა ექსპერიმენტულ პატჩებზე და გამოიყენა სტანდარტული nvidia-open დრაივერი.

პროგრამული უზრუნველყოფა და ოპტიმიზაცია

მოდელის გაშვებისთვის საჭირო გახდა კომპილაციისას სწორი დროშების მითითება. კრიტიკულად მნიშვნელოვანი აღმოჩნდა CMAKE_CUDA_ARCHITECTURES="86;120" პარამეტრი, რომელიც ერთდროულად Ampere და Blackwell არქიტექტურებს ააქტიურებს. საინტერესოა, რომ NCCL-ის გამოყენება ამ კონფიგურაციაში კონტრპროდუქტიული აღმოჩნდა.

მოდელი: Qwen 3.6 27B (Q8 quantization)
შედეგი: 80-90 ტოკენი წამში
კავშირი: PCIe 4.0 8x/8x კონფიგურაცია

დასკვნის სახით, ორი განსხვავებული თაობის ბარათის გაერთიანება სავსებით შესაძლებელია, თუ სწორად მოხდება აპარატურული და პროგრამული რესურსების სინქრონიზაცია. ეს მეთოდი იძლევა საშუალებას, ძველი და ახალი თაობის რესურსები მაქსიმალურად ეფექტურად დაიხარჯოს AI ამოცანების შესასრულებლად.

რატომ აქვს ამას მნიშვნელობა

ქართველი მომხმარებლებისთვის, რომლებიც AI ტექნოლოგიებით არიან დაკავებულნი, ეს სტატია მნიშვნელოვანია ხარჯეფექტურობის თვალსაზრისით. საქართველოში მაღალი კლასის GPU-ების შეძენა ძვირია, ამიტომ მეორადი ბაზრის (RTX 3090) და ახალი თაობის ბარათების ერთად გამოყენება არის გზა, როგორ მივიღოთ მაღალი წარმადობა ბიუჯეტური დანახარჯებით.

ხშირად დასმული კითხვები

დიახ, ავტორის გამოცდილებით, nvidia-open დრაივერით ეს შესაძლებელია, თუმცა მოითხოვს სწორ კომპილაციურ პარამეტრებს.
MBR რეჟიმი ზღუდავს ორმაგი GPU კონფიგურაციის გამართულ მუშაობას და საჭიროებს ზედმეტ მანიპულაციებს ბირთვის პარამეტრებში.
სწორი კომპილაციური დროშები (CUDA Architectures) და PCIe არხების სწორი განაწილება 8x/8x რეჟიმში.

თეგები#AI #NVIDIA #RTX5080 #RTX3090 #LLM

ეს ამბავი ვითარდება

394 განახლება · ბოლო 13 ივნისი, 2026

ტექნოლოგიური რევოლუცია: AI-ის განვითარება და SpaceX-ის IPO

ტექნოლოგიური სამყარო მასშტაბური ტრანსფორმაციის პროცესშია, სადაც ხელოვნური ინტელექტის სწრაფი ინტეგრაცია პროგრამირებასა და ყოველდღიურ სერვისებში ახალ გამოწვევებსა და შესაძლებლობებს ბადებს. პარალელურად, ილონ მასკის SpaceX-ის ისტორიული IPO-ს მოლოდინი და კომპანიის ამბიციური ფინანსური გეგმები გლობალურ ბაზარზე დიდ ცვლილებებს აანონსებს. მიუხედავად ინოვაციებისა, სექტორი ებრძვის ინფრასტრუქტურულ შეზღუდვებს, უსაფრთხოების რისკებსა და საზოგადოებრივ სკეპტიციზმს. საბოლოო ჯამში, ინდუსტრია ცდილობს ბალანსის პოვნას ტექნოლოგიურ პროგრესსა და რეალურ სამყაროში არსებულ ეკონომიკურ თუ ეთიკურ გამოწვევებს შორის.