ხელოვნური ინტელექტისა და მაღალი წარმადობის გამოთვლითი სისტემების (HPC) სფეროში ინფრასტრუქტურული რესურსების დეფიციტი და მაღალი ხარჯები მთავარ გამოწვევად რჩება. სისტემური შეფერხებები კომპანიებს დიდ ფინანსურ დანაკარგებს აყენებს, რის გამოც კლასტერების მაქსიმალური პროდუქტიულობა კრიტიკულად მნიშვნელოვანია.
ამ პრობლემის გადასაჭრელად, Y Combinator-ის სტარტაპი Cedana ავტომატურ სისტემებს ავითარებს. კომპანიის ტექნოლოგია საშუალებას იძლევა, GPU-ზე დატვირთული სამუშაო პროცესები შეუფერხებლად და სწრაფად გადავიდეს სხვადასხვა ინსტანციებს შორის, სამუშაოს დაკარგვის გარეშე.
როგორ მუშაობს Cedana?
სისტემა ფუნქციონირებს ოპერაციული სისტემისა და ბირთვის (kernel) დონეზე. ეს ნიშნავს, რომ მომხმარებელს არ უწევს პროგრამული კოდის ან კონფიგურაციის შეცვლა. გადაწყვეტა სრულად თავსებადია ისეთ პლატფორმებთან, როგორებიცაა Kubernetes, SLURM და NVIDIA Dynamo.
Cedana-ს გუნდი აცხადებს, რომ მათი მიზანია გამოთვლითი რესურსების განაწილების პარადიგმის შეცვლა. კომპანიის დამფუძნებლები ათწლეულზე მეტია მუშაობენ AI-ს სფეროში, მათ შორის ისეთ მნიშვნელოვან პროექტებზე, როგორიცაა რობოტების ფლოტის მართვა და განაწილებული სწავლების ფორმალური მეთოდები.
ვაკანსია: Forward Deployed Engineer
ამჟამად სტარტაპი აქტიურად ეძებს ინჟინერს, რომელიც უშუალოდ იმუშავებს კლიენტებთან. როლი მოიცავს ტექნიკური პროცესების სრულ ციკლს: უნივერსიტეტების SLURM კლასტერებიდან დაწყებული, Fortune 100-ის ფარმაცევტული კომპანიების ჰიბრიდული ინფრასტრუქტურით დასრულებული.
- პასუხისმგებლობა: SLURM პლაგინები, Kubernetes-ის ოპერატორები, ქსელური კონფიგურაცია და მონიტორინგი.
- გამოცდილება: სისტემური დონის ცოდნა და AI ინფრასტრუქტურაში მუშაობის სურვილი.
Cedana უკვე ნერგავს თავის გადაწყვეტას წამყვან inference პლატფორმებსა და კვლევით ცენტრებში. მათი მიდგომა მიმართულია გამოთვლითი პროცესების პაუზის, მიგრაციისა და განახლებისკენ, რაც საბოლოოდ აჩქარებს კვლევის შედეგების მიღებას.







დისკუსია
0 კომენტარი
ჯერ კომენტარი არ არის — იყავი პირველი.