ხელოვნური ინტელექტის სფეროში ახალი ერა იწყება: PrismML-მა წარმოადგინა Bonsai Image 4B, მოდელების ოჯახი, რომელიც სპეციალურად შექმნილია პერსონალურ მოწყობილობებზე მაღალი ხარისხის გამოსახულებების გენერირებისთვის.
ტრადიციულად, ასეთი ტიპის მოდელები დიდ სერვერულ რესურსებს საჭიროებდნენ, თუმცა Bonsai Image 4B-ის არქიტექტურა საშუალებას იძლევა, პროცესი პირდაპირ სმარტფონებსა და კომპიუტერებზე წარიმართოს.
| Model | Diffusion Transformer | Reduction vs FP16 |
|---|---|---|
| FLUX.2 Klein 4B | 7.75 GB | 1.0x |
| 1-bit Bonsai Image 4B | 0.93 GB | 8.3x |
| Ternary Bonsai Image 4B | 1.21 GB | 6.4x |
მოდელები ორ ვარიანტად გამოდის: 1-ბიტიანი და ტერნარული (სამმაგი). 1-ბიტიანი ვერსია ორიენტირებულია მაქსიმალურ შეკუმშვაზე, რაც მას იდეალურს ხდის შეზღუდული მეხსიერების მქონე მოწყობილობებისთვის. მეორე, ტერნარული ვარიანტი, გვთავაზობს ბალანსს კომპაქტურობასა და ვიზუალურ ხარისხს შორის.
ტექნოლოგიური თვალსაზრისით, ეს მიღწევა FLUX.2 Klein 4B არქიტექტურის ოპტიმიზაციას ეფუძნება. 1-ბიტიანი ვერსია ორიგინალთან შედარებით 8.3-ჯერ უფრო მცირე ზომისაა, რაც მას პირველ მოდელად აქცევს თავის კლასში, რომელიც iPhone-ზე შეუფერხებლად მუშაობს.
| Model | DiffusionTransformerFootprint (GB) | GenEval | HPSv3 | DPG-Bench | Size reductionrelative toFLUX.2 Klein 4B | Performancerelative toFLUX.2 Klein 4B |
|---|---|---|---|---|---|---|
| 1-bit Bonsai Image 4B | 0.93 | 0.671 | 11.15 | 0.822 | 8.3x | 88% |
| Ternary Bonsai Image 4B | 1.21 | 0.723 | 12.22 | 0.851 | 6.4x | 95% |
| FLUX.2 Klein 4B | 7.75 | 0.819 | 12.84 | 0.853 | 1x | 100% |
| SDXL | 5.14 | 0.3 | 10.05 | 0.74 | 1.5x | 67% |
| BK-SDM-Small | 0.98 | 0.297 | 3.05 | 0.559 | 7.9x | 42% |
| Stable Diffusion 1.5 | 1.72 | 0.396 | 4.2 | 0.601 | 4.5x | 51% |
| PixArt-Σ XL 2 | 1.2 | 0.541 | 11.93 | 0.769 | 6.4x | 83% |
პრაქტიკულ ტესტებში, iPhone 17 Pro Max-ზე 512x512 ზომის გამოსახულების გენერირებას დაახლოებით 9.4 წამი სჭირდება, ხოლო Mac M4 Pro-ზე ეს პროცესი კიდევ უფრო სწრაფია. ეს შესაძლებელი გახდა MLX და Gemlite ოპტიმიზებული ბირთვების გამოყენებით.
PrismML-ის კვლევების მიხედვით, ტერნარული მოდელი ინარჩუნებს ორიგინალი მოდელის სიზუსტის 95%-ს, მაშინ როცა 1-ბიტიანი ვერსია 88%-ს. ეს მონაცემები ადასტურებს, რომ შეკუმშვა ხარისხის კრიტიკული დანაკარგის გარეშეა შესაძლებელი.
ადგილობრივი გენერაცია მომხმარებლებს სთავაზობს მეტ კონფიდენციალურობას და სისწრაფეს. როდესაც სურათი თქვენსავე მოწყობილობაზე იქმნება, ქრება ღრუბლოვანი სერვისების საჭიროება, რაც ამცირებს დანახარჯებს და აჩქარებს კრეატიულ პროცესს.
პროექტი ღია კოდითაა ხელმისაწვდომი Apache 2.0 ლიცენზიით, რაც დეველოპერებს საშუალებას აძლევს, საკუთარ აპლიკაციებში დანერგონ ეს ტექნოლოგია. კომპანიამ ასევე გაუშვა Bonsai Studio — iOS აპლიკაცია, რომელიც მომხმარებლებს მოდელის მუშაობის ტესტირების საშუალებას აძლევს.







დისკუსია
0 კომენტარი
ჯერ კომენტარი არ არის — იყავი პირველი.