ხელოვნური ინტელექტის სფეროში ახალი ერა იწყება: PrismML-მა წარმოადგინა Bonsai Image 4B, მოდელების ოჯახი, რომელიც სპეციალურად შექმნილია პერსონალურ მოწყობილობებზე მაღალი ხარისხის გამოსახულებების გენერირებისთვის.

ტრადიციულად, ასეთი ტიპის მოდელები დიდ სერვერულ რესურსებს საჭიროებდნენ, თუმცა Bonsai Image 4B-ის არქიტექტურა საშუალებას იძლევა, პროცესი პირდაპირ სმარტფონებსა და კომპიუტერებზე წარიმართოს.

ModelDiffusion TransformerReduction vs FP16
FLUX.2 Klein 4B7.75 GB1.0x
1-bit Bonsai Image 4B0.93 GB8.3x
Ternary Bonsai Image 4B1.21 GB6.4x

მოდელები ორ ვარიანტად გამოდის: 1-ბიტიანი და ტერნარული (სამმაგი). 1-ბიტიანი ვერსია ორიენტირებულია მაქსიმალურ შეკუმშვაზე, რაც მას იდეალურს ხდის შეზღუდული მეხსიერების მქონე მოწყობილობებისთვის. მეორე, ტერნარული ვარიანტი, გვთავაზობს ბალანსს კომპაქტურობასა და ვიზუალურ ხარისხს შორის.

ტექნოლოგიური თვალსაზრისით, ეს მიღწევა FLUX.2 Klein 4B არქიტექტურის ოპტიმიზაციას ეფუძნება. 1-ბიტიანი ვერსია ორიგინალთან შედარებით 8.3-ჯერ უფრო მცირე ზომისაა, რაც მას პირველ მოდელად აქცევს თავის კლასში, რომელიც iPhone-ზე შეუფერხებლად მუშაობს.

ModelDiffusionTransformerFootprint (GB)GenEvalHPSv3DPG-BenchSize reductionrelative toFLUX.2 Klein 4BPerformancerelative toFLUX.2 Klein 4B
1-bit Bonsai Image 4B0.930.67111.150.8228.3x88%
Ternary Bonsai Image 4B1.210.72312.220.8516.4x95%
FLUX.2 Klein 4B7.750.81912.840.8531x100%
SDXL5.140.310.050.741.5x67%
BK-SDM-Small0.980.2973.050.5597.9x42%
Stable Diffusion 1.51.720.3964.20.6014.5x51%
PixArt-Σ XL 21.20.54111.930.7696.4x83%

პრაქტიკულ ტესტებში, iPhone 17 Pro Max-ზე 512x512 ზომის გამოსახულების გენერირებას დაახლოებით 9.4 წამი სჭირდება, ხოლო Mac M4 Pro-ზე ეს პროცესი კიდევ უფრო სწრაფია. ეს შესაძლებელი გახდა MLX და Gemlite ოპტიმიზებული ბირთვების გამოყენებით.

PrismML-ის კვლევების მიხედვით, ტერნარული მოდელი ინარჩუნებს ორიგინალი მოდელის სიზუსტის 95%-ს, მაშინ როცა 1-ბიტიანი ვერსია 88%-ს. ეს მონაცემები ადასტურებს, რომ შეკუმშვა ხარისხის კრიტიკული დანაკარგის გარეშეა შესაძლებელი.

ადგილობრივი გენერაცია მომხმარებლებს სთავაზობს მეტ კონფიდენციალურობას და სისწრაფეს. როდესაც სურათი თქვენსავე მოწყობილობაზე იქმნება, ქრება ღრუბლოვანი სერვისების საჭიროება, რაც ამცირებს დანახარჯებს და აჩქარებს კრეატიულ პროცესს.

პროექტი ღია კოდითაა ხელმისაწვდომი Apache 2.0 ლიცენზიით, რაც დეველოპერებს საშუალებას აძლევს, საკუთარ აპლიკაციებში დანერგონ ეს ტექნოლოგია. კომპანიამ ასევე გაუშვა Bonsai Studio — iOS აპლიკაცია, რომელიც მომხმარებლებს მოდელის მუშაობის ტესტირების საშუალებას აძლევს.