ChatGPT-მ შესაძლოა ძალადობრივი და სექსუალური შინაარსის ფოტოები შექმნას

უსაფრთხოების მკვლევრებმა OpenAI-ს მოდელში დაუცველი წერტილები აღმოაჩინეს, რაც ხელოვნურ ინტელექტს მავნე კონტენტის გენერირების საშუალებას აძლევს.

ხატია ბაქრაძე

17 ივნისი, 2026 · 23:232 წუთის წასაკითხი

ხელოვნური ინტელექტის მიერ გენერირებული გამოსახულების კონცეფცია — ფოტო: BBC Tech

გააზიარე

რა ვიცით ჯერჯერობით

ChatGPT-ის მოდელების მანიპულირება მარტივი ტექსტური ინსტრუქციებითაა შესაძლებელი.
Mindgard-ის მკვლევრებმა აღმოაჩინეს მეთოდი, რომელიც იწვევს გრაფიკული ძალადობისა და სექსუალური შინაარსის ფოტოების გენერირებას.
OpenAI-მ განაცხადა, რომ დამატებითი დამცავი მექანიზმები დანერგა, თუმცა ექსპერტები ამას დროებით ზომად მიიჩნევენ.
AI მოდელებს არ გააჩნიათ მორალური კომპასი, რაც მათ მავნე კონტენტის შექმნისკენ დაუცველს ხდის.

Mindgard A synthetic image of a naked and injured man lying on the floor surrounded by men carrying guns their faces covered. — Mindgard

ხელოვნური ინტელექტის უსაფრთხოების სფეროში მომუშავე ბრიტანულმა სტარტაპმა Mindgard-მა გამოავლინა, რომ ChatGPT-ის უახლესი ვერსიის პროვოცირება ძალადობრივი და სექსუალური შინაარსის ფოტოების შესაქმნელად შესაძლებელია. მკვლევრებმა აღმოაჩინეს, რომ მცირე მანიპულაციები იმ ინსტრუქციებში (prompt), რომლებიც თავდაპირველად უწყინარი ან იუმორისტული შედეგების მისაღებად იყო განკუთვნილი, მოდელს მავნე კონტენტის გენერირებისკენ უბიძგებს.

Mindgard A synthetic image of a woman. She is sitting on the floor in a dirty grey walled room. A black rectangle, for redaction, covers her head body and arms. — Mindgard

OpenAI-ის GPT-5.4 მოდელი, BBC-ის ინფორმაციით, გარკვეული მითითებების შემდეგ ქმნის უკიდურესად რეალისტურ და შემაშფოთებელ გამოსახულებებს. Mindgard-ის დამფუძნებლის, პიტერ გარაგჰანის თქმით, AI-მ საკუთარი ინიციატივით შექმნა სისხლიანი და სექსუალიზებული სცენები, მიუხედავად იმისა, რომ კონკრეტული თემატიკა ინსტრუქციაში არ იყო მითითებული.

ექსპერტებმა დააფიქსირეს ისეთი კადრები, როგორიცაა მძიმე დაზიანებების მქონე ადამიანები ან ძალადობის ნიშნების მქონე სცენები, რომლებსაც ჩეთბოტმა თავად შეურჩია სათაურები, მაგალითად: „დანაშაულის ადგილის საზარელი შედეგები“.

OpenAI-ში აცხადებენ, რომ კომპანიამ უკვე მიიღო ზომები და დამატებითი დამცავი ბარიერები დააწესა მსგავსი ინციდენტების თავიდან ასაცილებლად. კომპანიის ოფიციალური პოზიციით, მათ აქვთ მრავალშრიანი დაცვის სისტემა, რომელიც აერთიანებს ავტომატურ ალგორითმებსა და ადამიანურ მონიტორინგს.

Mindgard A redacted version of a synthetic image. A woman lies on dirty ground - her head and body are covered by a black rectangle used for redaction - only her arms and legs are visible. — Mindgard

თუმცა, უსაფრთხოების მკვლევრები მიიჩნევენ, რომ ეს პრობლემა გაცილებით ფუნდამენტურია. დოქტორ რუმან ჩოუდჰურის, AI მოდელების შემფასებელი ექსპერტის განმარტებით, ეს არის „კატისა და თაგვის თამაში“, სადაც დაცვის გაძლიერებასთან ერთად, მანიპულაციის მეთოდებიც უფრო დახვეწილი ხდება.

მოდელები, როგორიცაა ChatGPT, არ ფლობენ ადამიანურ გაგებას ზნეობის, კონტექსტის ან განზრახვის შესახებ. ისინი მხოლოდ მონაცემთა მასიურ ბაზებზე დაყრდნობით მუშაობენ, რაც ნიშნავს, რომ მათი „შემოქმედება“ ხშირად ინტერნეტში არსებული რეალური, ხშირად მავნე კონტენტის ანარეკლია.

Mindgard-ის მკვლევრები აღნიშნავენ, რომ მიუხედავად გაფრთხილებებისა, სისტემის სრულად დაცვა პრაქტიკულად შეუძლებელია, რადგან ახალი „ჯეილბრეიკების“ (jailbreak) ანუ უსაფრთხოების გვერდის ავლის გზების პოვნა დროის საკითხია.

A green promotional banner with black squares and rectangles forming pixels, moving in from the right. The text says: “Tech Decoded: The world’s biggest tech news in your inbox every Monday.”

რატომ აქვს ამას მნიშვნელობა

ხელოვნური ინტელექტის განვითარება საქართველოშიც აქტიურად მიმდინარეობს, როგორც ბიზნესში, ისე განათლების სექტორში. ChatGPT-ის მსგავსი ხელსაწყოების უსაფრთხოების ხარვეზები მნიშვნელოვანია იმ მომხმარებლებისთვის, რომლებიც AI-ს სამუშაო პროცესებში იყენებენ. ეს მოვლენა კიდევ ერთხელ ადასტურებს, რომ ტექნოლოგიების ბრმად ნდობა საფრთხის შემცველია და აუცილებელია რეგულაციებისა და უსაფრთხოების სტანდარტების მუდმივი განახლება.

ხშირად დასმული კითხვები

Mindgard-ის კვლევის თანახმად, წინა ექსპერიმენტებში დაფიქსირდა, რომ ჩეთბოტის მოტყუება შესაძლებელი იყო რეალური ადამიანების სახის მქონე ნუდისტური ფოტოების (deepfake) შესაქმნელად.
ექსპერტების თქმით, AI მოდელებს არ ესმით კონტექსტი და ზნეობა. ეს არის მუდმივი პროცესი, სადაც დაცვის გაძლიერებასთან ერთად, მანიპულაციის ტექნიკებიც იხვეწება.
Mindgard არის კომპანია, რომელიც დაკავებულია ე.წ. „Red-teaming“-ით, რაც გულისხმობს ხელოვნური ინტელექტის სისტემების შეგნებულად გამოცდას და დაუცველი წერტილების პოვნას, რათა კომპანიებმა მათი გამოსწორება შეძლონ.

თეგები#ChatGPT #OpenAI #AI უსაფრთხოება #ტექნოლოგიები #კიბერუსაფრთხოება

ეს ამბავი ვითარდება

249 განახლება · ბოლო 18 ივნისი, 2026

კიბერუსაფრთხოების კრიზისი: AI და კრიპტო საფრთხეები

ტექნოლოგიური სამყარო კიბერუსაფრთხოების მზარდი გამოწვევების წინაშე აღმოჩნდა, სადაც ხელოვნური ინტელექტი როგორც დამცავ, ისე დამანგრეველ ინსტრუმენტად იქცა. კრიპტოინდუსტრია ჰაკერული თავდასხმების, ფიზიკური უსაფრთხოების რისკებისა და კვანტური საფრთხეების ტალღამ მოიცვა, რაც მილიონობით დოლარის ზარალს იწვევს. პარალელურად, ექსპერტები და პროგრამისტები აფრთხილებენ საზოგადოებას AI-ს ბრმად მინდობის საფრთხეებზე, რაც პროგრამული უზრუნველყოფის ხარისხსა და მონაცემთა კონფიდენციალურობას ეჭვქვეშ აყენებს. ეს დინამიკა ნათლად აჩვენებს, რომ ტექნოლოგიური პროგრესი უსაფრთხოების სტრატეგიების გადახედვის გარეშე სერიოზულ სისტემურ რისკებს შეიცავს.