OffenseSeverityWhat it catchesConfidence
permission_bypasscriticalDenied calls + a two-tier Bash scan: never-downgrade catastrophic (rm -rf /, fork bomb, curl|sh, dd of=/dev/…) stay critical under any allow-rule; downgradable escalation (sudo, chmod 777, cwd-wipe) only by a precise rule.high
out_of_scopehigh / criticalFile or Bash path outside the project (auto: git root or cwd), or outside configured scope_dirs. Sensitive paths (~/.ssh, ~/.aws, ~/.claude, /etc/shadow, shell history…) are always critical and never downgraded.high
self_permissioncriticalAny agent write to its own control files (.claude/settings*.json, .claude/agents/*.md, pd-rules*.yaml) via any method — Write/Edit/NotebookEdit or Bash cp/mv/tee/sed/python/base64/redirect — regardless of content.high
tool_not_allowedhighA subagent uses a tool outside its declared tools: allowlist (.claude/agents/.md).high
redundantlowExact-duplicate tool calls (ignores Bash description noise).high
off_taskreviewSearch/query terms vs. the agent's brief, by word-overlap below a threshold.low — heuristic

ხელოვნური ინტელექტის აგენტები, რომლებიც კოდს წერენ, ფაილებს მართავენ და დამოუკიდებლად იღებენ გადაწყვეტილებებს, თანამედროვე პროგრამული უზრუნველყოფის განუყოფელი ნაწილი ხდება. თუმცა, მათი მოქმედებების მონიტორინგი ხშირად რთულია. ახალი პროექტი agent-pd სწორედ ამ პრობლემის გადასაჭრელად შეიქმნა.

ეს სისტემა ფუნქციონირებს როგორც „პოლიციის განყოფილება“ თქვენი Claude Code-ის აგენტებისთვის. ის არ ბლოკავს მოქმედებებს, არამედ წარმოადგენს უსაფრთხოების აუდიტის სისტემას, რომელიც აგენტების თითოეულ ნაბიჯს აღრიცხავს.


Agent-pd არ არის ფაირვოლი ან სენდბოქსი. მისი მთავარი დანიშნულებაა „შავი ყუთის“ პრინციპით მუშაობა. სისტემა აკვირდება მთავარ აგენტს და მის მიერ შექმნილ ყველა ქვეგანყოფილებას, რათა ზუსტად იცოდეთ, რა მოხდა სინამდვილეში.

სისტემა იყენებს ექვს დეტერმინისტულ დეტექტორს, რომლებიც ნულოვანი ტოკენის დანახარჯით მუშაობენ. ისინი აკონტროლებენ ისეთ ფაქტორებს, როგორიცაა უნებართვო წვდომა, სკრიპტების გაშვება და სისტემური პარამეტრების შეცვლის მცდელობა.


აუდიტის ჟურნალი დაცულია ჰეშ-ჯაჭვით (hash-chained), რაც მონაცემების მანიპულაციის რისკს ამცირებს. მომხმარებელს შეუძლია რეალურ დროში ადევნოს თვალი აგენტების აქტივობას pd watch ბრძანების საშუალებით.

პროექტის ავტორები ხაზს უსვამენ, რომ სისტემა არ არის სრულყოფილი დაცვა. ის აძლიერებს უსაფრთხოების ბარიერს, თუმცა გამოცდილმა თავდამსხმელმა შესაძლოა გვერდი აუაროს სტატიკურ დეტექტორებს. სწორედ ამიტომ, სისტემა ეფუძნება გამჭვირვალობას და „Caught-on-camera“ პრინციპს.


ინსტალაციის შემდეგ, agent-pd ავტომატურად იწყებს მუშაობას ფონურ რეჟიმში. ის არ აფერხებს აგენტების მუშაობას, არამედ აკეთებს დეტალურ ჩანაწერს, რომელიც შემდეგ შეიძლება გაანალიზდეს.

სისტემის არქიტექტურა მოიცავს „სულელურ“, მაგრამ კრახისადმი მდგრად ჩამწერს, რომელიც ~/.claude/settings.json ფაილში რეგისტრირდება. მთელი „ინტელექტი“ კი pd report-შია თავმოყრილი, რომელიც მონაცემებს ამუშავებს.

ეს ინსტრუმენტი განსაკუთრებით სასარგებლოა დეველოპერებისთვის, რომლებიც ექსპერიმენტებს ატარებენ AI-აგენტებთან და სურთ სრული კონტროლი ჰქონდეთ მათ „ქცევაზე“.

პროექტი ღიაა და ნებისმიერ მსურველს შეუძლია მისი რეპოზიტორიდან გადმოწერა და საკუთარ გარემოში ტესტირება. ეს არის აუცილებელი ნაბიჯი AI-ს უსაფრთხოებისკენ.