<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Prompt-Injection on kaschnai</title><link>https://kaschnai.ch/tags/prompt-injection/</link><description>Recent content in Prompt-Injection on kaschnai</description><generator>Hugo</generator><language>de</language><lastBuildDate>Thu, 28 May 2026 14:00:00 +0200</lastBuildDate><atom:link href="https://kaschnai.ch/tags/prompt-injection/index.xml" rel="self" type="application/rss+xml"/><item><title>AI-Agent-Sicherheit in Produktion, Mai 2026: Was gerade leise bricht</title><link>https://kaschnai.ch/deep-dives/2026-05-28-ai-agent-sicherheit-in-produktion/</link><pubDate>Thu, 28 May 2026 14:00:00 +0200</pubDate><guid>https://kaschnai.ch/deep-dives/2026-05-28-ai-agent-sicherheit-in-produktion/</guid><description>&lt;p>Diese Woche erschienen drei Forschungsarbeiten, die zusammen ein Muster zeigen: AI-Agents in Produktion haben eine strukturelle Verwundbarkeit, die mit dem Standard-Sicherheitsmodell der Builder-Community nicht adressiert wird. Gleichzeitig deployt die Community weiter in hohem Tempo, mit Vertrauen auf Sandboxing und Container-Isolation. Die Spannung zwischen diesen beiden Perspektiven ist die eigentliche Frage dieses Deep-Dives.&lt;/p>
&lt;h2 id="tldr-in-fünf-sätzen">TL;DR in fünf Sätzen&lt;/h2>
&lt;p>Drei neue Papers zeigen materielle Angriffsklassen gegen AI-Agents: Prompt Injection über User-Generated Content in GUI-Agents, voluntary collusion in Multi-Agent-Systemen auch bei safety-aligned Models, und Privacy-Leakage der sich in sozialen Agent-Netzwerken auf 45%+ hochschaukelt. Die Builder-Community setzt auf Sandboxing und Container-Isolation, was gegen Execution-Exploits hilft, aber nicht gegen Angriffe die vollständig innerhalb des Reasoning-Prozesses ablaufen. Proaktive Sicherheitsarchitekturen wie TRACES (Trajectory-Auditierung) und Agyn (Zero-Trust zwischen Agents) sind da, aber noch in der Forschungsphase. Skeptiker aus der Builder-Community haben einen validen Punkt: die akademischen Angriffe erfordern spezifische Vorbedingungen, die in vielen realen Deployments nicht gegeben sind. Für Indie-Builder bedeutet das konkret: Sandboxing bleibt First-Line-Defense, aber Multi-Agent-Systeme brauchen jetzt explizite Trust-Boundaries zwischen Agents, bevor diese Lücken in freier Wildbahn ausgenutzt werden.&lt;/p></description></item></channel></rss>