Tool-Radar 2026-05-28: Claude Code, Cursor, Gemma4, Agent Safety

Kein grosser Release-Sprint diese Woche: zwei konkrete Plattform-Updates (YouTube, Cursor-Pricing), mehrere Community-Signale die Builder direkt betreffen (Claude Code, OpenAI Codex), und auffällig viele Arxiv-Paper zu Agent Safety und Prompt Injection. Wer aktiv mit Coding-Agents oder Mobile-GUI-Agents arbeitet, findet unten ein paar ehrliche Einschätzungen. 9 Tools, 3 Buckets.

Mainstream

Claude Code: Fokus-Verlust nach 5 Minuten

Ein vieldiskutierter Post auf r/AI_Agents beschreibt ein echtes Pattern: Die ersten Minuten mit Claude Code sind scharf, dann wird man zum Passagier. Der Agent schreibt, erklärt, committet - man nickt. Genau dann schleichen sich Fehler ein. Kein Bug, keine neue Version, sondern ein Workflow-Problem das viele kennen aber selten benennen. Wenn du Claude Code oder ähnliche Coding-Agents nutzt: aktive Review-Checkpoints einbauen, nicht nur am Ende einer Task-Reihe.

Cursor: 50% Rabatt via Referral

Im r/cursor Subreddit kursiert ein Referral-Link der 50% Rabatt auf den ersten Monat gibt. Kein allgemeiner Sale: der Rabatt gilt nur für neue Accounts über Referral-Code. Cursor kostet regulär USD 20/Monat (Pro) - mit Referral also USD 10 für den ersten Monat. Wer noch kein Abo hat und testen will, ist das aktuell der günstigste Einstieg. Die Core-Engine hat sich seit Cursor 1.0 nicht wesentlich verändert, das GUI-Update war hauptsächlich UI-Polish.

YouTube: Auto-Label für KI-generierte Videos

YouTube hat angekündigt, KI-generierte Videos künftig automatisch zu erkennen und zu labeln - unabhängig davon ob der Creator das freiwillig deklariert. Das Signal ist eindeutig: Plattform-seitige Erkennung wird zum Standard, Creator-Deklaration reicht nicht mehr als einziger Nachweis. Für alle die KI-generierten Video-Content produzieren: die Transparenz-Anforderungen kommen ohnehin, besser jetzt proaktiv labeln als später gezwungen werden.

Indie

Google AI Mode vs. DuckDuckGo

DuckDuckGo hat in der Woche nach Googles AI-Mode-Ankündigung 28% mehr Besuche verzeichnet. Das ist kein Zufall. Ein relevanter Teil der Nutzerschaft will keine AI-Overviews im Suchergebnis. Für Builder die auf SEO-Traffic setzen: der Anteil an Nicht-Google-Traffic steigt strukturell. DuckDuckGo selbst bleibt Open-Source-Backend (Bang-System), kostenlos, ohne Tracking.

Gemma 4 / Nemotron 3: Open-Weight SOTA im Westen stockt

Auf r/LocalLLaMA läuft eine klare Analyse: Das beste westliche Open-Weight-Modell liegt irgendwo zwischen Googles Gemma 3 (27B/31B) und NVIDIAs Nemotron Super 120B. Beides solide Modelle, kostenlos nutzbar. Das Problem: chinesische Open-Weight-Modelle (Qwen 3, DeepSeek V3) holen schneller auf. Meta fehlt seit Llama 3 ein klarer Nachfolger. Für lokale Deployments über Ollama oder LM Studio ist Gemma 3 27B aktuell das beste Verhältnis aus Qualität und Ressourcenbedarf für Workstations. Nemotron Super 120B braucht A100-Klasse Hardware.

OpenAI Codex: Malware-Seite rankt vor offiziellem App-Link

Konkrete Warnung aus r/OpenAI: Bei Google-Suche nach “OpenAI Codex app” landet man als erstes Ergebnis auf einer Fake-Seite die Malware verteilt. Das offizielle OpenAI-Ergebnis kommt danach. Für alle die Kunden oder Kollegen auf KI-Tools hinweisen: Links immer direkt mitschicken, nie “Google einfach X” sagen. Das Problem betrifft nicht nur Codex, ähnliche SEO-Angriffe gibt es auf andere populäre KI-Tool-Namen.

Experimental

TRACES: Proaktives Agent-Safety-Auditing

TRACES ist ein Forschungs-Framework das Agent-Trajektorien in Echtzeit auf Sicherheitsrisiken prüft - nicht erst am Ende, sondern während der Ausführung. Technisch: ein Observer-LLM lernt aus hidden Representations, ob eine laufende Trajektorie in unsicheres Verhalten driftet. Kein fertiges Tool zum Deployen, aber der Ansatz ist relevant für alle die Multi-Step-Agents in Produktion bringen. Proaktives Auditing statt Post-Hoc ist der richtige Gedanke. Code: noch nicht public, Paper vom 2026-05-28.

MIRAGE: Prompt Injection via Mobile-App-Content

MIRAGE zeigt ein konkretes Angriffsszenario: Mobile GUI-Agents die Pixel sehen und darauf klicken, können nicht zwischen echter UI und User-Generated-Content unterscheiden. Angreifer platzieren Payloads in normalen Content-Bereichen (z.B. Chat-Nachrichten, Kommentare) - der Agent führt sie aus. Kein Code-Exploit, reine visuelle Täuschung. Für alle die VLM-basierte Automatisierungen auf mobilen Geräten bauen: das ist ein grundlegendes Sicherheitsproblem, nicht ein Edge-Case.

Agyn: Agent-Deployment auf Kubernetes mit Zero-Trust

Agyn ist eine Open-Source-Plattform für Agent-Betrieb auf Kubernetes: stateful Serverless Runtime, Terraform-Provider für Agent-Definitionen, Zero-Trust Security Model. Weniger ein fertiges Produkt, mehr ein Architektur-Paper mit Code. Für Teams die Agents in produktiven Umgebungen betreiben und sich Gedanken über Isolation und Governance machen, ist der Ansatz (signal-driven, stateless Execution per Agent) interessant. Pricing: Open-Source. Cloud-agnostisch.

Tool-Radar 2026-05-28 durch kaschnai-Tool-Radar-Pipeline. Quality-Gates: Source-Diversity (4 Tool-Quellen: HN, Reddit, Arxiv, YouTube-Blog, 3 Lager), Frische (alle Releases <2 Tage alt). Nächste Frische-Prüfung: 2026-06-28.