<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Deep-Dive on kaschnai</title><link>https://kaschnai.ch/tags/deep-dive/</link><description>Recent content in Deep-Dive on kaschnai</description><generator>Hugo</generator><language>de</language><lastBuildDate>Sun, 31 May 2026 11:00:00 +0200</lastBuildDate><atom:link href="https://kaschnai.ch/tags/deep-dive/index.xml" rel="self" type="application/rss+xml"/><item><title>Beste Video-KI-Modelle Mai 2026: Vergleich, API-Kosten und Bezugsquellen</title><link>https://kaschnai.ch/deep-dives/2026-05-31-beste-video-ki-modelle-mai-2026/</link><pubDate>Sun, 31 May 2026 11:00:00 +0200</pubDate><guid>https://kaschnai.ch/deep-dives/2026-05-31-beste-video-ki-modelle-mai-2026/</guid><description>&lt;p>Wer im Mai 2026 das beste KI-Video sucht, landet bei chinesischen Modellen. ByteDance Seedance 2.0 und Kuaishou Kling 3.0 führen das Blind-Ranking von &lt;a href="https://artificialanalysis.ai/video/leaderboard/text-to-video">Artificial Analysis&lt;/a> an, vor Googles Veo 3.1 und OpenAIs Sora 2. Die API-Preise sind seit Anfang 2025 um rund 60 Prozent gefallen. Und am günstigsten generierst du nicht über Credit-Plattformen wie Higgsfield, sondern per pay-per-use oder mit offenen Gewichten.&lt;/p>
&lt;p>Das ist die Kurzfassung. Der interessante Teil steckt in der Lücke zwischen &amp;ldquo;welches Modell ist das beste&amp;rdquo; und &amp;ldquo;welches solltest du tatsächlich nutzen&amp;rdquo;. Die beiden Fragen haben im Mai 2026 unterschiedliche Antworten, und genau diese Differenz entscheidet über deine Rechnung am Monatsende.&lt;/p></description></item><item><title>Europäische KI ohne ChatGPT und Gemini: Was 2026 wirklich trägt, wenn du baust</title><link>https://kaschnai.ch/deep-dives/2026-05-29-europaeische-ki-ohne-chatgpt-und-gemini/</link><pubDate>Fri, 29 May 2026 14:00:00 +0200</pubDate><guid>https://kaschnai.ch/deep-dives/2026-05-29-europaeische-ki-ohne-chatgpt-und-gemini/</guid><description>&lt;p>t3n hat diese Woche einen Selbstversuch publiziert: &lt;a href="https://t3n.de/news/mit-europaeischer-ki-arbeiten-so-gut-funktioniert-es-ohne-chatgpt-oder-gemini-1744615/">eine Woche nur europäische KI nutzen, ohne ChatGPT oder Gemini&lt;/a>. Die Frage dahinter ist für Endnutzer interessant, für Builder aber zu klein gestellt. Wer mit APIs, Modellen und Agents arbeitet, fragt nicht &amp;ldquo;überlebe ich eine Woche&amp;rdquo;, sondern &amp;ldquo;welche europäischen Anbieter tragen meine Produktion, und an welcher Stelle ist das Souveränitäts-Versprechen nur ein Aufkleber&amp;rdquo;.&lt;/p>
&lt;h2 id="tldr-in-fünf-sätzen">TL;DR in fünf Sätzen&lt;/h2>
&lt;p>In Spezial-Disziplinen ist Europa konkurrenzfähig bis führend: Bildgenerierung über FLUX, Übersetzung über DeepL, Embeddings über Jina, Echtzeit-Voice über Kyutai. Beim allgemeinen Frontier-Chat liegt der beste europäische Anbieter, Mistral, nach übereinstimmenden Benchmarks und Praxisstimmen rund ein Jahr hinter den US-Spitzenmodellen. Das stärkste praktische Argument für europäische KI ist nicht Leistungsparität, sondern der harte Jurisdiktions-Konflikt zwischen US CLOUD Act und DSGVO, plus Preis und Datenkontrolle. Für Builder heisst das 2026: Souveränität holst du dir am verlässlichsten über EU-gehostete Inference offener Modelle, nicht über das Warten auf ein europäisches GPT. Wer ehrlich plant, mischt: europäisch dort wo es trägt, US-Modell EU-gehostet dort wo Spitzenqualität zählt.&lt;/p></description></item><item><title>Claude Opus 4.8: 'modest but tangible' und eine geteilte Community</title><link>https://kaschnai.ch/deep-dives/2026-05-28-claude-opus-4-8-versprechen-und-stimmen/</link><pubDate>Thu, 28 May 2026 18:30:00 +0200</pubDate><guid>https://kaschnai.ch/deep-dives/2026-05-28-claude-opus-4-8-versprechen-und-stimmen/</guid><description>&lt;p>Am 28. Mai 2026 hat Anthropic Claude Opus 4.8 veröffentlicht, und die offizielle Einordnung ist auffällig zurückhaltend: eine &amp;ldquo;modest but tangible improvement on its predecessor&amp;rdquo;. Auf den Benchmarks führt das Modell trotzdem klar, bei Artificial Analysis steht es auf Platz eins. Die Frühreaktion der Community fällt deutlich gemischter aus. Zwischen &amp;ldquo;endlich brauchbar&amp;rdquo; und &amp;ldquo;schon wieder ein Versionssprung ohne spürbaren Nutzen&amp;rdquo; liegt der ganze Streit.&lt;/p>
&lt;p>Das ist die eigentliche Spannung dieses Releases. Auf der einen Seite ein Modell, das auf jeder Messlatte vorne liegt. Auf der anderen Seite eine Nutzerschaft, die den Unterschied zum Vorgänger im Alltag kaum noch greifen kann. Beide Seiten haben Argumente, die man ernst nehmen sollte.&lt;/p></description></item><item><title>AI-Agent-Sicherheit in Produktion, Mai 2026: Was gerade leise bricht</title><link>https://kaschnai.ch/deep-dives/2026-05-28-ai-agent-sicherheit-in-produktion/</link><pubDate>Thu, 28 May 2026 14:00:00 +0200</pubDate><guid>https://kaschnai.ch/deep-dives/2026-05-28-ai-agent-sicherheit-in-produktion/</guid><description>&lt;p>Diese Woche erschienen drei Forschungsarbeiten, die zusammen ein Muster zeigen: AI-Agents in Produktion haben eine strukturelle Verwundbarkeit, die mit dem Standard-Sicherheitsmodell der Builder-Community nicht adressiert wird. Gleichzeitig deployt die Community weiter in hohem Tempo, mit Vertrauen auf Sandboxing und Container-Isolation. Die Spannung zwischen diesen beiden Perspektiven ist die eigentliche Frage dieses Deep-Dives.&lt;/p>
&lt;h2 id="tldr-in-fünf-sätzen">TL;DR in fünf Sätzen&lt;/h2>
&lt;p>Drei neue Papers zeigen materielle Angriffsklassen gegen AI-Agents: Prompt Injection über User-Generated Content in GUI-Agents, voluntary collusion in Multi-Agent-Systemen auch bei safety-aligned Models, und Privacy-Leakage der sich in sozialen Agent-Netzwerken auf 45%+ hochschaukelt. Die Builder-Community setzt auf Sandboxing und Container-Isolation, was gegen Execution-Exploits hilft, aber nicht gegen Angriffe die vollständig innerhalb des Reasoning-Prozesses ablaufen. Proaktive Sicherheitsarchitekturen wie TRACES (Trajectory-Auditierung) und Agyn (Zero-Trust zwischen Agents) sind da, aber noch in der Forschungsphase. Skeptiker aus der Builder-Community haben einen validen Punkt: die akademischen Angriffe erfordern spezifische Vorbedingungen, die in vielen realen Deployments nicht gegeben sind. Für Indie-Builder bedeutet das konkret: Sandboxing bleibt First-Line-Defense, aber Multi-Agent-Systeme brauchen jetzt explizite Trust-Boundaries zwischen Agents, bevor diese Lücken in freier Wildbahn ausgenutzt werden.&lt;/p></description></item></channel></rss>