Startseite on kaschnai

Remotion: Videos mit Code statt von Hand schneiden

Tue, 02 Jun 2026 10:00:00 +0200

Motion Graphics von Hand schneiden ist Fummelarbeit. Keyframe hier, Easing da, und beim fünften personalisierten Video klickst du dieselben Schritte zum fünften Mal. Remotion dreht das um. Ein Video ist hier kein Clip in einem Editor, sondern Code. Genauer: eine React-Komponente, die Remotion für jeden einzelnen Frame neu auswertet. Remotion ist dir vielleicht schon über ein Fireship-Video oder über GitHub Unwrapped begegnet, das jährliche Wrapped-Video für deinen GitHub-Account. Und weil das Video eben Code ist, kann es auch ein LLM schreiben. Dazu am Ende mehr.

Beste Video-KI-Modelle Mai 2026: Vergleich, API-Kosten und Bezugsquellen

Sun, 31 May 2026 11:00:00 +0200

Wer im Mai 2026 das beste KI-Video sucht, landet bei chinesischen Modellen. ByteDance Seedance 2.0 und Kuaishou Kling 3.0 führen das Blind-Ranking von Artificial Analysis an, vor Googles Veo 3.1 und OpenAIs Sora 2. Die API-Preise sind seit Anfang 2025 um rund 60 Prozent gefallen. Und am günstigsten generierst du nicht über Credit-Plattformen wie Higgsfield, sondern per pay-per-use oder mit offenen Gewichten.

Das ist die Kurzfassung. Der interessante Teil steckt in der Lücke zwischen “welches Modell ist das beste” und “welches solltest du tatsächlich nutzen”. Die beiden Fragen haben im Mai 2026 unterschiedliche Antworten, und genau diese Differenz entscheidet über deine Rechnung am Monatsende.

Europäische KI ohne ChatGPT und Gemini: Was 2026 wirklich trägt, wenn du baust

Fri, 29 May 2026 14:00:00 +0200

t3n hat diese Woche einen Selbstversuch publiziert: eine Woche nur europäische KI nutzen, ohne ChatGPT oder Gemini. Die Frage dahinter ist für Endnutzer interessant, für Builder aber zu klein gestellt. Wer mit APIs, Modellen und Agents arbeitet, fragt nicht “überlebe ich eine Woche”, sondern “welche europäischen Anbieter tragen meine Produktion, und an welcher Stelle ist das Souveränitäts-Versprechen nur ein Aufkleber”.

TL;DR in fünf Sätzen

In Spezial-Disziplinen ist Europa konkurrenzfähig bis führend: Bildgenerierung über FLUX, Übersetzung über DeepL, Embeddings über Jina, Echtzeit-Voice über Kyutai. Beim allgemeinen Frontier-Chat liegt der beste europäische Anbieter, Mistral, nach übereinstimmenden Benchmarks und Praxisstimmen rund ein Jahr hinter den US-Spitzenmodellen. Das stärkste praktische Argument für europäische KI ist nicht Leistungsparität, sondern der harte Jurisdiktions-Konflikt zwischen US CLOUD Act und DSGVO, plus Preis und Datenkontrolle. Für Builder heisst das 2026: Souveränität holst du dir am verlässlichsten über EU-gehostete Inference offener Modelle, nicht über das Warten auf ein europäisches GPT. Wer ehrlich plant, mischt: europäisch dort wo es trägt, US-Modell EU-gehostet dort wo Spitzenqualität zählt.

Claude Opus 4.8: 'modest but tangible' und eine geteilte Community

Thu, 28 May 2026 18:30:00 +0200

Am 28. Mai 2026 hat Anthropic Claude Opus 4.8 veröffentlicht, und die offizielle Einordnung ist auffällig zurückhaltend: eine “modest but tangible improvement on its predecessor”. Auf den Benchmarks führt das Modell trotzdem klar, bei Artificial Analysis steht es auf Platz eins. Die Frühreaktion der Community fällt deutlich gemischter aus. Zwischen “endlich brauchbar” und “schon wieder ein Versionssprung ohne spürbaren Nutzen” liegt der ganze Streit.

Das ist die eigentliche Spannung dieses Releases. Auf der einen Seite ein Modell, das auf jeder Messlatte vorne liegt. Auf der anderen Seite eine Nutzerschaft, die den Unterschied zum Vorgänger im Alltag kaum noch greifen kann. Beide Seiten haben Argumente, die man ernst nehmen sollte.

Briefing 2026-05-28: PMF für die KI-Labs, YouTube startet AI-Labels, Cisco rollt Codex aus

Thu, 28 May 2026 18:00:00 +0200

Diese Woche das wichtigste in vier Punkten. Die KI-Labs haben sich strategisch sortiert, der Druck auf KI-Detection wächst sichtbar, Enterprise-Roll-outs nehmen konkrete Form an, und in den Safety-Communities gibt es eine harte Debatte um Governance. Was bedeutet das, wenn du selbst mit KI baust.

Anthropic und OpenAI haben Product-Market-Fit gefunden

Simon Willison hat es diese Woche treffend formuliert: die zwei Labs sind nicht mehr im Modus “wir wollen rausfinden was Leute brauchen”. Sie wissen es. Anthropic hat sich auf Coding und Agents fokussiert, OpenAI auf den breiten Konsumenten plus Enterprise-Ads-Modell. Die Strategien sind unterschiedlich genug, dass sie nicht direkt konkurrieren, und beide finden zahlende Kundschaft.

Tool-Radar 2026-05-28: Claude Code, Cursor, Gemma4, Agent Safety

Thu, 28 May 2026 16:00:00 +0200

Kein grosser Release-Sprint diese Woche: zwei konkrete Plattform-Updates (YouTube, Cursor-Pricing), mehrere Community-Signale die Builder direkt betreffen (Claude Code, OpenAI Codex), und auffällig viele Arxiv-Paper zu Agent Safety und Prompt Injection. Wer aktiv mit Coding-Agents oder Mobile-GUI-Agents arbeitet, findet unten ein paar ehrliche Einschätzungen. 9 Tools, 3 Buckets.

Mainstream

Claude Code: Fokus-Verlust nach 5 Minuten

Ein vieldiskutierter Post auf r/AI_Agents beschreibt ein echtes Pattern: Die ersten Minuten mit Claude Code sind scharf, dann wird man zum Passagier. Der Agent schreibt, erklärt, committet - man nickt. Genau dann schleichen sich Fehler ein. Kein Bug, keine neue Version, sondern ein Workflow-Problem das viele kennen aber selten benennen. Wenn du Claude Code oder ähnliche Coding-Agents nutzt: aktive Review-Checkpoints einbauen, nicht nur am Ende einer Task-Reihe.

Warum ich kaschnai baue und für wen

Thu, 28 May 2026 15:00:00 +0200

Wenn du wie ich mit KI baust, kennst du das Problem. Du liest täglich englischen Content (Karpathys Tweets, Anthropics-Blog, Latent Space, Simon Willison, Hamel Husain, Lenny Rachitsky, ein Dutzend Substack-Newsletter, Hacker News, Reddit r/LocalLLaMA und r/MachineLearning, gelegentlich ein Arxiv-Paper das dir jemand zeigt), und du hast trotzdem das Gefühl, etwas zu verpassen. Es ist zu viel. Es ist zu fragmentiert. Niemand sagt dir auf Deutsch und in einem Satz, was diese Woche in KI wirklich passiert ist und warum es für dein Bau-Projekt relevant ist.

AI-Agent-Sicherheit in Produktion, Mai 2026: Was gerade leise bricht

Thu, 28 May 2026 14:00:00 +0200

Diese Woche erschienen drei Forschungsarbeiten, die zusammen ein Muster zeigen: AI-Agents in Produktion haben eine strukturelle Verwundbarkeit, die mit dem Standard-Sicherheitsmodell der Builder-Community nicht adressiert wird. Gleichzeitig deployt die Community weiter in hohem Tempo, mit Vertrauen auf Sandboxing und Container-Isolation. Die Spannung zwischen diesen beiden Perspektiven ist die eigentliche Frage dieses Deep-Dives.

TL;DR in fünf Sätzen

Drei neue Papers zeigen materielle Angriffsklassen gegen AI-Agents: Prompt Injection über User-Generated Content in GUI-Agents, voluntary collusion in Multi-Agent-Systemen auch bei safety-aligned Models, und Privacy-Leakage der sich in sozialen Agent-Netzwerken auf 45%+ hochschaukelt. Die Builder-Community setzt auf Sandboxing und Container-Isolation, was gegen Execution-Exploits hilft, aber nicht gegen Angriffe die vollständig innerhalb des Reasoning-Prozesses ablaufen. Proaktive Sicherheitsarchitekturen wie TRACES (Trajectory-Auditierung) und Agyn (Zero-Trust zwischen Agents) sind da, aber noch in der Forschungsphase. Skeptiker aus der Builder-Community haben einen validen Punkt: die akademischen Angriffe erfordern spezifische Vorbedingungen, die in vielen realen Deployments nicht gegeben sind. Für Indie-Builder bedeutet das konkret: Sandboxing bleibt First-Line-Defense, aber Multi-Agent-Systeme brauchen jetzt explizite Trust-Boundaries zwischen Agents, bevor diese Lücken in freier Wildbahn ausgenutzt werden.

Context-Engineering, einfach erklärt

Thu, 28 May 2026 12:30:00 +0200

Prompt-Engineering war 2023 der Buzzword. Context-Engineering ist 2026 das Nachfolger-Paradigma, und es ist deutlich mehr als nur eine neue Worthülse für dasselbe. Simon Willison hat den Begriff geprägt, seitdem ist er etabliert. Hier knapp was es ist und warum es für produktions-reife LLM-Systeme zentral wurde.

In einem Satz

Context-Engineering ist die Disziplin, das Context-Window eines LLMs strukturiert zu gestalten, indem du systematisch entscheidest welche Informationen in welcher Reihenfolge in welchem Format ins Modell gelangen.

Reasoning-Models, einfach erklärt

Thu, 28 May 2026 12:00:00 +0200

OpenAI hat o1 am 12. September 2024 als Preview-Release angekündigt (volle Verfügbarkeit Ende 2024), Anthropic hat Extended-Thinking im Februar 2025 nachgezogen, und seitdem ist “Reasoning-Model” eine eigene Modell-Klasse mit eigenen Trade-offs. Hier knapp was sie unterscheidet, wann sie wirklich helfen, und wann ein normales Modell besser ist.

In einem Satz

Reasoning-Models führen vor der finalen Antwort einen sichtbaren mehrstufigen Denk-Prozess (Chain-of-Thought) aus, der oft deutlich mehr Tokens kostet aber bei komplexen Aufgaben spürbar bessere Resultate liefert.

Voices 2026-05-28: PMF, Agent-Blindstellen, Open-Weight-Gap

Thu, 28 May 2026 12:00:00 +0200

Sieben Stimmen aus dieser Woche. Zwei Strömungen ziehen sich durch: Einerseits Signale, dass KI-Infrastruktur gerade zu einer Utility wird - die grossen Labs haben ihren Markt gefunden, Plattformen greifen regulierend ein, Nutzer weichen aus. Andererseits eine Häufung von Befunden über systematische Blind Spots autonomer Systeme: Agents, die kollaborieren, Research-Agents, die Tunnelblick produzieren, und Entwickler, die beim Pair-Programming zum passiven Passagier werden.

Simon Willison: Anthropic und OpenAI haben Product-Market-Fit gefunden

Was er sagt: Die beiden grossen Labs sind nicht mehr im Modus “wir versuchen herauszufinden, was Leute brauchen”. Sie wissen es. Anthropic hat sich auf Coding und Agents konsolidiert, OpenAI auf den breiten Konsumenten plus Enterprise. Willison argumentiert, dass dieser Befund viel mehr impliziert als bloss gute Quartalszahlen: Wer PMF hat, optimiert und verteidigt statt zu explorieren. Was es für Indie-Builder bedeutet: Die Werkzeuge, gegen die oder mit denen du baust, ändern sich jetzt langsamer und vorhersagbarer. Das ist gut für Planungssicherheit, aber es bedeutet auch, dass die grosse Auseinandersetzung im Ökosystem weniger auf dem Modell-Layer stattfindet und mehr auf dem Integrations- und Produkt-Layer.

RAG (Retrieval-Augmented Generation), einfach erklärt

Thu, 28 May 2026 11:30:00 +0200

RAG ist seit 2023 das dominante Pattern wenn du LLMs mit eigenen Daten arbeiten lassen willst, ohne fine-tuning. Trotz neuer Long-Context-Modelle bleibt es 2026 das verbreitetste Architecture-Pattern in Produktion. Hier knapp erklärt was es ist, wie es funktioniert, und wo die ehrlichen Grenzen liegen.

In einem Satz

RAG ist ein Pattern bei dem ein LLM vor der Antwort relevante Dokumente aus einer eigenen Wissensbasis sucht (typisch via Vector-Search), diese in den Context lädt und dann antwortet.

MCP (Model Context Protocol), einfach erklärt

Thu, 28 May 2026 11:00:00 +0200

Wenn du in den letzten Monaten Indie-Builder-Twitter, Hacker News oder r/LocalLLaMA gelesen hast, ist dir MCP überall begegnet. Anthropic hat das Protocol Ende 2024 released, OpenAI hat es 2025 adoptiert, und seit Anfang 2026 ist es de-facto-Standard für Tool-Integration in Coding-Agents. Hier knapp was es ist und warum es relevant ist.

In einem Satz

MCP ist Anthropics offener Standard, mit dem LLM-Hosts und externe Tool-Server über ein gemeinsames JSON-RPC-Protokoll Capabilities aushandeln und Tool-Calls ausführen.

Verifiable Process Rewards, einfach erklärt

Thu, 28 May 2026 10:00:00 +0200

Diese Woche erschienen gleich drei Arxiv-Paper die eine gemeinsame Frage stellen: Was beim Training von Reasoning-Agenten tatsächlich zählt. Alle drei landen am gleichen Ort - wann und wie ein Modell Feedback bekommt, entscheidet mehr über seine Qualität als der Trainingsalgorithmus selbst.

In einem Satz

Verifiable Process Rewards geben einem Modell nach jedem einzelnen Denkschritt eine prüfbare Rückmeldung, statt erst am Ende zu beurteilen, ob das Gesamtergebnis korrekt ist.

In drei Absätzen

Reinforcement Learning trainiert Modelle über Belohnungssignale. Das klassische Problem bei langen Reasoning-Ketten: Das Signal kommt erst am Ende - entweder hat das Modell die Aufgabe gelöst oder nicht. Diese Spärlichkeit macht es schwer dem Modell beizubringen, wo genau im Denkprozess ein Fehler entstanden ist. Verifiable Process Rewards (VPR) lösen das, indem sie das Feedback auf jeden einzelnen Schritt aufteilen.