<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Benchmarks on kaschnai</title><link>https://kaschnai.ch/tags/benchmarks/</link><description>Recent content in Benchmarks on kaschnai</description><generator>Hugo</generator><language>de</language><lastBuildDate>Fri, 29 May 2026 10:30:00 +0200</lastBuildDate><atom:link href="https://kaschnai.ch/tags/benchmarks/index.xml" rel="self" type="application/rss+xml"/><item><title>Claude Opus 4.8: 'modest but tangible' und eine geteilte Community</title><link>https://kaschnai.ch/deep-dives/2026-05-28-claude-opus-4-8-versprechen-und-stimmen/</link><pubDate>Thu, 28 May 2026 18:30:00 +0200</pubDate><guid>https://kaschnai.ch/deep-dives/2026-05-28-claude-opus-4-8-versprechen-und-stimmen/</guid><description>&lt;p>Am 28. Mai 2026 hat Anthropic Claude Opus 4.8 veröffentlicht, und die offizielle Einordnung ist auffällig zurückhaltend: eine &amp;ldquo;modest but tangible improvement on its predecessor&amp;rdquo;. Auf den Benchmarks führt das Modell trotzdem klar, bei Artificial Analysis steht es auf Platz eins. Die Frühreaktion der Community fällt deutlich gemischter aus. Zwischen &amp;ldquo;endlich brauchbar&amp;rdquo; und &amp;ldquo;schon wieder ein Versionssprung ohne spürbaren Nutzen&amp;rdquo; liegt der ganze Streit.&lt;/p>
&lt;p>Das ist die eigentliche Spannung dieses Releases. Auf der einen Seite ein Modell, das auf jeder Messlatte vorne liegt. Auf der anderen Seite eine Nutzerschaft, die den Unterschied zum Vorgänger im Alltag kaum noch greifen kann. Beide Seiten haben Argumente, die man ernst nehmen sollte.&lt;/p></description></item></channel></rss>