Interaction Models | KI News

Diese Woche stellen Thinking Machines, das Startup von Ex-OpenAI-Chefin Mira Murati, ihre Interaction Models vor. Statt der klassischen Turn-Based-Interaktion verarbeitet das Modell zwei parallele Streams in 200-Millisekunden-Häppchen, wodurch echte Pausen, Unterbrechungen und kontinuierliche Reaktionen möglich werden. Im Vergleich zu Modellen wie GPT Realtime fühlt sich das Gespräch dadurch weniger holprig an, ähnlich dem Unterschied zwischen Remote-Meeting und Vor-Ort-Treffen. Anthropic mietet komplett das Colossus 1 Rechenzentrum von Elon Musks xAI, das größte Single-Site Rechenzentrum, das je gebaut wurde. Die 0,3 Gigawatt Rechenleistung kosten geschätzt 400 bis 700 Millionen Dollar pro Monat, und Anthropic hat im Zuge dessen die 5-Stunden-Rate-Limits verdoppelt. Spannend ist die Frage, warum xAI überhaupt Kapazität abgibt, denn das wirkt fast wie ein Zeichen, dass es bei Musks KI-Sparte gerade nicht so rund läuft. METR hat seinen Benchmark zur unbeaufsichtigten Aufgabenbearbeitung aktualisiert und dabei das nicht öffentlich verfügbare Mythos-Modell evaluiert. Die Verdopplungszeit für die Aufgabenlänge liegt weiterhin bei rund 100 Tagen, der Benchmark stößt aber bei 16 Stunden inzwischen an seine Aussagegrenze. Besonders sehenswert ist die neue Visualisierung, in der jeder einzelne Task mit seiner Lösungsrate dargestellt wird. Scale stellt mit SWE Atlas einen Benchmark zu Refactoring, Test Writing und Codebase QA vor, der nicht nur prüft, ob Tests grün bleiben, sondern via LLM-Judge auch die innere Code-Qualität bewertet. Die Modelle holen bei den reinen Test-Pass-Raten teils über 75 Prozent, fallen beim Rubric-Pass aber deutlich darunter ab. Genau diese innere Qualität fehlt in den meisten Benchmarks und ist gerade deshalb wichtig, weil agent-friendly Code immer auch hohe Code-Qualität bedeutet. OpenAI veröffentlicht im Wochentakt neue Security-Features: Codex Security ist eine spezialisierte Variante von Codex, die Threat Models erstellt, priorisiert und Sicherheitslücken patcht. Dazu kommt GPT-5.5 Cyber mit weniger restriktiven Guardrails sowie Daybreak als Sammelbegriff für die Cyber-Initiativen von OpenAI. Es wird immer deutlicher, dass KI das Finden und Schließen von Sicherheitslücken massiv beschleunigt, mit allen Konsequenzen. Links: Interaction Models von Thinking Machines: https://thinkingmachines.ai/blog/inte... https://www.latent.space/p/ainews-thi... Anthropic mietet Colossus 1: https://www.anthropic.com/news/higher... https://x.com/celestepoasts/status/20... https://xcancel.com/celestepoasts/sta... METR Update mit Mythos Preview: https://metr.org/time-horizons/ https://github.com/METR/hcast-public SWE Atlas Refactoring Benchmark: https://labs.scale.com/papers/sweatlas OpenAI Codex Security, GPT-5.5 Cyber und Daybreak: https://openai.com/index/codex-securi... https://openai.com/index/gpt-5-5-with... https://openai.com/daybreak/ ______________ Bei "KI NEWS" erfährst du alles über die neuesten Erkenntnisse, Tools, Upgrades und Methoden aus der Welt der KI. Verpasse nicht die Chance, aktiv an diesen spannenden Entwicklungen teilzunehmen. Hast du schon Erfahrungen mit den neuen Tools, Methoden oder Upgrades gemacht? - Du kannst auch gerne in den Kommentaren unter dem Video mitdiskutieren und deine Gedanken und Fragen teilen. ______________ Steve Haupt arbeitet seit über 5 Jahren als agiler Softwareentwickler bei ‪@andrenaobjects‬ Obwohl es oft eine Herausforderung ist, hohe Qualität in Projekten mit komplexen Anforderungen und Technologien zu erreichen, setzt Steve es sich zum Ziel, diesem Ideal durch die Anwendung von Scrum und Techniken aus dem Extreme Programming so nahe wie möglich zu kommen. Besonders fasziniert ist Steve von den aktuellen Entwicklungen im Bereich der künstlichen Intelligenz und reflektiert intensiv über die Implikationen dieser Technologien für das Handwerk der Softwareentwicklung. ______________ Vielen Dank an das Team rund um den developers club für den Dreh, den Schnitt, den Content, die Konzeptentwicklung uvm.! Wenn du mehr über den Club erfahren möchtest, schaue dich auf der Webseite um: 😎 https://developers-club.de/ Für mehr Videos abonniert unbedingt unseren YouTube Channel: 🔔 / ‪@developers-club‬ ______________ Interesse daran dein Thema beim developers club mit der Community zu teilen? 💪 https://developers-club.de/mitmachen/

SpaceX Was Just the First!

SpaceX Was Just the First!

Fable 5 | KI News

Fable 5 | KI News

ProgramBench | KI News

ProgramBench | KI News

Der Todesstern ist völlig absurd

Der Todesstern ist völlig absurd

Why Trump and Putin are currently failing – Analysis with military economist Keupp I ZDFheute live

Why Trump and Putin are currently failing – Analysis with military economist Keupp I ZDFheute live

From MVP to Operating System — Sumbios Levels Up

From MVP to Operating System — Sumbios Levels Up

Inside Anthropic, the $965 Billion AI Juggernaut | The Circuit

Inside Anthropic, the $965 Billion AI Juggernaut | The Circuit

Unfortunately, I Was Right

Unfortunately, I Was Right

Affäre Lügenfritz und Bärbel Bas als Motorradbraut

Affäre Lügenfritz und Bärbel Bas als Motorradbraut

SpaceX - Größter Börsengang der Geschichte - Unternehmerische Sicht - Umsatz, Bewertung, Kurse

SpaceX - Größter Börsengang der Geschichte - Unternehmerische Sicht - Umsatz, Bewertung, Kurse

Gemini 3.5-Flash | AI News

Gemini 3.5-Flash | AI News

Trumps irre WM-Pläne | Homophobie im Profifussball | extra 3 vom 11.06.2026 · Teil 1/2

Trumps irre WM-Pläne | Homophobie im Profifussball | extra 3 vom 11.06.2026 · Teil 1/2

Ex-Google Officer: You Only Have 3 Years Left Before It Hits! - Mo Gawdat

Ex-Google Officer: You Only Have 3 Years Left Before It Hits! - Mo Gawdat

Die Wahrheit über die Öffentlich-Rechtlichen

Die Wahrheit über die Öffentlich-Rechtlichen

DAS war das letzte Problem von KI am Telefon - JETZT gelöst! (Fonio Mega-Update & 17 Mio€ Funding)

DAS war das letzte Problem von KI am Telefon - JETZT gelöst! (Fonio Mega-Update & 17 Mio€ Funding)

Trump Preps for 80th Birthday, Threatens to Hit Iran, Knicks Historic Win & Elon Musk Trillionaire!?

Trump Preps for 80th Birthday, Threatens to Hit Iran, Knicks Historic Win & Elon Musk Trillionaire!?

Predictive Processing Community Project Weekly Meeting - 6/2/2026

Predictive Processing Community Project Weekly Meeting - 6/2/2026

OpenClaw: The Viral AI Agent that Broke the Internet - Peter Steinberger | Lex Fridman Podcast #491

OpenClaw: The Viral AI Agent that Broke the Internet - Peter Steinberger | Lex Fridman Podcast #491

GPT-5.5 | KI News

GPT-5.5 | KI News

Fable 5: Claude Mythos with lobotomy is PUBLIC

Fable 5: Claude Mythos with lobotomy is PUBLIC