Interaction Models | KI News

Diese Woche stellen Thinking Machines, das Startup von Ex-OpenAI-Chefin Mira Murati, ihre Interaction Models vor. Statt der klassischen Turn-Based-Interaktion verarbeitet das Modell zwei parallele Streams in 200-Millisekunden-Häppchen, wodurch echte Pausen, Unterbrechungen und kontinuierliche Reaktionen möglich werden. Im Vergleich zu Modellen wie GPT Realtime fühlt sich das Gespräch dadurch weniger holprig an, ähnlich dem Unterschied zwischen Remote-Meeting und Vor-Ort-Treffen. Anthropic mietet komplett das Colossus 1 Rechenzentrum von Elon Musks xAI, das größte Single-Site Rechenzentrum, das je gebaut wurde. Die 0,3 Gigawatt Rechenleistung kosten geschätzt 400 bis 700 Millionen Dollar pro Monat, und Anthropic hat im Zuge dessen die 5-Stunden-Rate-Limits verdoppelt. Spannend ist die Frage, warum xAI überhaupt Kapazität abgibt, denn das wirkt fast wie ein Zeichen, dass es bei Musks KI-Sparte gerade nicht so rund läuft. METR hat seinen Benchmark zur unbeaufsichtigten Aufgabenbearbeitung aktualisiert und dabei das nicht öffentlich verfügbare Mythos-Modell evaluiert. Die Verdopplungszeit für die Aufgabenlänge liegt weiterhin bei rund 100 Tagen, der Benchmark stößt aber bei 16 Stunden inzwischen an seine Aussagegrenze. Besonders sehenswert ist die neue Visualisierung, in der jeder einzelne Task mit seiner Lösungsrate dargestellt wird. Scale stellt mit SWE Atlas einen Benchmark zu Refactoring, Test Writing und Codebase QA vor, der nicht nur prüft, ob Tests grün bleiben, sondern via LLM-Judge auch die innere Code-Qualität bewertet. Die Modelle holen bei den reinen Test-Pass-Raten teils über 75 Prozent, fallen beim Rubric-Pass aber deutlich darunter ab. Genau diese innere Qualität fehlt in den meisten Benchmarks und ist gerade deshalb wichtig, weil agent-friendly Code immer auch hohe Code-Qualität bedeutet. OpenAI veröffentlicht im Wochentakt neue Security-Features: Codex Security ist eine spezialisierte Variante von Codex, die Threat Models erstellt, priorisiert und Sicherheitslücken patcht. Dazu kommt GPT-5.5 Cyber mit weniger restriktiven Guardrails sowie Daybreak als Sammelbegriff für die Cyber-Initiativen von OpenAI. Es wird immer deutlicher, dass KI das Finden und Schließen von Sicherheitslücken massiv beschleunigt, mit allen Konsequenzen. Links: Interaction Models von Thinking Machines: https://thinkingmachines.ai/blog/inte... https://www.latent.space/p/ainews-thi... Anthropic mietet Colossus 1: https://www.anthropic.com/news/higher... https://x.com/celestepoasts/status/20... https://xcancel.com/celestepoasts/sta... METR Update mit Mythos Preview: https://metr.org/time-horizons/ https://github.com/METR/hcast-public SWE Atlas Refactoring Benchmark: https://labs.scale.com/papers/sweatlas OpenAI Codex Security, GPT-5.5 Cyber und Daybreak: https://openai.com/index/codex-securi... https://openai.com/index/gpt-5-5-with... https://openai.com/daybreak/ ______________ Bei "KI NEWS" erfährst du alles über die neuesten Erkenntnisse, Tools, Upgrades und Methoden aus der Welt der KI. Verpasse nicht die Chance, aktiv an diesen spannenden Entwicklungen teilzunehmen. Hast du schon Erfahrungen mit den neuen Tools, Methoden oder Upgrades gemacht? - Du kannst auch gerne in den Kommentaren unter dem Video mitdiskutieren und deine Gedanken und Fragen teilen. ______________ Steve Haupt arbeitet seit über 5 Jahren als agiler Softwareentwickler bei ‪@andrenaobjects‬ Obwohl es oft eine Herausforderung ist, hohe Qualität in Projekten mit komplexen Anforderungen und Technologien zu erreichen, setzt Steve es sich zum Ziel, diesem Ideal durch die Anwendung von Scrum und Techniken aus dem Extreme Programming so nahe wie möglich zu kommen. Besonders fasziniert ist Steve von den aktuellen Entwicklungen im Bereich der künstlichen Intelligenz und reflektiert intensiv über die Implikationen dieser Technologien für das Handwerk der Softwareentwicklung. ______________ Vielen Dank an das Team rund um den developers club für den Dreh, den Schnitt, den Content, die Konzeptentwicklung uvm.! Wenn du mehr über den Club erfahren möchtest, schaue dich auf der Webseite um: 😎 https://developers-club.de/ Für mehr Videos abonniert unbedingt unseren YouTube Channel: 🔔 / ‪@developers-club‬ ______________ Interesse daran dein Thema beim developers club mit der Community zu teilen? 💪 https://developers-club.de/mitmachen/