#095 KI-Agenten testen – Vom Proof of Concept zum Live-Betrieb mit Josef Küstner

In „Chatbots und KI“ diskutiert Thomas Bahn mit interessanten Gästen aus Wirtschaft und Wissenschaft über Nutzen, Anwendungen und Erfahrungen aus den Bereichen Chatbots und Künstliche Intelligenz. Thema der heutigen Folge: Das Thema KI-Agenten entwickelt sich gerade vom Hype zur praktischen Anwendung. Viele Unternehmen haben erste Projekte in der Proof-of-Concept-Phase umgesetzt. Bevor diese jedoch mit echten Unternehmensdaten und in realen Prozessen produktiv eingesetzt werden können, müssen sie umfangreich getestet werden. Nur so lässt sich sicherstellen, dass sie zuverlässig arbeiten, Sicherheitsvorgaben einhalten und keine wirtschaftlichen oder reputativen Schäden verursachen. In der aktuellen Folge von „Chatbots und KI“ spricht Thomas Bahn mit Dr. Josef Küstner unter anderem darüber, wie solche Tests konkret aussehen sollten und wie sich die Qualität von KI-Agenten bewerten lässt, wenn ihre Ergebnisse nicht deterministisch sind. Außerdem geben sie Anregungen dafür, wie der Übergang von der Testphase in den Live-Betrieb gelingen kann. Zeitstempel: 00:00:00 Einleitung 00:02:43 Aufgaben von KI-Agenten 00:05:13 Warum Agenten getestet werden müssen 00:08:05 Nichtdeterminismus und LLM as a Judge 00:10:58 Monitoring und Benchmarks 00:14:31 Nebeneffekte und Zwischenschritte testen 00:17:34 Effizienz und Eval-Sets 00:19:43 Bewertungsmethoden und Testframeworks 00:21:44 Guardrails und menschliche Kontrolle 00:24:30 Fehlerquoten und Wirtschaftlichkeit 00:26:04 Professionalisierung und Ausblick Über Dr. Josef Küstner: [Josef Küstner]( / josef-kuestner ) hat an der Universität Wien in Mathematik promoviert. Derzeit ist er als wissenschaftlicher Mitarbeiter im KI-Anwendungszentrum von KI.SH an der Christian-Albrechts-Universität zu Kiel tätig. Das KI-Anwendungszentrum dient als zentrale Anlaufstelle für Unternehmen in Schleswig-Holstein bei Fragen rund um den Einsatz von Künstlicher Intelligenz.. Über Thomas Bahn: [Thomas Bahn]( / thomasbahn ) ist Geschäftsführer, Mitgründer und Gesellschafter der assono GmbH. Seit mehr als 25 Jahren berät er deutschlandweit erfolgreich Unternehmen rund um die Themen Software und Digitalisierung. Als Host des Podcasts „Chatbots und KI“ diskutiert Thomas Bahn mit interessanten Gästen aus Wirtschaft und Wissenschaft über Nutzen, Anwendungen und Erfahrungen aus den Bereichen Chatbots und Künstliche Intelligenz. Produktion: [Paul Lendzian Cinematography](https://paullendzian.de/) Bei Fragen oder Anmerkungen freuen wir uns auf Ihre Nachricht an [email protected] Der Podcast wird präsentiert von assono - Wir entwickeln Chatbots, mit denen sich Menschen gerne unterhalten. In 3 Schritten zum eigenen KI-Chatbot-Projekt 1. Informieren Sie sich über das [Chatbot-Angebot](https://www.assono.de/chatbot?utm_sou...) von assono 2. Vereinbaren Sie ein [kostenloses Beratungsgespräch](https://assono.de/termin?utm_source=P...) oder nehmen Sie an einer unserer [Live-Demos](https://www.assono.de/chatbot/demo-te...) teil 3. Starten Sie Ihr Chatbot-Projekt innerhalb weniger Wochen

Andrej Karpathy: From Vibe Coding to Agentic Engineering w/ Stephanie Zhan

Andrej Karpathy: From Vibe Coding to Agentic Engineering w/ Stephanie Zhan

Der Vater der KI: „Wir haben noch 3 Jahre!” Roboter, Singularität & die Zukunft (Jürgen Schmidhuber)

Der Vater der KI: „Wir haben noch 3 Jahre!” Roboter, Singularität & die Zukunft (Jürgen Schmidhuber)

So radikal verändert KI im Jahr 2026 das Internet mit Philipp 'Pip' Klöckner | OMR Education

So radikal verändert KI im Jahr 2026 das Internet mit Philipp 'Pip' Klöckner | OMR Education

Warum die Sperre von Claude Fable vorhersehbar war

Warum die Sperre von Claude Fable vorhersehbar war

Klaus Kallenbrunnen – Wie Unternehmen mit KI wirklich starten (Folge #94)

Klaus Kallenbrunnen – Wie Unternehmen mit KI wirklich starten (Folge #94)

Sandra Navidi: „Billionär Elon Musk ist gefährlich“

Sandra Navidi: „Billionär Elon Musk ist gefährlich“

MIT Just Revealed the AI Bubble's Fatal Flaw

MIT Just Revealed the AI Bubble's Fatal Flaw

Emanuel Böminghaus: „KI ist das ENDE von allem, was ich kenne!" Unternehmen müssen endlich aufwachen

Emanuel Böminghaus: „KI ist das ENDE von allem, was ich kenne!" Unternehmen müssen endlich aufwachen

Constanze Kurz (Chaos Computer Club) über Palantir & KI-Modelle - Jung & Naiv: Folge 827

Constanze Kurz (Chaos Computer Club) über Palantir & KI-Modelle - Jung & Naiv: Folge 827

Polizei-Software: Können wir Palantir ersetzen? | STRG_F

Polizei-Software: Können wir Palantir ersetzen? | STRG_F

«No one is safe»: Yanis Varoufakis on world crisis and next global economic shock

«No one is safe»: Yanis Varoufakis on world crisis and next global economic shock

This is how an AI language model thinks – the surprising truth!

This is how an AI language model thinks – the surprising truth!

The FULL VIDEO of Trump they didn’t want released

The FULL VIDEO of Trump they didn’t want released

Deutscher Geheimdienst: So werden wir alle überwacht

Deutscher Geheimdienst: So werden wir alle überwacht

#90 - KI- und Vibe-Coding für Unternehmen, Teil 2: Diese Fehler sollten Sie vermeiden

#90 - KI- und Vibe-Coding für Unternehmen, Teil 2: Diese Fehler sollten Sie vermeiden

KI-Forscher: Vergiss ChatGPT, DAS ist der nächste Durchbruch! Weltmodelle erklärt (Daniel Cremers)

KI-Forscher: Vergiss ChatGPT, DAS ist der nächste Durchbruch! Weltmodelle erklärt (Daniel Cremers)

ChatGPT, Gemini, Claude & Co erklärt: Wie Maschinen Sprache verstehen | Terra X Lesch & Co

ChatGPT, Gemini, Claude & Co erklärt: Wie Maschinen Sprache verstehen | Terra X Lesch & Co

Attacking AI - Jason Haddix - NDC Security 2026

Attacking AI - Jason Haddix - NDC Security 2026

New Corona Revelations: What Was Christian Drosten’s Role? | NIUS Live

New Corona Revelations: What Was Christian Drosten’s Role? | NIUS Live

#90 - KI- und Vibe-Coding für Unternehmen, Teil 2: Diese Fehler sollten Sie vermeiden

#90 - KI- und Vibe-Coding für Unternehmen, Teil 2: Diese Fehler sollten Sie vermeiden