Best Practices, um Agentic-AI-Systeme aufzubauen
Experten wissen am besten, wie Agentic-AI-Erfolg in der Praxis geht. Also haben wir sie gefragt.dotshock | shutterstock.com
Agentic-AI-Systeme werden mittlerweile für diverse Geschäftsbereiche entwickelt. Die agentenzentrierte Entwicklung hält jedoch auch neue Fallstricke und Sicherheitslücken bereit. Teams, die Agenten entwickeln, die sich in andere Systeme integrieren und mehrstufige Workflows ausführen, kommen deshalb um eine ordentliche Planung nicht herum.
Umso mehr, weil der KI-ROI bislang vierlerorts auch überschaubar ausfällt. So hat der KI-Anbieter Alteryx im Rahmen einer aktuellen Umfrage festgestellt, dass weniger als die Hälfte der befragten Unternehmen messbare Auswirkungen ihrer Agentic-AI-Inititiaven verzeichnen kann.
Für diesen Artikel haben wir zahlreiche KI-Experten aus namhaften Unternehmen gefragt, welche Zutaten aus ihrer Sicht nötig sind, um erfolgreiche, agentische Systeme in der Praxis zu entwickeln.
Agentic-AI-Komponenten im Überblick
Agentic-AI-Systeme bestehen aus einer Handvoll Bausteinen, die unterschiedliche Zwecke erfüllen und zusammen ein Softwarearchitekturgeflecht ausbilden. Ari Weil, Cloud-Evangelist beim Sicherheitsanbieter Akamai, vergleicht die Entwicklung eines KI-Agenten mit dem Aufbau eines Nervensystems: „Dieses System umfasst Reasoning-, Memory-, Kontexterfassungs-, Koordinations- und Validierungs-Layer sowie Human-in-the-Loop-Leitplanken.“
Im Folgenden werfen wir einen eingehenden Blick auf sämtliche dieser Komponenten.
Reasoning-Modell
„Ein Schlussfolgerungsmodell bildet den Kern jedes agentischen Systems“, konstatiert Frank Kilcommins, Head of Enterprise Architecture beim KI-Spezialisten Jentic. Diese Reasoning-Engine nimmt die Planung auf der Grundlage des Benutzer-Prompts vor – in Kombination mit dem vorliegenden Kontext und den verfügbaren Fähigkeiten.
Wie Andrew McNamara, Director of Applied Machine Learning bei Shopify, weiß, sind dabei manche Reasoning-Modelle besser geeignet als andere: „Wir suchen gezielt nach Modellen, die sich ‚agentisch anfühlen‘. Diese Modelle verfügen über die richtige Anzahl an Tool-Calls und zeichnen sich durch ausgeprägtes Instruction Following aus, das sich leicht prompten und steuern lässt.“
Kontext & Daten
Im nächsten Schritt benötigen KI-Agenten Kontext. Dieser kann unterschiedliche Formen annehmen. Dazu gehören beispielsweise:
interne Unternehmensdaten,
institutionelles Wissen und Richtlinien,
System-Prompts,
externe Daten,
gespeicherte Chats, oder
agentenbezogene Metadaten.
Quellen für diese Daten bilden dabei etwa Datenbanken und APIs, RAG-Systeme, Vektordatenbanken oder auch externe Systeme. Um die Daten zu organisieren und den Retrieval-Prozess zu optimieren, bauen einige Unternehmen aktiv Wissensdatenbanken für KI-Agenten auf. Parallel zeichnen sich hinter semantischen Abrufprozessen auch Muster ab, die agentische Context-Management-Systeme antreiben.
Anusha Kovi, Business-Intelligence-Engineer bei Amazon, hat auch noch einen Tipp in Sachen Memory auf Lager: „Hier kombinieren die meisten Teams einen Vektorspeicher wie pgvector mit etwas Strukturiertem wie einem Data Catalog oder einem Knowledge-Graphen.“
Tools & Discovery
Statischer Kontext ist jedoch nicht genug, um KI-Agenten handlungsfähig zu „machen“. Dazu benötigen sie Lese- und Schreibzugriff auf Datenbanken, Tools und APIs. Als universeller Konnektor zwischen KI-Agenten und Systemen hat sich die Branche bereits weitgehend auf das Model Context Protocol (MCP) geeinigt. Entsprechend entstehen in Unternehmen auch bereits MCP-Register, um Fähigkeiten für Agenten in großem Maßstab zu vereinheitlichen und zu katalogisieren.
Bezüglich der Verwendung von MCP in agentenbasierten Architekturen sind etliche Fallstudien öffentlich verfügbar – zum Beispiel vom Zahlungsdienstleister Block oder dem iPaaS-Anbieter Workato.
Definierte Workflows
Eine weitere nützliche Komponente sind klar dokumentierte Workflows für gängige Prozesse – etwa mehrstufige Aktionen, die mit MCP-Servern oder direkten API-Calls verknüpft sind. „Entscheidend ist, dass KI-Agenten durch definierte Workflows koordiniert werden. Dann skaliert die Autonomie auf vorhersehbare, kontrollierte Art und Weise, statt ins Chaos abzudriften“, hält Heath Ramsey, Group VP of AI bei ServiceNow, fest.
Jentic-Manager Kilcommins rät an dieser Stelle zu klaren, maschinenlesbaren Fähigkeitsdefinitionen – und verweist dabei auf die Arazzo-Spezifikation. Dabei handelt es sich um einen Industriestandard, der der OpenAPI-Initiative entsprungen ist.
Multi-Agenten-Orchestrierung
Unternehmen, die mit Multi-Agenten-Systemen arbeiten wollen, brauchen zudem KI-Agenten, die sich auch miteinander integrieren lassen und gut in kontinuierliche Feedback-Loops passen. „Notwendig werden Multi-Agenten-Systeme erst bei entsprechendem Umfang. Dann kommt statt eines generalistisch angelegten Agenten ein Team aus mehreren, spezialisierten Agenten zum Einsatz – etwa für Reasoning, Retrieval und Validierung“, erklärt Anurag Gurtu, CEO beim KI-Startup AIRRIVED.
Diese Realität erfordert ein verbindendes Element, wie Amazon-Expertin Kovi auf den Punkt bringt: „Im Kern braucht man eine Orchestrierungsschicht für den Plan-Do-Evaluate-Zyklus.“
Zu den gängigen Tools zählen diesem Bereich laut der BI-Spezialistin:
LangGraph, ein Low-Level-Orchestrierungs-Framework,
CrewAI, ein Python-Framework für die Multi-Agenten-Orchestrierung, und
Bedrock Agents, das KI-Agenten dabei unterstützt, mehrstufige Tasks zu automatisieren.
Darüber hinaus dürften künftig auch offene Standards und Protokolle wie A2A weiter an Bedeutung gewinnen, wenn es darum geht, KI-Agenten zu effektiver Zusammenarbeit zu befähigen.
Security & Autorisierung
Weil LLMs bekanntlich dazu neigen, zu halluzinieren und sich anderweitig „danebenzubenehmen“, ist Security wahrscheinlich eines der wichtigsten Elemente, um sichere Agentic-AI-Systeme aufzubauen. „Sobald Agenten Zugriffsrechte ändern, Workflows auslösen oder Incidents beheben können, wird jede nicht geregelte Entscheidung zu einem potenziellen Kontrollversagen“, bringt es AIRRIVED-CEO Gurtu auf den Punkt.
Weil das potenzielle Ausmaß unkontrollierter, verketteter Executions gewaltig ist, braucht es klar definierte Berechtigungen für KI-Agenten, die Privlege Escalation und die Offenlegung sensibler Daten verhindern. Allerdings sind im Fall von agentischen Systemen differenzierte Security-Methoden angebracht, wie Amazon-Expertin Kovi festhält: „Ein Agent entscheidet zur Laufzeit, was abgefragt und welche Tools aufgerufen werden sollen. Deshalb kann man Berechtigungen nicht auf herkömmliche Weise definieren.“
Um das „Non-Human Internet“ der Zukunft abzusichern, sehen viele Experten Just-in-Time-Autorisierung als entscheidend an.
Menschliche Checkpoints
Selbst mit fortschrittlicher Authentifizierung und Autorisierung erfordern sensible Agentenaktionen die Genehmigung von Menschen. Zumindest sollten sie das. Deshalb setzt auch Shopify auf „Human-in-the-Loop by Design“, wie McNamara erklärt: „Wir haben Genehmigungsschritte eingeführt, um vollständig autonome Veränderungen an Produktionssystemen zu verhindern. Das ermöglicht beispielsweise Händlern, KI-generierte Inhalte zu überprüfen, bevor diese live gehen.“
Wenig überraschend, sieht man das beim Finanzdienstleister Block ähnlich, wie Jackie Brosamer, Head of Data und AI, erklärt: „Unsere allgemeine Regel lautet: Alles, was Produktionssysteme berührt, benötigt menschliche Kontrollpunkte.“
Evaluierungs-Fähigkeiten
Agentic-AI-Systeme aufzubauen, erfordert zudem umfangreiche Tests im Vorfeld. Nur so lässt sich evaluieren, ob die tatsächlichen mit den beabsichtigten Ergebnissen übereinstimmen.
Shopify setzt zu diesem Zweck sowohl auf menschliche Tester als auch auf Simulationen mit spezialisierten, LLM-basierten „Richtern“: „Sobald dieser ‚Richter‘ zuverlässig mit den menschlichen Bewertern übereinstimmt, kann man dem System vertrauen“, meint McNamara.
Verhaltens-Observability
Observability ist ein weiterer essenzieller Layer für agentische Systeme. Im Fall von KI-Agenten muss das allerdings über traditionelles Monitoring und Fehlererkennung hinausgehen. Vielmehr gilt es, erweiterte Signale zu erfassen – etwa, warum ein Agent eine bestimmte Aktion einer anderen bevorzugt hat.
„Observability muss von Anfang in Ihr Agentic-AI-System integriert sein. Man braucht Transparenz in jedem Execution-Schritt – bei Prompts, Tool-Calls, intermediären Entscheidungen und den finalen Outputs“, mahnt Edgar Kussberg, Product Director for AI beim Dev-Tool-Anbieter Sonar.
Wenn Ihre KI-Agenten „observable“ sind, können Sie Ihr System zudem kontinuierlich optimieren.
Kontextoptimierungs-Strategien
Nahezu alle Experten, mit denen wir gesprochen haben, sind sich in einem Punkt einig: Es ist weitaus besser, KI-Agenten lediglich minimale, aber dafür relevante Daten zur Verfügung zu stellen – statt sie mit Informationen zu überfrachten. Das ist entscheidend, um eine Überlastung der Kontextfenster und eine Verschlechterung der Output-Qualität zu vermeiden – wie auch Block-Managerin Brosamer konstatiert: „Eine durchdachte Datenkuratierung ist weitaus wichtiger als das Datenvolumen. Die Output-Qualität eines Agenten hängt direkt von der Qualität seines Kontexts ab.“
Die Engineers bei Block pflegten zu diesem Zweck übersichtliche README-Dateien und wendeten einheitliche Dokumentationsstandards sowie gut strukturierte Projekthierarchien an, so Brosamer. Darüber hinaus hielten sie auch weitere, semantische Konventionen ein, die die Agenten dabei unterstützten, relevante Informationen zu finden.
„Effektive Systeme geben Agenten vielseitige Suchwerkzeuge an die Hand und ermöglichen es ihnen, Retrieval-Loops zu durchlaufen, bis sie über ausreichenden Kontext verfügen“, meint Sonar-Mann Kussberg. Die vorherrschende Philosophie ist die schrittweise Offenlegung von Informationen. Das nimmt man sich auch bei Shopify zu Herzen und setzt auf eine modulare Instruction Delivery. McNamara erklärt: „Kontext just-in-time bereitzustellen, ist entscheidend. Statt den System-Prompt zu überladen, liefern wir relevanten Kontext zusammen mit den Tool-Daten, wenn dieser benötigt wird.“
Amazon-Expertin Kovi weist zudem darauf hin, dass der Kontext auch semantische Nuancen beinhalten sollte: „Wenn ein KI-Agent nicht weiß, dass ‚aktive Nutzer‘ im Produktbereich etwas anderes bedeutet als im Marketing, wird er selbstbewusst falsche Antworten geben – und das ist schwer zu erkennen.“
Architektonische Best Practices
Agentic AI liegt im Trend und kann unter den richtigen Voraussetzungen einiges leisten. Daraus folgt allerdings nicht, dass ab sofort alles agentenbasiert ablaufen muss. So eignet sich etwa die Kombination von LLMs und MCP-Integrationen hervorragend für Situationen, in denen hochskalierbare, situationsbewusste Reasoning- und Reaktionsfähigkeiten gefragt sind. Für repetitive, deterministische Automatisierungen kann MCP allerdings einen „Overkill“ darstellen – insbesondere, wenn der Kontext statisch und die Sicherheitsanforderungen streng sind.
Kilkommins empfiehlt deshalb, zunächst zu bestimmen, welche Verhaltensweisen adaptiv und welche deterministisch sind – und dann Letzteres zu kodifizieren: „Das ermöglicht den Agenten, definierte programmierte Verhaltensweisen zu initiieren und sorgt für mehr Stabilität.“
Die Bestimmung der wichtigsten Bereiche für agentische Prozesse laufe letztlich auch darauf hinaus, wiederverwendbare Anwendungsfälle zu finden, gibt ServiceNow-Manager Ramsey zu bedenken: „Unternehmen, die Agentic AI erfolgreich eingesetzt haben, identifizieren im ersten Schritt meist einen Prozess mit hohem Reibungsverlust. Dazu könnten Serviceanfragen von Mitarbeitern oder die Reaktion auf Kundenvorfälle gehören.“
Gurtu ergänzt, dass KI-Agenten am besten funktionieren, wenn ihnen konkrete Geschäftsziele vorgegeben werden. „Beginnen Sie mit Entscheidungen, nicht mit Demos. Was nicht funktioniert, ist, Agenten wie zustandslose Chatbots zu behandeln oder Menschen über Nacht mit ihnen zu ersetzen.“
Kussberg ist hingegen davon überzeugt, dass Agenten mit eingeschränkter Autonomie bessere Ergebnisse liefern: „KI-Agenten arbeiten am besten als Spezialisten, nicht als Generalisten.“
Shopify setzt beispielsweise klare Grenzen bei der Skalierung von Tools – und hat sich für eine Sub-Agenten-Architektur entschieden, wie McNamara erklärt: „Unsere Empfehlung lautet eigentlich, Multi-Agenten-Architekturen anfangs zu vermeiden. Wir steigen nun mit dem richtigen Ansatz in Sub-Agenten ein. Ein Schlüsselprinzip besteht dabei darin, Low-Level-Tools zu entwickeln und dem System beizubringen, natürliche Sprache in diese Low-Level-Sprache zu übersetzen – anstatt Tools für jedes Szenario aufzubauen.“
Einige weitere Tipps unserer Gesprächspartner, um Agentic-AI-Systeme zu konzeptionieren und umzusetzen:
Nutzen Sie offene Infrastrukturen: Offene Agenten und herstellerunabhängige Frameworks ermöglichen es, die Modelle einzusetzen, die für den jeweiligen Anwendungsfall am besten geeignet sind.
Denken Sie „API-first“: Ein gutes API-Design und klare, maschinenlesbare Definitionen sind die beste Art der Vorbereitung auf KI-Agenten.
Halten Sie Daten synchron: Die Synchronisation gemeinsam genutzter Daten ist eine weitere Herausforderung. Diese lässt sich mit Event-gesteuerten Architekturen meistern.
Balance zwischen Zugriff und Kontrolle schaffen: Um die Sicherheit agentischer Systeme zu gewährleisten, sind proaktive Security-Maßnahmen, umfassende Audit-Protokolle und eine defensive Datenvalidierung erforderlich.
Verbessern Sie kontinuierlich: Um Agenten-Drift zu vermeiden, müssen Agentic-AI-Systeme zwangsläufig fortlaufend gewartet werden.
Die Zukunft agentischer Systeme
Mit Blick auf die Zukunft rechnen Experten damit, dass künftig vor allem Multi-Agenten-Systeme entwickelt werden. Das dürfte den Bedarf an komplexeren Orchestrierungs-Mustern und den Verbreitungsgrad offener Standards weiter fördern.
„Ich gehe davon aus, dass wir im Jahr 2026 Experimente mit Frameworks sehen werden, um Agenten-‚Fabriken‘ zu strukturieren, die komplexe Wissensarbeit koordinieren“, meint Block-Entscheiderin Brosamer. Die größte Herausforderung werde dann darin bestehen, existierende Informationsflüsse für agentische Anwendungsfälle zu optimieren.
Ein anderer Aspekt, der in dieser Zukunft an Bedeutung gewinnen könnte, sind alternative Cloud-Angebote und Edge-basierte Inferenz. So könnten künftig spezifische Workloads aus zentralisierten Cloud-Architekturen ausgelagert und die Latenz reduziert werden. Akamai-Experte Weil erklärt: „Wettbewerbsfähige KI erfordert künftig nicht nur Rechenleistung, sondern auch Nähe. KI-Agenten müssen in der realen Welt agieren und mit Nutzern, Devices und Daten nahezu in Echtzeit interagieren können.“ (fm)
Dieser Artikel ist im Original bei unserer Schwesterpublikation Infoworld.com erschienen.
Hier finden Sie den kompletten Artikel: