Bereit für agentenbasiertes Codieren in großem Maßstab?

von Michael Heß, Head of AI
Agentenbasierte KI verschlimmert alle Probleme und Risiken, die bei der Software-Entwicklung mit GenAI auftreten, um ein Vielfaches.
Belege für die heutigen Probleme finden Sie in Teil 1 der GenAI-Beitragsreihe. Dieser Folgeartikel blickt in die Zukunft. Grundannahme: In den nächsten 24 bis 36 Monaten werden agentische Coding Tools Teams nicht ersetzen, aber sie werden uns zwingen, die Art und Weise, wie wir spezifizieren, verifizieren, messen und uns organisieren, zu überdenken. Wer heute die richtigen Themen fokussiert, kann in Zukunft große Chancen ergreifen.
Wir werden den vor uns liegenden Weg anhand von fünf Perspektiven untersuchen, die auf dem aktuellen Stand der Forschung basieren: Menschen, Organisation, Technik, Messung und Chancen. Wir hoffen, dass Sie klare, evidenzbasierte Erkenntnisse darüber gewinnen können, wie Sie von agentenbasierten Codierungstools profitieren können.
Organisatorische Perspektive
Agentenbasierte KI hat das Potenzial, die Art und Weise zu verändern, wie Organisationen Software entwickeln und bereitstellen. Die Herausforderung liegt nicht in der Einführung schnellerer Tools, sondern in der Anpassung von Arbeitsabläufen, Rollen und Leitplanken, um sicherzustellen, dass die gesteigerte Produktivität nicht zu einem Verlust an Kohärenz führt.
Teamtopologie: die Folgen einer gesteigerten Produktivität
Wie werden sich Teams verändern, wenn Agentic Coding Tools die Produktivität erheblich steigern?
- Scrum definiert Teams als crossfunktional, was bedeutet, dass sie idealerweise ohne externe Abhängigkeiten in jedem Sprint Wert schaffen können. Wenn Agentic Coding Tools die Produktivität steigern und die Fähigkeiten erweitern, welche Aspekte der Crossfunktionalität bleiben dann beim Menschen, welche verlagern sich auf Service-Schnittstellen und Automatisierungen?
- Was passiert, wenn mehr Arbeit schnell erledigt werden kann? Verkürzen Teams Planungszyklen, um den Überprüfungs- und Freigabeprozess nicht zu überfordern? Agile Experten sagen bereits kürzere Zyklen voraus, da die Kapazitäten steigen, die Bedeutung von Zeremonien abnimmt und die Sicherheitsvorkehrungen zunehmen.
- Wenn die Koordinationslast zwischen Diensten statt zwischen Funktionen zunimmt, werden sich Skalierungsframeworks dann von zusätzlichen Besprechungen hin zu einer Stärkung von Schnittstellenverträgen, Prüfpfaden und automatisierten Handshakes zwischen Teams und Diensten verlagern? Mehr Prozesse und Tools?
Bottlenecks
Automatisierung verlagert Bottlenecks, sie beseitigt sie nicht. Mögliche Kandidaten, auf die man als neue ottelnecks achten sollte:
- Orchestrierungsfähigkeit: Koordination vieler gleichzeitiger Interaktionen zwischen Mensch und Agent über Dienste, Repositorys und Pipelines hinweg.
- Spezifizierung: Mehrdeutige Ziele führen immer noch zu Nacharbeiten, aber klare, testbare Spezifikationen an der Schnittstellengrenze reduzieren Thrash und erhöhen die Produktivität.
- Verifizierungsaufwand: Das Überprüfen, Testen und Integrieren von Agenten-Output kann zu einem menschlichen Engpass führen.
Arbeiten innerhalb begrenzter Service-Schnittstellen
Noch sind Agenten auf klar definierte Grenzen beschränkt, typischerweise in Form von containerisierten Umgebungen. Dies deutet darauf hin, dass effektive Autonomie auf Systeme beschränkt ist und sich nicht frei über Stacks erstreckt. Was passiert jedoch, wenn diese Grenzen zu verschwimmen beginnen? Was passiert beispielsweise, wenn Agenten Änderungen über Dienste hinweg anfordern oder implementieren? Der kurze Dienstweg von Agent zu Agent?
People Lens
Neudefinition von Rollen und Kompetenzen
Die menschliche Dimension der Softwareentwicklung entwickelt sich weiter. Mit der Weiterentwicklung von KI-Systemen von assistierenden Copiloten zu autonomen Agenten verlagert sich die Rolle der Entwickler und Entwicklerinnen von der Ausführung zur Steuerung. Die DORA-Daten für 2025 spiegeln diese Veränderung bereits wider: Obwohl Entwickler eine höhere wahrgenommene Produktivität und einen besseren Flow melden, bleiben die objektiven Lieferkennzahlen unverändert. Dies zeigt ein Muster, bei dem man sich schneller fühlt, während man langsamer wird, und deutet auf neue Reibungsverluste und kognitiven Mehraufwand im System hin. Dieses Paradoxon signalisiert eine tiefgreifende Veränderung: Produktivität ist nicht mehr (oder sogar weniger) eine Funktion der individuellen Geschwindigkeit, sondern des Systemdurchsatzes und der Orchestrierungsfähigkeit. Mit zunehmender Autonomie der KI wird diese Spannung nur noch weiter zunehmen.
Vom Coding zum Intent Engineering
Aktuelle Forschungen zu „promptable Systems“ und agentenbasierten Workflows beschreiben einen entscheidenden Wandel: Entwickler verlagern ihren Fokus vom Schreiben von Code zum Ausdrücken von Absichten. Anstatt die Syntax zu beherrschen, ist die entscheidende Fähigkeit, zu artikulieren, wie Erfolg aussieht, unter welchen Einschränkungen er erreicht wird und innerhalb welcher Grenzen er ausgeführt wird.
Diese Transformation ähnelt dem Übergang von „KI-gestütztem Coding” zu „agentenbasiertem Engineering”: Anstatt Lösungen anzubieten, entwerfen Ingenieure nun Missionen, die autonome Agenten ausführen und überprüfen sollen.
Um in dieser neuen Landschaft erfolgreich zu sein, müssen Teams kognitive Fähigkeiten wie Klarheit bei der Zielformulierung und flüssige Kommunikation mit nicht-menschlichen Mitarbeitern entwickeln. In dieser aufstrebenden Disziplin wird die Fähigkeit, Absichten klar und überprüfbar zu spezifizieren, die Exzellenz im Engineering bestimmen – man denke beispielsweise an das Buzzword „Spec Driven Development“
Veränderte oder neue Rollen
Ausgehend von der Hypothese, dass Agenten einen wesentlichen Teil der Arbeit übernehmen werden, deuten Forschungsergebnisse auf die Entwicklung neuer Rollen hin. Diese Rollen haben sich in der Realität noch nicht bewährt, aber sie geben einen Hinweis darauf, worauf zu achten ist, ähnlich wie die Rolle des „Prompt Engineers” signalisierte, dass eine neue Fähigkeit wichtig geworden ist. Zu den bemerkenswerten Rollen gehören:
- „Agent Orchestrators“ definieren und koordinieren Multi-Agent-Workflows.
- „Verfiier“ prüfen die Richtigkeit, Sicherheit und Konformität von KI-generierten Ergebnissen.
- „Enablers“ warten die Infrastruktur und die Automatisierungspipelines, die diese Zusammenarbeit ermöglichen.
Kompetenzen statt Fähigkeiten
Weiterbildung bedeutet nicht, einen Kurs in „Prompt Engineering” zu belegen. Es bedeutet, ein breiteres Spektrum an Kompetenzen zu entwickeln: Dazu gehören KI-Kompetenz, Datenanalyse und systemisches Denken. Insbesondere KI-Kompetenz wird immer wichtiger. Das Verständnis der Grenzen von Modellen, probabilistischem Verhalten und Verzerrungen ist heute ein integraler Bestandteil der Kernpraxis des Software Engineerings. Eine nachhaltige und effektive Zusammenarbeit mit Agenten hängt von einem gemeinsamen konzeptionellen Modell zwischen Mensch und Maschine ab – einem Modell, das auf Transparenz und nicht auf blindem Vertrauen basiert.
Psychologische Sicherheit
Teams, die Agentic Coding Tools integrieren, sehen sich neuen kognitiven Risiken gegenüber, wie unklaren Urheberschaft, Verifizierungsmüdigkeit und sich verschiebender Verantwortlichkeit. Psychologische Sicherheit bleibt ein wichtiger Faktor, insbesondere in Zeiten des Wandels und der Störung etablierter Muster. Dies war in der Vergangenheit ein Erfolgskriterium für Teams und wird wahrscheinlich auch weiterhin genauso wichtig bleiben.
Technische Perspektive
Promptability
Für „Promptability” gibt es keine formale, geprüfte Definition. In einer Welt, in der Menschen Systeme weniger und Agenten sie mehr nutzen, ist die Benutzerfreundlichkeit von Maschinen das zentrale Thema: Kann eine Maschine ohne maßgeschneiderte Integration herausfinden, was Ihr System tut, sicher darauf zugreifen, die Auswirkungen beobachten und die Ergebnisse nachweisen? In diesem Zusammenhang ist „Promptability” ein Schlagwort, das das Konzept der Maschinenbenutzbarkeit über APIs, Dokumentation, Datenverträge und Laufzeitsignale hinweg kurzfristig zusammenfasst. Seine Auswirkungen sind eher praktischer als philosophischer Natur; es bestimmt weitgehend, wie gut Agenten in Ihrer Umgebung funktionieren werden.
„Human in the Loop” ermöglichen
Stellen Sie den Menschen in den Mittelpunkt des Prozesses. In aktuellen Forschungsarbeiten werden Begriffe wie „Evaluation harness” und „Merge-Readiness-Paket” verwendet, um dies zu ermöglichen. Interpretieren Sie diese als Leitlinien, nicht als Anweisungen. Ein „Evaluation harness” bedeutet, dass die Ergebnisse von Agenten anhand reproduzierbarer und überprüfbarer Beweise und nicht anhand narrativer Behauptungen bewertet werden sollten. Ein Merge-Readiness-Paket bedeutet, dass den Prüfern ein übersichtliches Beweispaket zur Verfügung gestellt werden sollte, das die Absicht, die Änderungen und die Ergebnisse auf einen Blick deutlich macht. Keiner der beiden Begriffe schreibt bestimmte Tools oder Rituale vor; beide verweisen auf dasselbe Ziel: die kognitive Last zu reduzieren, das Profil der wichtigen Aspekte zu schärfen und Menschen in die Lage zu versetzen, selbst zu entscheiden, wann sie Fragen stellen, wann sie fortfahren und wann sie eskalieren sollten. Was „ausreichende Beweise“ sind, hängt vom jeweiligen Bereich, der Risikotoleranz und der Reife des Stacks ab und wird sich weiterentwickeln. Das Ziel besteht nicht darin, Menschen zu standardisieren, sondern Klarheit in Bereichen zu schaffen, in denen Entscheidungen den größten Mehrwert schaffen.
CI wird noch wichtiger
Es ist keine „silver bullet“, aber Continuous Integration ist der Ort, an dem schnelle, maschinell generierte Änderungen überprüft, korrigiert und eingedämmt werden können. Die größten Risiken im Zusammenhang mit der LLM-Codegenerierung sind bekannt und werden durch agentenbasierte Tools noch verstärkt, darunter Code-Inflation, technische Schulden, Verifizierungs- und Integrationsengpässe sowie Sicherheitsrisiken. CI ist der Ort, an dem diese Risiken sichtbar und beherrschbar werden. Um von einem höheren Durchsatz zu profitieren, muss der Automatisierungsgrad in CI erhöht werden. Dies erfordert mehr automatisierte Prüfungen, klarere Nachweise und schnelleres Feedback, damit sich die Mitarbeiter auf das Urteilsvermögen statt auf die Rekonstruktion konzentrieren können. Ein praktischer Punkt, der zu beachten ist, ist, dass dies nicht zufällig geschieht. Die Enabling- und Plattform-Teams, die kleinen Produktteams einsatzbereite CI-Konfigurationen, Standards und Support bieten, sind ein stiller Erfolgsfaktor.
Messungen
Data Driven
Teams berichten oft von schnelleren Fortschritten mit KI, während die objektiven Parameter des Projektfortschritts unverändert bleiben oder zurückgehen. In einer agentenorientierten Zukunft wird diese Diskrepanz wahrscheinlich zunehmen. Die Konsequenz ist klar: Eine datengesteuerte, ergebnisorientierte Sichtweise auf Produktivität wird zwingend erforderlich sein. Es geht nicht darum, die Aktivitäten der KI (oder des Menschen) zu messen, sondern darum, festzustellen, ob Werte schneller, sicherer und zuverlässiger durch das System fließen.
Die Vorlaufzeit für Änderungen, die Bereitstellungshäufigkeit, die Änderungsfehlerquote und die MTTR, wie sie im DORA-Bericht definiert sind, bleiben die wahren Indikatoren für die Leistungsfähigkeit. Behalten Sie diese Kennzahlen im Blick, um festzustellen, ob Autonomie den Fluss und die Stabilität verbessert und nicht nur die lokale Geschwindigkeit. Finden Sie rund um diesen Kern eine Strategie, um versteckte Probleme wie wiederholte Bugfixing Muster, Code Duplikation, Refactoring, Aktualität von Abhängigkeiten und Entfernung von totem Code zu identifizieren. Indikatoren hierfür zeigen, ob eine erhöhte Geschwindigkeit technische Schulden verursacht.
Die Wirtschaftlichkeit
Die Token-Preise scheinen heute niedrig zu sein, aber Anbieter ändern ihre Tarife und Funktionen, daher sollte man sich bewusst sein, dass die Preise sich verändern werden, zumal die Kosten für den Ausbau von Rechenzentren irgendwann die Realität einholen werden. Zusätzlich zu den Tokens fallen viele zusätzliche Kosten im Zusammenhang mit dieser Änderung an. Die eigentliche Frage ist nicht, was Token kosten, sondern was sie Ihnen bringen.
In einer agentenbasierten Zukunft werden die Aktivitäten explodieren, da Agenten zu mehr Experimenten führen oder mehr Iterationen durchführen müssen, um das richtige Ergebnis zu. Die Versuchung, „mehr Token” als „mehr Fortschritt” zu interpretieren, wird stärker werden. Widerstehen Sie dieser Versuchung. Was zählt, ist die Umwandlung: Absichten in Beweise, Beweise in Entscheidungen, Entscheidungen in dauerhafte Veränderungen. Die Preise werden sich bewegen; die Autonomie wird mit den Anwendungsfällen steigen und fallen. Was bekommen Sie für Ihr Geld?
Abschließende Gedanken zur Messung
Akzeptieren Sie, dass die Messung hinterherhinkt. Es gibt keine peer-reviewten Ersatzlösungen oder Ergänzungen für die DORA Kennzahlen. Es gibt auch keine validierten Metriken für Promptability, Automability, API-Agentenfreundlichkeit, agentenspezifische DevOps-Ergebnisse oder Erfolgskriterien für autonome Veränderungen. Organisationen, die sich in Richtung agentenbasierter Workflows bewegen, werden teilweise blind agieren müssen, wenn sie die heutigen Messungen nicht erweitern. Der pragmatische Ansatz besteht darin, DORA als Grundlage beizubehalten und Indikatoren für Kosten, Qualität und Nachweise einzubeziehen. Agentic Coding Tools haben das Potenzial, den Durchsatz zu erhöhen. Nur eine kostenbewusste Messung auf Systemebene zeigt, ob diese Geschwindigkeit in eine zuverlässige Lieferung umgewandelt wurde und nicht zu größeren Warteschlangen, größeren Unterschieden und kostspieligeren Ausfällen geführt hat.
Chancen
Was wird möglich, wenn wir die richtigen Entscheidungen treffen?
Agentic Coding Tools haben großes Potenzial, können jedoch auch bestehende Probleme verschärfen. Wenn wir die Art und Weise ändern, wie wir Dinge spezifizieren, verifizieren, messen und organisieren, können wir mit derselben Anzahl von Mitarbeitern mehr erreichen. Wir können auch Produkte entwickeln, die zuvor keinen tragfähigen Business Case hatten.
Projekte, die zuvor als unwichtig galten, wie interne Tools, Datenbereinigung, Nischenintegrationen und maßgeschneiderte Berichte, können wirtschaftlich sinnvoll werden. Der gleiche Effekt gilt für die Modernisierung von Altsystemen: Sobald Verträge explizit sind und Test-Orakel existieren, können Agenten an Migrationen, Dokumentationen und Refactorings arbeiten, die in einer ausschließlich von Menschen bearbeiteten Warteschlange niemals Priorität gehabt hätten.
Außerdem ist die Erforschung schneller. Mit einer promptfähigen Architektur können Teams pro Woche mehr Experimente durchführen, z. B. alternative Algorithmen, UI-Variationen und Infrastrukturkonfigurationen, ohne sich zu umfangreichen Neuprogrammierungen verpflichten zu müssen. In Bezug auf das Produkt bedeutet dies mehr validiertes Lernen und weniger spekulative Epics.
In Bezug auf das Personal verlagert sich die Arbeit hin zu Aktivitäten mit höherer Hebelwirkung. Software Engineers verbringen weniger Zeit mit Boilerplates und mehr Zeit damit, Probleme zu formulieren, Schnittstellen zu entwerfen und Kompromisse explizit zu machen. Agenten können erste Versionen erstellen, die dann von erfahrenen Mitarbeitern verfeinert werden können, anstatt sie neu zu erstellen. Dies ist kein Ersatz an sich, sondern eine andere Arbeitsteilung, bei der das menschliche Urteilsvermögen erhalten bleibt. Seien Sie auf diese Veränderungen vorbereitet.
Auf organisatorischer Ebene liegt die Chance in kleineren, schlagkräftigeren Teams, die sich auf neue Weise koordinieren und die Komplexität reduzieren, die mit dem exponentiellen Wachstum der Kommunikationskanäle unvermeidlich einhergeht. Nehmen Sie sich einen Moment Zeit und denken Sie an den besten Product Owner, Engineer und QA, den Sie je kennengelernt haben, und stellen Sie sich vor, was diese drei Personen gemeinsam erreichen könnten.
Der Weg wird nicht einfach sein. Das Ziel ist jedoch erstrebenswert: mehr Wertschöpfung, weniger Verzögerungen und mehr Sicherheit. Wenn wir lernen, Agentic Coding Tools effektiv zu nutzen, indem wir nicht nur die von uns verwendeten Tools, sondern auch unsere Arbeitsweise ändern, können wir Dinge erreichen, die zuvor unmöglich waren.
Kontakt
Sie suchen einen erfahrenen und zuverlässigen IT-Partner?
Wir bieten Ihnen individuelle Lösungen für Ihre Anliegen – von Beratung, über Entwicklung, Integration, bis hin zum Betrieb.
