–40%
Nachfrage
Consultants vs. Höchststand 2023
$13,5 Mrd.
BCG Rekord
Umsatz 2024, davon 2,7 Mrd. KI
36,2%
CAGR
KI-Consulting-Markt 2024–2030

Als Mohamad Ali, Senior Vice President (SVP) und Head von IBM Consulting, gestern seinen Blogpost veröffentlichte, war die Kernbotschaft unmissverständlich: Das klassische Beratungsmodell funktioniert nicht mehr. “Services as Software” – so nennt Ali die Zukunft. Beratung wird zur Kombination aus Menschen und Software, geliefert durch intelligente Agenten und Plattformen, die weit über traditionelle Projektarbeit skalieren. IBM selbst hat seit 2023 über 100 Workflows mit künstlicher Intelligenz (KI) neu gestaltet und meldet 4,5 Milliarden US-Dollar Produktivitätsgewinne. Die Botschaft an die Branche ist klar: Wer am alten Modell festhält, wird irrelevant.

Doch so einfach ist die Sache nicht. Denn während Ali das Ende der alten Beratungswelt proklamiert, erlebt die Branche ihr vielleicht größtes Paradoxon: Die Umsätze steigen – und die Jobs schrumpfen. BCG meldet Rekordeinnahmen von 13,5 Milliarden US-Dollar, davon 2,7 Milliarden allein aus KI-Beratung. Accenture verbucht 2 Milliarden US-Dollar an Generative-AI-Bookings. Gleichzeitig sinkt die Zahl der Entry-Level-Consultants seit dem Peak 2023 messbar. McKinsey hat in fünf Jahren rund 5.000 Stellen abgebaut. Die Gesamtnachfrage nach klassischen Consultants liegt 40 Prozent unter dem Höchststand von 2023.

Was hier passiert, ist kein Widerspruch – es ist eine Selektion. Consulting stirbt nicht. Aber ein bestimmtes Modell von Consulting stirbt. Und an seine Stelle tritt etwas grundlegend Neues.

Die Slide-Factory hat ausgedient

Luk Smeyers, Gründer von The Visible Authority und ehemaliger Partner bei Deloitte Analytics, bringt es auf den Punkt: “Real consulting begins where playbooks end.” Was wegfällt, ist das, was er das “slide-heavy, junior-stacked model” nennt – die Beratungsfabrik, in der Hochschulabsolventen Daten in PowerPoint-Decks übersetzen, die dann von Partnern beim Kunden präsentiert werden.

Die Harvard Business Review (HBR) hat diesen Strukturwandel im September 2025 in einem vielbeachteten Artikel analysiert und beschreibt ein “Obelisk-Modell”: Wo früher eine breite Basis aus Junior-Analysten die Pyramide trug, entsteht jetzt eine schlankere Struktur mit drei neuen Kernrollen. AI Facilitators designen KI-Workflows. Engagement Architects definieren Probleme und interpretieren KI-Outputs. Client Leaders pflegen C-Suite-Beziehungen und steuern die strategische Orientierung. Die Analysten-Basis schrumpft – die KI übernimmt ihre Arbeit.

Die Zahlen hinter dem Wandel

–10 % Entry-Level-Consultant-Headcount nach dem Peak 2023 (Revelio Labs)

–40 % Gesamtnachfrage nach Consultants gegenüber dem Höchststand 2023

~11.000 Stellen bei Accenture in KI-bedingter Restrukturierung gestrichen

72 % der 40.000 McKinsey-Mitarbeitenden nutzen die interne KI-Plattform Lilli

36,2 % CAGR prognostiziertes Wachstum des KI-Consulting-Markts (2024–2030)

Die großen Häuser reagieren mit massiven Investitionen: Accenture steckt 3 Milliarden US-Dollar in die Data-&-AI-Practice. Deloitte investiert 2 Milliarden in das Programm “Industry Advantage”. PwC ist zum größten Enterprise-Kunden von OpenAI geworden. KPMG hat eine 2-Milliarden-Dollar-Alliance mit Microsoft geschlossen. EY baut eine eigene Large Language Model (LLM)-Plattform namens EY.ai. McKinsey, BCG, Accenture und Capgemini sind seit Februar 2026 zertifizierte Partner der OpenAI Frontier Alliance – sie implementieren den Enterprise-Agent-Stack direkt beim Kunden.

Die Branche investiert Milliarden in ihre eigene Transformation. Aber wer genau soll diese Transformation beim Kunden umsetzen? Hier kommt eine Rolle ins Spiel, die vor zwei Jahren außerhalb von Palantir kaum jemand kannte.

Enter the Forward-Deployed Engineer

Der Begriff Forward-Deployed Engineer (FDE) stammt aus dem Militär und wurde von Palantir in den frühen 2010er-Jahren auf die Softwarebranche übertragen. Intern unterschied Palantir zwischen “Dev” (one capability, many customers) und “Delta” (one customer, many capabilities). Die FDEs waren die Deltas – Ingenieure, die direkt beim Kunden stationiert wurden, nicht um zu beraten, sondern um zu bauen. Bis 2016 hatte Palantir mehr FDEs als klassische Software-Engineers.

FDE responsibilities look similar to those of a startup CTO: you’ll work in small teams and own end-to-end execution of high-stakes projects. Palantir Engineering Blog

Was den FDE vom klassischen Consultant unterscheidet, ist nicht die Nähe zum Kunden – die haben beide. Es ist der Output. Der Consultant liefert Empfehlungen. Der FDE liefert funktionierenden Code. Der Consultant übergibt ein Slide Deck. Der FDE debuggt um zwei Uhr morgens. Der Consultant schließt sein Projekt ab. Der FDE ist drei bis zwölf Monate embedded, und seine Erkenntnisse fließen zurück in die Produkt-Roadmap.

Marty Cagan von der Silicon Valley Product Group (SVPG) kontextualisiert das strategisch: Palantir wendet das Produktmodell auf Custom Solutions an. Im Gegensatz zu Beratungshäusern, die bauen, was der Kunde spezifiziert, übernimmt Palantir Ergebnisverantwortung. Das geht nur, wenn die Engineers Direktzugang zu Kunden, Daten und Stakeholdern haben. Cagan verweist auf die Bewertungen als Evidenz: Stand September 2025 lag Palantirs Börsenwert bei über 400 Milliarden US-Dollar versus Accentures 150 Milliarden – bei einem Bruchteil der Mitarbeiterzahl. Die konkreten Zahlen schwanken mit dem Markt, aber die strukturelle Aussage bleibt: Ergebnisverantwortung wird höher bewertet als Lieferkapazität.

Der heißeste Job in Tech

Was lange ein Nischenphänomen war, ist 2025 explodiert. Andreessen Horowitz (a16z) bezeichnete den FDE im Juni 2025 als “the hottest job in startups”. Die Nachfrage ist signifikant: Allein auf OpenAIs Karriereseite fielen zu diesem Zeitpunkt 22 von 311 offenen Stellen in die FDE-Kategorie. Noch haben nur rund 1 Prozent aller Unternehmen eine FDE-Rolle – aber die Kurve ist steil, und die Zahl der Stellenausschreibungen hat sich laut Branchenanalysen im Laufe des Jahres 2025 vervielfacht.

OpenAI baut ein eigenes FDE-Team auf – aktuell über zehn Engineers, bis Jahresende erwartet rund 50. Databricks, Anthropic und Cohere haben FDEs. Ramp, das Fintech-Unternehmen, operiert mit 15 FDEs in kleinen Pods. Salesforce stellt FDEs für die Implementierung von Agentforce ein. Und im Dezember 2025 machte Deloitte es offiziell: “Deloitte Forward Deployed Engineering” – die Big Four übernehmen das Modell direkt.

Deloitte FDE allows us to deliver outcomes faster than ever before. Our approach bridges business strategy and technology. Baris Sarer, Global AI Leader TMT, Deloitte

Der Dreiklang: Consulting + Architecture + Coding

Was den FDE wirklich interessant macht, ist nicht die Tatsache, dass er Code schreibt. Es ist der hybride Skill-Mix, den die Rolle verlangt. Amit Koth beschreibt es treffend: “The role is a hybrid – part software engineer, part product manager, part consultant. Someone comfortable writing production-quality code while also explaining to the CFO why this automation will cut costs.”

An einem einzigen Tag kann ein FDE morgens als Data Engineer eine Legacy-Datenbank integrieren, mittags als Frontend-Developer einen UI-Bug fixen und nachmittags als Business Analyst mit Abteilungsleitern über Prozessoptimierung sprechen. Das ist kein Generalismus – das ist der Dreiklang aus Beratungskompetenz, Solution Architecture und Programmierung, den die neue Realität verlangt.

Die variable Gewichtung

Der entscheidende Punkt: Dieser Dreiklang ist kein festes Mischungsverhältnis. Die Gewichtung verschiebt sich – abhängig vom Kontext, vom Kunden und von der Projektphase.

Kontext Consulting Architecture Coding
Palantir (Government/Defence) Mittel Hoch Hoch
OpenAI FDE Niedrig Hoch Sehr hoch
Deloitte FDE Hoch Mittel Mittel
Ramp / Fintech Niedrig Mittel Hoch
Financial Services Transformation Hoch Hoch Mittel

Colin Jarvis, Head of FDE bei OpenAI, beschreibt die Verschiebung auch entlang der Projektphasen: In der Scoping-Phase dominiert der Consulting-Anteil – Stakeholder-Workshops, Prozess-Mapping, Priorisierung. In der Validation-Phase verschiebt sich der Schwerpunkt zu Architecture und Coding – Evaluierungen bauen, Features entwickeln. In der Delivery-Phase ist es primär Coding – Integration, Debugging, Produktivbetrieb.

Für die Finanzbranche – reguliert, komplex, stakeholder-intensiv – liegt der Consulting-Anteil naturgemäß höher als etwa bei einem Fintech-Startup. Wer eine KI-gestützte Meldewesen-Plattform implementiert, muss nicht nur Code schreiben können, sondern auch die regulatorischen Anforderungen der Bundesanstalt für Finanzdienstleistungsaufsicht (BaFin) verstehen, die Organisationsstruktur des Kunden navigieren und die Fachseite von der Technologie überzeugen. Das ist Consulting, Architecture und Coding in einem – mit verschiebbaren Reglern.

Warum der FDE kein Allheilmittel ist

Die Gegenposition verdient Beachtung – und sie ist substanziell. Das FDE-Modell hat strukturelle Grenzen, die seine Verfechter oft unterschätzen.

Das fundamentale Problem ist die Skalierbarkeit. Ein Kunde, ein FDE – das funktioniert. Zehn Kunden, zehn FDEs – machbar. Zehntausend Kunden? Das Modell bricht zusammen. KI-Implementierungskomplexität skaliert nicht-linear: Jede Umgebung hat einzigartige Datenstrukturen, Legacy-Systeme, Workflows und Compliance-Anforderungen. Es gibt keine universelle Integrationsvorlage. “AI is still artisanal”, konstatiert FourWeekMBA.

Flybridge Capital schätzt – basierend auf Gesprächen mit ehemaligen Palantir-FDEs –, dass 95 Prozent der Startups das FDE-Modell falsch einsetzen. Es funktioniert nur bei komplexen Workflows, hohem Vertragswert mit klarem Pfad zu siebenstelligen Verträgen und einer starken modularen Plattform. Wer einen FDE auf einen Kunden mit weniger als 100.000 US-Dollar Jahresvertragswert ansetzt, verbrennt Geld – ein fully loaded FDE kostet zwischen 220.000 und 400.000 US-Dollar jährlich.

Und dann ist da die Organisations-Blindheit. KI kann keine interne Unternehmensrealität lesen – Machtdynamiken, informelle Koalitionen, die eigentliche Frage hinter der gestellten Frage. Bill Conerly argumentiert in Forbes mit Thomas Sowell: “There are no solutions, only tradeoffs.” Kritische Geschäftsentscheidungen involvieren menschliche Werteurteile, die KI weder priorisieren noch gewichten kann. Sicherheitsinvestitionen über regulatorische Mindeststandards hinaus, Datenschutz jenseits reiner Kostenkalkulationen, Unternehmenskultur bei Workforce-Entscheidungen – all das bleibt menschlich.

Every step toward AI maturity requires more human involvement, not less – until the system learns enough from those humans to automate their work. FourWeekMBA

Das Paradoxon verdient eine Betonung: Die FDE-Teams bei OpenAI, Anthropic und Cohere sind 2024 und 2025 um das Drei- bis Fünffache gewachsen – entgegen der “Self-Service bald”-These. Wir befinden uns in Stage 2: Menschen bringen KI bei, wie Organisationen funktionieren. Stage 3 – KI adaptiert sich selbst – ist nicht erreicht.

Lang lebe Consulting

Also: Consulting ist tot? Nein. Ein bestimmtes Modell von Consulting ist tot – das Slide-Factory-Modell, das auf Junior-Arbitrage basierte. Was lebt und wächst, ist urteilsintensives, stakeholder-schweres, kontextsensitives Consulting in Transformationen, Krisen und regulierten Umgebungen.

Executive Alignment, wenn Führungsteams in kritischen Transformationen gespalten sind. Change Management, wenn neue Arbeitsweisen über diverse Teams implementiert werden müssen. Post-Merger-Integrationen, bei denen Multi-Jahres-ERP-Programme Scheitern nicht erlauben. Krisenberatung unter Zeitdruck mit unvollständiger Informationslage. Compliance in Sektoren, wo kontextuelle Heterogenität jede One-Size-Fits-All-Lösung scheitern lässt.

Die Global Consultants Review bringt es auf den Punkt: “AI löst ‘What’ und ‘How’ – nicht ‘Why’.” KI versteht nicht, warum eine Organisation sich so verhält wie sie sich verhält: interne Politik, kultureller Widerstand, Leadership-Egos, unausgesprochene Entscheidungsrestriktionen. Und Vertrauen – die eigentliche Währung des Consulting – lässt sich nicht automatisieren. Es entsteht, wenn Berater zuhören, unbequeme Fragen stellen und Verantwortung für ihre Empfehlungen übernehmen.

Was sich ändert, ist die Lieferform. Der moderne Berater – ob er sich nun FDE, Engagement Architect oder etwas ganz anderes nennt – muss drei Dinge gleichzeitig können: das Geschäftsproblem des Kunden verstehen (Consulting), die technische Architektur der Lösung entwerfen (Solution Architecture) und die Lösung selbst bauen oder zumindest kompetent steuern (Coding). Die Gewichtung ist variabel. Aber keine der drei Dimensionen ist optional.

IBM-Chef Ali hat Recht, wenn er sagt: “Firms that hold on to traditional delivery models will struggle.” Aber er lässt den zweiten Teil weg, der ebenso wahr ist: Firmen, die glauben, Technologie allein ersetze menschliches Urteilsvermögen in komplexen Organisationen, werden genauso scheitern.

Die Zukunft gehört denen, die beides können. Es ist Zeit, sich neu zu erfinden.

Handlungsempfehlung

Was Berater, Beratungshäuser und ihre Kunden jetzt priorisieren sollten – unabhängig davon, ob sie aus der klassischen Beratung oder der Technologie kommen.

1. Den eigenen Skill-Mix ehrlich bewerten

Wo stehe ich im Dreiklang Consulting + Architecture + Coding? Die technische Tiefe ist der Glaubwürdigkeitsmechanismus der neuen Beratungswelt – wer keinen produktionsreifen Code versteht, verliert nach spätestens drei Monaten die Gesprächshoheit beim Kunden.

2. Vom Stundenhonorar zum Ergebnis denken

Der Großteil der Branche rechnet noch nach Stunden ab. Wer früher auf ergebnisbasierte Modelle umstellt, gewinnt das Vertrauen von Kunden, die keine Slide Decks mehr bezahlen wollen – sondern funktionierende Lösungen.

3. KI intern einsetzen, bevor man sie verkauft

IBMs Argument ist berechtigt: Wer 3.000 interne Agenten betreibt, kann dem Kunden glaubwürdig von deren Implementierung erzählen. “Eat your own dog food” war noch nie so relevant.

4. Die variablen Regler akzeptieren

Ein FDE bei einem Finanzinstitut ist nicht dasselbe wie ein FDE bei einem Fintech-Startup. Der Consulting-Anteil in regulierten Branchen ist höher – und das ist kein Defizit, sondern der Wert, den Erfahrung und Urteilsvermögen schaffen.

5. Vertrauen als Kernkompetenz verteidigen

Technologie automatisiert Analyse, Recherche und Mustersuche. Sie automatisiert nicht das Gespräch mit einem CEO, der vor einer Entscheidung mit unvollständiger Information steht. Diese menschliche Dimension bleibt – und wird wertvoller, nicht weniger.

Zeitleiste: Der Wandel des Consulting

Frühe 2010er
Palantir entwickelt das FDE-Modell
Intern als “Delta” bezeichnet – Ingenieure, die direkt beim Kunden stationiert werden, um zu bauen statt zu beraten.
2023
Milliarden-Investitionswelle in KI
Accenture (3 Mrd. USD), Deloitte (2 Mrd.), PwC (1 Mrd.), EY (1,4 Mrd.) – die großen Häuser investieren massiv in KI-Kapazitäten.
2024
BCG meldet 2,7 Mrd. USD KI-Advisory-Umsatz
20 Prozent des Gesamtumsatzes. Gleichzeitig sinken Graduate-Postings um 44 Prozent – das Paradoxon nimmt Form an.
Juni 2025
a16z: FDE ist “the hottest job in startups”
Die Nachfrage vervielfacht sich. OpenAI, Databricks, Anthropic und Cohere stellen FDEs ein.
September 2025
HBR beschreibt das “Obelisk-Modell”
Drei neue Kernrollen: AI Facilitators, Engagement Architects, Client Leaders. Die Junior-Basis schrumpft.
Dezember 2025
Deloitte lanciert Forward Deployed Engineering
Die Big Four übernehmen das FDE-Modell offiziell – Consulting und Engineering verschmelzen.
Februar 2026
OpenAI Frontier Alliance
McKinsey, BCG, Accenture und Capgemini als zertifizierte Agent-Partner – der Enterprise-Agent-Stack kommt beim Kunden an.
März 2026
IBM: “Services as Software”
IBM Consulting proklamiert das Ende des traditionellen Delivery-Modells. BCG prognostiziert 40 % KI-Umsatzanteil bis Jahresende.
2026–2030
Ausblick: Outcome-basierte Vergütung wird Standard
KI-Consulting-Markt wächst mit 36,2 % CAGR. Der Dreiklang Consulting + Architecture + Coding definiert das neue Berufsbild.
newsletter
the agentic banker

Lesen Sie weiter – alle 14 Tage in Ihrem Postfach.

Kapitalmarkt-Insights, Regulierungs-Updates und AI-Trends. Kompakt, fundiert, kostenlos.

DSGVO-konform. Jederzeit abbestellbar.

← Zurück zur Übersicht