KI UND AUTOMATISIERUNG · MAI 2026 · 11 MINUTEN LESEZEIT · PASCAL OELMANN

KI ehrlich eingeordnet — wann wir sie empfehlen, wann nicht.

Es gibt einen Reflex in der Beratungsbranche: Sobald ein Kunde nach KI fragt, kommt eine Vier-Phasen-Roadmap auf den Tisch. Zwölf Monate, viel Honorar. Am Ende stellt jemand fest, dass ein simpler Webhook und eine if-Bedingung 80 Prozent des Problems gelöst hätten.

Es gibt einen Reflex in der Beratungsbranche, der mich ärgert: Sobald ein Kunde nach „KI” fragt, kommt eine Vier-Phasen-Roadmap auf den Tisch. Phase eins: Datenstrategie. Phase zwei: Use-Case-Analyse. Phase drei: Pilot. Phase vier: Skalierung. Das alles über zwölf Monate. Der Kunde nickt, weil er das Gefühl hat, dass es so klingen muss, wenn man professionell ist. Die Beratung freut sich, weil zwölf Monate viel Honorar bedeuten. Und am Ende stellt jemand fest, dass ein simpler Webhook und eine If-Bedingung achtzig Prozent des Problems gelöst hätten.

Das ist meine ehrlichste Beobachtung der letzten zwei Jahre KI-Beratung im Mittelstand. Ich schreibe diesen Artikel, weil ich glaube, dass Sie als Geschäftsführerin oder Geschäftsführer ein Recht auf eine bessere Antwort haben als die übliche Roadmap. Es gibt Situationen, in denen KI absolut sinnvoll ist. Es gibt mehr Situationen, in denen sie es nicht ist. Und es gibt eine wachsende Grauzone, in der die richtige Antwort von Details abhängt, die ein dreißig-Minuten-Erstgespräch nicht liefern kann.

Drei Schichten, die ständig verwechselt werden

Bevor ich erkläre, wann wir KI empfehlen, muss ich kurz aufräumen, weil drei Begriffe in der Praxis ständig durcheinandergehen.

Klassische Prozessautomatisierung ist alles, was nach festen Regeln abläuft. Wenn A passiert, dann tue B. Eine Bestellung kommt rein, die Auftragsbestätigung wird erstellt. Ein Lead trifft auf eine Kategorie, er wird an die zuständige Person geleitet. Ein Beleg landet im Postfach, er wird in den richtigen Ordner verschoben. Diese Automatisierung ist alt, transparent, wartungsarm und in neunzig Prozent der KMU-Use-Cases die richtige Antwort. Werkzeuge: n8n, Make, Power Automate, klassische Workflow-Systeme.

KI-gestützte Automatisierung ist Prozessautomatisierung plus eine intelligente Komponente, die Mehrdeutigkeit aushält. Eine E-Mail kommt rein, ein Modell entscheidet, ob es eine Reklamation, eine neue Bestellung oder eine allgemeine Anfrage ist, und leitet sie entsprechend weiter. Eine PDF-Rechnung wird gescannt, ein Modell extrahiert die relevanten Felder, auch wenn das Layout neu ist. Hier kommen vortrainierte Modelle ins Spiel, oft als API-Aufrufe an OpenAI, Anthropic, Mistral oder lokal gehostete Open-Source-Alternativen. Werkzeuge: alle der ersten Kategorie plus eine angebundene Sprach- oder Bildverarbeitungs-API.

KI-Agenten sind die jüngste und am stärksten gehypte Schicht. Sie kombinieren mehrere Fähigkeiten zu einem System, das selbständig Aufgaben plant und ausführt. Ein Agent bekommt ein Ziel — „beantworte alle Kundenanfragen heute Vormittag” — und entscheidet selbst, welche Datenquellen er anfragt, welche Antwort er formuliert, ob er Rückfragen braucht. Frameworks: LangChain, AutoGPT, Claude Code für unsere eigene Lieferkette. Diese Schicht ist mächtig, aber sie ist auch deutlich teurer, schwerer kontrollierbar und in vielen Mittelstandskontexten noch zu früh.

Wer „KI” sagt, meint meistens eine dieser drei Schichten — aber selten ist klar, welche. Die richtige Empfehlung hängt davon ab, dass diese Frage zuerst beantwortet wird.

Wann wir KI nicht empfehlen

Lassen Sie mich mit dem unbequemen Teil beginnen. Es gibt drei Konstellationen, in denen wir KI bewusst nicht empfehlen — auch wenn der Kunde sie ursprünglich angefragt hat.

Wenn das Problem regelbasiert lösbar ist. Eine Spedition wollte vor einigen Monaten eine KI, die eingehende E-Mails von Fahrern automatisch klassifiziert und Aufträge zuordnet. Klingt nach klassischem KI-Use-Case. In der Bestandsaufnahme stellte sich heraus, dass die Fahrer ihre E-Mails strukturiert schicken — Auftragsnummer in der Betreffzeile, festes Format. Eine reguläre Expression in n8n löst das in fünf Minuten Konfiguration und läuft seit Monaten ohne Wartung. Ein KI-Modell hätte gewirkt, aber zweihundert Euro im Monat gekostet, hätte gelegentliche Halluzinationen gehabt und wäre an einer Format-Änderung im Briefkopf gestolpert. Die Regel hat keinen davon.

Wenn die Datenqualität nicht trägt. KI-Modelle sind nur so gut wie die Daten, mit denen sie arbeiten. Wenn Ihr Stammdatenbestand fehlerhaft ist, wenn Datenfelder uneinheitlich gepflegt werden, wenn Excel-Listen die echte Quelle der Wahrheit sind — dann produziert eine KI-Lösung systematisch falsche Empfehlungen. Wir hatten einen Fall, wo ein Mandant eine Empfehlungs-Engine wollte, die Kunden ähnliche Produkte vorschlägt. Bei der Datenanalyse stellten wir fest, dass die Produktkategorien in zwei verschiedenen Systemen unterschiedlich klassifiziert waren — und niemand wusste, welche Klassifikation aktueller war. Die richtige Empfehlung war nicht „lasst uns ein KI-Modell trainieren”, sondern „lasst uns erst eure Stammdaten in Ordnung bringen”. Das hat ein Jahr gedauert und niemandem Spaß gemacht. Aber jetzt funktioniert die spätere Empfehlungs-Engine, und sie braucht eigentlich nur klassische Statistik, keine KI.

Wenn die Verantwortungsfrage ungeklärt ist. Eine KI, die Entscheidungen mit rechtlicher Konsequenz vorbereitet, braucht klar definierte Verantwortlichkeiten. Wer haftet, wenn das Modell falsch entscheidet? Wie wird Nachvollziehbarkeit hergestellt? Was passiert bei einer Audit-Anfrage? In vielen KMU sind diese Fragen nicht beantwortet, weil die organisatorische Struktur dafür gar nicht ausgelegt ist. Wir empfehlen in solchen Fällen, KI nur in Vorschlags-Modi einzusetzen — das Modell macht einen Vorschlag, ein Mensch entscheidet. Das halbiert den Effizienzgewinn, ja, aber es schützt vor Risiken, die ein KMU nicht tragen kann.

Wann wir KI empfehlen

Es gibt vier Konstellationen, in denen wir KI ohne Zögern empfehlen.

Klassifikation großer Eingangsmengen. Wenn ein Unternehmen täglich Hunderte von E-Mails, Belegen, Anfragen oder Anrufen bekommt und diese in Kategorien sortiert werden müssen — und wenn die Eingangsdaten nicht strukturiert genug sind für eine reguläre Expression — dann ist KI-gestützte Klassifikation eine sehr gute Antwort. Wir setzen das regelmäßig ein für Eingangs-Postfächer (Reklamation versus Bestellung versus allgemeine Anfrage), für Belege (Rechnung versus Lieferschein versus Vertrag), für Telefon-Transkripte (Eskalation versus Routine).

Extraktion strukturierter Daten aus unstrukturierten Quellen. Eingehende PDFs, gescannte Belege, freie E-Mail-Texte mit eingebetteten Auftragsdaten — überall, wo die Information da ist, aber nicht im erwarteten Format. Hier sind moderne Sprachmodelle deutlich besser als klassisches OCR plus Regelwerk. Vorsicht: Die Genauigkeit ist nie hundert Prozent. Wir bauen solche Lösungen immer mit einem Validierungs-Schritt — das Modell extrahiert, ein Mensch oder eine zweite Regel prüft. Bei Belegen mit DATEV-Anbindung ist das Pflicht.

Personalisierung in Marketing und Vertrieb. Texte für unterschiedliche Zielgruppen, Briefings für Social-Media-Kampagnen, Übersetzungen, Zusammenfassungen längerer Dokumente. Hier gewinnt KI dramatisch an Wert, weil die alternative Lösung — manuelle Erstellung durch eine Marketing-Mitarbeiterin — wesentlich teurer ist und nicht skaliert. Aus genau diesem Bedarf ist unser eigenes Tool trendscout entstanden: Webseiten-Analyse plus Trend-Daten plus LLM-basierte Briefing-Generierung, abgestimmt auf das spezifische Unternehmen.

Software-Entwicklung selbst. Hier setzen wir KI am tiefsten ein. Claude Code ist seit Monaten unser zentrales Werkzeug bei jeder Mandanten-Implementierung. Das ist nicht „lass die KI mal schreiben, was sie will”, sondern eine sehr disziplinierte agentische Arbeitsweise mit klaren Verträgen, Architektur-Skizzen und Versionskontrolle. Das Ergebnis ist, dass wir mit einem kleinen Team eine Lieferungstiefe erreichen, die früher das Drei- bis Vierfache an Personal erfordert hätte. Diese Effizienz reichen wir an die Mandanten weiter — durch niedrigere Projektpreise oder durch tieferes Engagement bei gleichem Budget.

Die Grauzone: wenn die Antwort von Details abhängt

Zwischen „klar empfehlen” und „klar nicht empfehlen” liegt ein großer Bereich, in dem die richtige Entscheidung von Faktoren abhängt, die ein dreißig-Minuten-Gespräch nicht klärt. Drei Beispiele.

Chatbots im Kundensupport. Wenn Sie viele wiederkehrende Fragen haben, die in Ihrem Wissensbestand klar beantwortet sind, und wenn Sie es schaffen, einen sauberen Eskalationspfad zu einem Menschen zu bauen — dann kann ein KI-Chatbot funktionieren. Wenn nicht, wird er Ihre Kunden frustrieren und Sie selbst Zeit kosten. Die meisten KMU-Implementierungen, die ich in den letzten zwei Jahren gesehen habe, fallen in die zweite Kategorie. Aber es gibt Ausnahmen.

KI-gestützte Datenanalyse für Geschäftsführungsentscheidungen. Hier ist das Problem nicht die KI, sondern die Frage, ob die Geschäftsführung bereit ist, datengetriebene Empfehlungen anzunehmen. Wenn die Antwort „im Zweifel entscheiden wir nach Bauchgefühl” lautet, ist die KI-Investition vergeudet. Wenn die Antwort „wir wollen evidenzbasiert führen, aber uns fehlt die Zeit für die Analyse” lautet, kann KI massiv helfen. Diese Frage ist kulturell, nicht technisch.

Generative Inhalte für die Website oder das CRM. Hier hängt es davon ab, wie wichtig Ihnen die Markenstimme ist. Wenn Ihre Texte austauschbar sind und Sie sie nur produzieren müssen, ist KI eine Beschleunigung. Wenn Ihre Markenstimme spezifisch ist und nicht ohne Pflege auskommt — dann produziert KI gut gemeinte Texte, die nach drei Wochen alle gleich klingen, weil sie vom selben Modell kommen. Wir nutzen KI in der Texterstellung intensiv, aber immer als Erstentwurf, nie als Endprodukt.

Was wir konkret in Mandantenprojekten tun

Damit das nicht abstrakt bleibt, drei konkrete Beispiele aus den letzten Monaten — alle anonymisiert, weil wir Diskretion ernst nehmen.

Beispiel 1: Eingangs-Postfach automatisiert. Ein Mandant bekam täglich rund zweihundert E-Mails, die in unterschiedliche Kategorien einsortiert werden mussten — Bestellungen, Reklamationen, allgemeine Anfragen, Lieferanten-Kommunikation. Vorher: zwei Mitarbeitende verbrachten je zwei Stunden täglich mit dem Sortieren. Wir haben einen n8n-Workflow gebaut, der die E-Mails an ein Sprachmodell schickt, eine Kategorie-Empfehlung erhält und sie in den richtigen Bereich von Microsoft 365 verschiebt. Korrekturrate: drei Prozent. Die Mitarbeitenden korrigieren, was falsch sortiert ist, und verbringen heute zehn Minuten am Tag mit dem Postfach. Sie kümmern sich stattdessen um die Vorgänge selbst.

Beispiel 2: Beleg-Vorprüfung in der Buchhaltung. Ein Mandant bekam Hunderte von Eingangsrechnungen pro Monat, die manuell auf Vollständigkeit geprüft, dann mit der Bestellung abgeglichen und an DATEV weitergegeben werden mussten. Wir haben einen Workflow gebaut, der die Rechnungen scannt, mit einem Sprachmodell die Felder extrahiert, gegen eine SQL-Datenbank der offenen Bestellungen prüft und nur die unklaren Fälle der Buchhaltung vorlegt. Die Buchhaltung sieht heute fünfzehn Prozent der Rechnungen — die anderen fünfundachtzig Prozent werden automatisch verbucht. Validierungs-Schritt: Jede automatisch verbuchte Rechnung muss eine offene Bestellung mit korrekter Höhe haben. Sonst wird sie in die manuelle Schlange umgeleitet.

Beispiel 3: Marketing-Briefing-Generator. Aus diesem Bedarf ist unser eigenes Werkzeug trendscout entstanden. Ein Mandant brauchte regelmäßig Social-Media-Content, hatte aber keinen Marketing-Mitarbeiter und keine Zeit für eine Agentur. trendscout analysiert die Mandanten-Webseite, gleicht ab mit aktuellen Trend-Daten und Social-Media-Signalen und schlägt konkrete Posts vor — inklusive Bildvorschlägen. Der Mandant prüft, was passt, postet selbst. Das ist KI als Beschleuniger, nicht als Ersatz für Markenarbeit.

Was wir bewusst nicht tun

Wir verkaufen keine KI-Strategien. Wir machen keine Multi-Workshop-Programme zum Thema „KI im Mittelstand”. Wir liefern keine zwölf-Monats-Roadmaps. Das ist nicht, weil wir nichts davon verstehen — sondern weil das Format selten zur Aufgabe passt. Wenn ein KMU heute fragt, was es mit KI machen soll, ist die richtige Antwort fast immer: konkrete Probleme identifizieren, Lösungen pragmatisch bauen, klein anfangen, früh liefern. Ein Drei-Tage-Workshop „KI-Strategie für Ihr Unternehmen” produziert in der Regel ein Dokument, das nach sechs Monaten niemand mehr findet.

Was wir tun: Wir nehmen Ihre konkreten Schmerzpunkte auf, schauen uns die Daten und Prozesse an, identifizieren, wo KI tatsächlich Effizienz bringt, schlagen die einfachste Implementierung vor, die das Problem löst, und bauen sie. Wenn das eine GPT-Integration ist, ist es eine GPT-Integration. Wenn das eine reguläre Expression ist, ist es eine reguläre Expression. Beides ist zulässig, beides ist professionell. Was nicht zulässig ist, ist eine KI zu verkaufen, weil das Wort gerade gut zieht.

Eine ehrliche Schlussnote

Ich glaube, dass KI in den nächsten fünf Jahren tiefer in jeden KMU eindringen wird. Nicht als Buzzword, sondern als selbstverständliche Komponente — eingebettet in Standardsoftware, in Office-Anwendungen, in CRM und ERP. Für die meisten KMU-Geschäftsführer wird das gar keine bewusste Entscheidung mehr sein. Es wird einfach da sein.

Bis dahin gibt es eine Übergangsphase, in der KI als zusätzliche Schicht eingeführt wird, mit allen Fragen, die das mit sich bringt. In dieser Übergangsphase brauchen Sie keine KI-Strategie. Sie brauchen einen Sparringpartner, der für jede konkrete Frage ehrlich antwortet, ob KI hilft oder nicht — und wenn ja, wie.

Das ist die Rolle, in der wir uns sehen. Nicht als KI-Berater, sondern als Berater, der KI als eines von vielen Werkzeugen verstanden hat und es einsetzt, wenn es trägt. Das klingt weniger spektakulär als „wir machen Sie KI-ready”. Aber es ist die ehrlichere Antwort. Und es ist die, die in fünf Jahren noch trägt.


Dies ist Teil 2 einer dreiteiligen Reihe zur Markenposition von digiFORMER. Der dritte Teil: Digitale Souveränität für KMU — wichtiger, als Sie heute denken.

Sie haben einen Fall, der nach unserem Schreibtisch klingt?

Wir sprechen gerne. Erstes Telefonat 30 Minuten, ohne Honorar, ohne Folgeverpflichtung. Wenn wir nicht passen, sagen wir das.