Die Frage „brauchen wir einen eigenen KI-Agenten?" landet in V1-Mandaten inzwischen jede zweite Woche auf dem Tisch. Meistens kommt sie aus einer guten Beobachtung: Die Geschäftsführung sieht, dass die Belegschaft in ChatGPT herumprobiert, und überlegt, wie das in eine produktive, beherrschbare Struktur überführt werden kann. Die Reflex-Antwort ist häufig falsch — entweder „lassen wir laufen" oder „lasst uns einen Agenten bauen für 80.000€".

Die richtige Antwort liegt fast immer dazwischen. Es gibt drei Stufen — Custom GPT, Claude Project, eigener Agent — und jede passt zu einem klar abgrenzbaren Use-Case-Profil. Wer die Stufen kennt, trifft die Entscheidung in einer Stunde. Wer sie nicht kennt, gibt sechsstellige Beträge für Lösungen aus, die ein 5€-Plan auch geliefert hätte.

Dieser Artikel sortiert die drei Stufen, ordnet ein, was jede leistet, was sie kostet, und für welche Mittelstands-Konstellation sie passt. Tool-Stand: Q4 2025, gilt im Wesentlichen auch 2026.

Stufe 1 — Custom GPT (ChatGPT-internes Tool)

Was es ist

Ein Custom GPT ist eine konfigurierbare Variante von ChatGPT, die innerhalb der ChatGPT-Plattform läuft. Sie definieren System-Instruktionen („Du bist der Vertriebs-Helfer für unsere Maschinenbau-Firma, gehst auf folgende Produktlinien ein, antwortest in folgender Tonalität"), laden bis zu 20 Referenz-Dateien hoch (PDFs, Excels, Markdown), aktivieren optional Web-Suche, Code-Interpreter oder Bildgenerierung — und stellen das Ergebnis Ihren Mitarbeitern oder per Link auch extern zur Verfügung.

Was es kann

Custom GPTs sind ideal für rolle-basierte Helfer mit klar abgrenzbarem Wissen: ein „HR-Assistent" mit den eigenen Personalrichtlinien, ein „Vertriebs-Helfer" mit Produktinformationen und Preisen, ein „Onboarding-Bot" mit Prozessbeschreibungen für neue Mitarbeiter. Die Konfiguration dauert zwischen 30 Minuten und vier Stunden, je nach Reife der hochgeladenen Dokumente.

Was es nicht kann

Custom GPTs haben kein persistentes Gedächtnis über mehrere Sessions hinweg, keine direkte Anbindung an interne Systeme (CRM, ERP), keine Möglichkeit, Aktionen außerhalb der Konversation auszulösen. Sie können Dokumente nicht über die hochgeladenen 20 Files hinaus skalieren. Wer regelmäßig hunderte Dokumente einbinden will, ist im Custom-GPT-Format an der Grenze.

Kosten

Pro Nutzer 23€/Monat (ChatGPT Plus) oder ab 25€/Nutzer/Monat (ChatGPT Team) bzw. ab 60€/Nutzer/Monat (ChatGPT Enterprise). Die Erstellung eines Custom GPT ist kostenlos in jedem dieser Pläne enthalten. Für ein 20-Personen-Team also rund 500–1.200€/Monat — überschaubar.

Stufe 2 — Claude Project (Anthropic-Pendant)

Was es ist

Ein Claude Project ist Anthropics Antwort auf den Custom GPT — funktional ähnlich, aber mit zwei wichtigen Unterschieden. Erstens: deutlich größerer Context — bis zu 200.000 Token gleichzeitig im Arbeitsspeicher, was etwa 500 A4-Seiten entspricht. Zweitens: Claude ist in komplexer Dokumenten-Analyse, längeren Texten und nuancierter Sprachverarbeitung tendenziell stärker als GPT-4 oder GPT-5.

Was es kann

Wenn Sie Wissensbasen aus dutzenden längeren Dokumenten zugänglich machen wollen — Verträge, Handbücher, Audit-Berichte, juristische Dokumente — ist Claude Project meistens die bessere Wahl als ein Custom GPT. Auch für Code-Reviews, technische Dokumentation und längere Strategie-Arbeit ist Claude oft präziser. Die Konfiguration ist analog: System-Instruktionen, Files hochladen, fertig.

Was es nicht kann

Genau wie der Custom GPT: keine Anbindung an externe Systeme aus der Konversation heraus, keine ausgelösten Aktionen, kein persistentes Gedächtnis quer über Projekte. Auch kein Marketplace wie der GPT Store — ein Claude Project ist primär für die eigene Organisation gedacht, nicht für externe Verteilung.

Kosten

Claude Pro: 20€/Nutzer/Monat. Claude Team: ab 25€/Nutzer/Monat (Mindestabnahme 5 Lizenzen). Claude Enterprise: ab 60€/Nutzer/Monat. Pricing damit fast deckungsgleich mit ChatGPT — die Wahl ist meistens nicht eine Preis-, sondern eine Qualitätsfrage am konkreten Use-Case.

Die Wahl zwischen Custom GPT und Claude Project ist meistens kein Architektur-Entscheid, sondern eine Frage des Modells. Beides sind Konfigurationen — kein eigener Code dahinter.

Stufe 3 — Eigener Agent (Custom Code)

Was es ist

Ein eigener Agent ist eine maßgeschneiderte Anwendung, die ein Sprachmodell (über die OpenAI-, Anthropic- oder Mistral-API) als Verarbeitungs-Layer nutzt und es mit eigener Logik, eigener Datenbank und Anbindung an Ihre Systeme kombiniert. Beispiel-Stacks: LangChain oder LlamaIndex in Python, n8n/Make.com mit AI-Modulen für No-Code-Implementierungen, oder direkter API-Aufruf in einer eigens entwickelten Web-App.

Was er kann

Was Custom GPT und Claude Project nicht können: persistente Memory über alle Konversationen, Multi-Step-Reasoning mit Tool-Use (etwa Zugriff auf Datenbank, dann auf API, dann auf E-Mail-System), Anbindung an interne Systeme (CRM, ERP, Buchhaltung), automatisierte Auslöser ohne menschliche Eingabe, individuelle Authentifizierung und Rollensystem, vollständige Datenkontrolle (auch lokales Hosting möglich).

Was er nicht ist

Ein eigener Agent ist kein Wochenend-Projekt. Selbst mit Vibe-Coding-Tools wie Claude Code, Cursor oder Bolt braucht eine produktive Implementation 4 bis 12 Wochen. Dazu kommen laufende Wartung, Modell-Updates, Hosting und Monitoring. Wer das nicht intern abbilden kann, hat einen Lieferanten dauerhaft an Bord.

Kosten

Initialaufwand 5.000 bis 15.000€ für einfache Agenten (No-Code mit Make.com oder n8n), 15.000 bis 60.000€ für custom-gebaute Lösungen mit eigener Datenbank-Anbindung. Laufend 200 bis 800€/Monat für Hosting (Cloud-Server, Datenbank, Monitoring) plus API-Kosten typischerweise zwischen 50 und 1.500€/Monat — abhängig von Nutzungsvolumen. Bei intensiver Nutzung mit langen Context-Fenstern können API-Kosten auch deutlich höher werden.

Entscheidungsmatrix — wann was passt

Faktor 1 — Anzahl der Nutzer

Unter 5 Nutzer: Custom GPT oder Claude Project. Die Konfigurations-Kosten lohnen sich gegenüber einem eigenen Agenten nicht, und die Funktionalität reicht in fast allen Fällen. Zwischen 5 und 50 Nutzer: weiterhin meistens Custom GPT oder Claude Project, sofern der Use-Case einfach abbildbar ist. Über 50 Nutzer oder mehrere Abteilungen: jetzt wird der eigene Agent interessant — vor allem wegen Zentralisierung, Berechtigungs-Management und Anbindung an die internen Systeme.

Faktor 2 — Anbindung an interne Systeme

Wenn der Use-Case ohne Anbindung an CRM, ERP, Buchhaltung oder andere interne Datenquellen funktioniert: Custom GPT oder Claude Project. Wenn der Use-Case real-time Daten aus internen Systemen braucht — etwa „aktueller Auftragsstatus für Kunde X aus dem ERP" oder „letzte 5 Rechnungen aus der Fakturierung" — dann führt kein Weg am eigenen Agenten vorbei.

Faktor 3 — Aktionen auslösen

Wenn der Output nur Text ist, den ein Mensch dann manuell weiterverwendet: Custom GPT oder Claude Project. Wenn das System selbständig Aktionen ausführen soll — E-Mail versenden, Datensatz im CRM anlegen, Bestellung im Lieferantensystem auslösen — dann eigener Agent.

Faktor 4 — Datenschutz und Kontrolle

Custom GPT und Claude Project laufen auf der Infrastruktur von OpenAI bzw. Anthropic. Die Anbieter haben Datenschutz-Zertifizierungen (SOC2, ISO27001, GDPR-konform mit Enterprise-Verträgen), aber die Daten verlassen das Unternehmen. Bei sensitiven Daten — Personalakten, Mandantengeheimnissen, Patienten-Daten — sollte das geprüft werden. Ein eigener Agent kann mit EU-gehosteten Modellen (Mistral, Aleph Alpha) oder sogar lokal betriebenen Open-Source-Modellen (Llama 3.x) umgesetzt werden — höherer Aufwand, aber volle Datenkontrolle.

V1-Erfahrung

In V1-Mandaten beginnen wir fast immer mit Custom GPT oder Claude Project — und stellen fest, dass für 70 Prozent der Use-Cases das ausreicht. Erst wenn ein klar abgrenzbarer Prozess identifiziert ist, der echte Anbindung an interne Systeme braucht und mehrfach täglich von vielen Nutzern verwendet wird, sprechen wir über einen eigenen Agenten. Bei Hey Listen — unserem Portfolio-Unternehmen für Telefon-KI — ist die Plattform selbst ein eigener Agent, gebaut über Monate, mit voller Telefonie-Anbindung und CRM-Integration. Das ist ein Beispiel, wo sich der Aufwand lohnt — weil die Lösung das Produkt ist.

Konkrete Beispiele aus dem Mittelstand

Beispiel 1 — Vertriebs-Helfer mit Produktwissen (Custom GPT, 30€/Monat)

Mittelständler im Maschinenbau, 12 Vertriebsmitarbeiter im Außendienst. Sie sollen aus Kunden-Calls heraus schnell Produktinformationen, Preise und Zubehörlisten abrufen können. Lösung: ein Custom GPT mit den 14 wichtigsten Produkt-PDFs hochgeladen, klaren Anweisungen zur Tonalität, Ausgabe als strukturierte Antwort. Aufwand: zwei Tage Konfiguration und Testing. Laufend: 30€/Monat (Plus-Abo). Mehrwert: jede Außendienst-Frage wird in 30 Sekunden beantwortet statt in 15 Minuten Telefonat ins Büro.

Beispiel 2 — Vertrags-Analyse-Hub (Claude Project, 25€/Nutzer/Monat)

Mittelständischer Anlagenbauer, häufige Kundenverhandlungen mit individuellen Verträgen. Geschäftsleitung und Vertrieb wollen vor Vertragsabschluss schnell prüfen, ob Klauseln vom üblichen Standard abweichen. Lösung: Claude Project mit den Standardvertrags-Vorlagen, einer Liste von Risiko-Klauseln und Anweisungen zur strukturierten Analyse. Hochgeladene Vertragsentwürfe werden gegen die eigene Norm gespiegelt. Aufwand: drei Tage Setup, plus laufende Pflege. Laufend: 200€/Monat für 8 Nutzer. Mehrwert: Vertragsprüfung von 4 Stunden auf 30 Minuten reduziert.

Beispiel 3 — KI-Recruiting-Pipeline (eigener Agent, 8.000€ initial + 350€/Monat)

Mittelständler mit hohem Recruiting-Volumen, etwa 200 Stellenausschreibungen pro Jahr. Wunsch: eingehende Bewerbungen automatisch gegen Stellenprofile matchen, Top-5 priorisieren, automatisierte Erstkommunikation auslösen. Lösung: eigener Agent (in dem Fall eine Make.com-Implementation mit Anthropic-API), angebunden an das Bewerbermanagementsystem. Aufwand: 6 Wochen, ein interner Verantwortlicher plus externer Implementer. Mehrwert: Recruiting-Erstsichtung von 4 Stunden pro Tag auf 30 Minuten reduziert. Genau diese Logik bauen wir bei HireBotIQ als Plattform für unsere Kunden.

Was schiefgeht

Der häufigste Fehler im Mittelstand ist der Sprung von „wir probieren ChatGPT in der Geschäftsführung" direkt zu „wir bauen einen eigenen Agenten für 60.000€". Die Stufe dazwischen — Custom GPT oder Claude Project für 200 bis 500€/Monat — wird übersprungen. Das ist meistens teurer Aktionismus.

Der zweite häufige Fehler ist umgekehrt: Ein eigener Agent wird gebaut, weil es technisch möglich ist — aber der Use-Case wäre auch mit einem Custom GPT abgedeckt. Das Resultat ist eine Lösung mit hohen Wartungskosten, die niemand mehr versteht, wenn der ursprüngliche Implementer das Unternehmen verlässt.

Mein Rat: Erste Stufe immer Custom GPT oder Claude Project. Nur wenn nach 3 bis 6 Monaten Nutzung klar ist, dass der Use-Case wirklich Systemanbindung, Aktionen oder Skalierung braucht — dann eigener Agent. Mehr zur Frage, wie man KI ohne Schulung in den Geschäftsalltag bekommt, im Artikel über Prompt Engineering für Geschäftsführer.

Nächster Schritt

Wenn Sie zwischen Custom GPT, Claude Project und eigenem Agenten entscheiden müssen: 30 Minuten direkt mit dem Founder reichen, um die Frage in 20 Minuten zu klären. +49 172 2532705. Diskret, ehrlich, unverbindlich.