Humanizer (Deutsch): KI-Texte erkennen und menschlicher machen
Der Humanizer (Deutsch) erkennt 65 typische KI-Schreibmuster. Claude Code Skill mit Stimmkalibrierung, Typografie-Audit, False-Positive-Guardrails und 5-Pass-Workflow.
Du kennst das: Ein Text klingt irgendwie seltsam. Zu glatt. Zu perfekt strukturiert. Jeder Absatz hat exakt die gleiche Länge. Und dann steht da sowas wie „Es ist wichtig zu bemerken, dass...“ – und du weißt: Das hat ChatGPT geschrieben.
KI-Texte sind nicht schlecht. Aber sie sind erkennbar. Und erkennbare KI-Texte wirken austauschbar und unglaubwürdig.
Ich habe deshalb den Humanizer (Deutsch) gebaut: ein Open-Source Claude Code Skill, das 65 typische KI-Schreibmuster identifiziert und dir zeigt, wie du sie loswirst. Mit optionaler Stimmkalibrierung aus eigenen Schreibproben, Severity-Ranking, drei Modi für unterschiedliche Textsorten und einem 5-Pass-Workflow von der Artefakt-Bereinigung bis zur Rhythmus-Arbeit.
KI-generierte deutsche Texte sind anhand von 65 dokumentierten Sprachmustern erkennbar: darunter aufgeblähte Symbolik, mechanische Konjunktionen („nicht nur ... sondern auch“), Trikolon, vage Autoritätsverweise, übermäßige Gedankenstriche, „heutige Welt“-Einstiege, typografische Anglizismen, diff-verankertes Schreiben, lückenfüllende Spekulation, gehäufte Doppelpunkt-Titel, gleichförmiger Satzrhythmus, aphoristische Leerformeln, dekorative Markdown-Struktur, Abstrakta-Stapel, erfundene Ich-Anekdoten, Synonym-Rotation und gleichförmige Absatzstrukturen. Der Open-Source-Skill „Humanizer (Deutsch)“ für Claude Code entfernt diese Muster in fünf Pässen: Artefakte und Evidenz, Lexik, Struktur, Rhythmus, Selbst-Audit. Optional kalibriert er den Stil anhand eigener Textproben.

Direkt loslegen
github.com/marmbiz/humanizer-de — MIT-lizenziert, kostenlos, direkt einsetzbar.
Am einfachsten über den Claude-Code-Plugin-Marketplace:
/plugin marketplace add marmbiz/humanizer-de
/plugin install humanizer-de@humanizer-de
Oder klassisch per Klon ins Skill-Verzeichnis:
git clone https://github.com/marmbiz/humanizer-de ~/.claude/skills/humanizer-de
Dann in Claude Code: /humanizer — fertig.
Was der Humanizer kann
Der Humanizer ist ein Claude Code Skill. Du rufst ihn mit /humanizer auf oder sagst einfach „Humanisiere diesen Text für mich“.
Was du zurückbekommst:
- Einen ersten Entwurf ohne die gröbsten KI-Muster
- Ein kurzes Anti-KI-Audit mit den verbleibenden Tells
- Eine finale Version nach dem abschließenden Selbst-Audit
Neu in v3: Stimmkalibrierung. Wenn du eine eigene Schreibprobe mitlieferst, analysiert der Skill deinen Satzrhythmus und deine Wortwahl und übernimmt sie ins Rewrite. Statt generisch „sauberem“ Text bekommst du Text, der nach dir klingt.
Drei Modi passen die Korrektur an den Kontext an:
| Modus | Wann | Was passiert |
|---|---|---|
| Locker | Blogposts, Social Media, Newsletter | Persönlichkeit und Rhythmus kommen dazu |
| Sachlich | Geschäftsberichte, Produktdoku, E-Mails | KI-Tells werden entfernt, Ton bleibt neutral |
| Formal | Wissenschaft, juristische Texte, Fachdoku | Nur Tells entfernen, Struktur bleibt |
Im Zweifel geht der Skill von Sachlich aus.
Zuletzt dazugekommen (Details im Changelog unten):
- v4.0 – eigenständiges Projekt: Der Humanizer folgt jetzt einem eigenen Versionsschema ohne Fork-Suffix – mit eigener Roadmap statt Upstream-Tracking. Dazu zwei neue Muster: KI-Marker-Vokabular („beleuchten“, „spannend“, „die digitale Landschaft“) und Kopula-Vermeidung („fungiert als“ statt „ist“).
- v3.8 – sechs neue Muster, 5-Pass-Workflow und Rhythmus-Linter: Abstrakta-Stapel, erfundene Ich-Anekdoten, Synonym-Rotation, isometrische Dokumente, markerloser Schließzwang und Modalpartikel-Anomalien. Der Ablauf läuft jetzt in fünf festen Pässen (Artefakte → Lexik → Struktur → Rhythmus → Selbst-Audit), und ein neues Mess-Script liefert deterministische Rhythmus-Kennzahlen statt Bauchgefühl.
- v3.7 – zwei neue Muster und Plugin-Installation: aphoristische Leerformeln („X ist die Sprache des Y“) und dekorative Markdown-Struktur (Ein-Zeilen-Tabellen, übersprungene Überschriften-Ebenen, Trennlinien vor Überschriften). Außerdem lässt sich der Skill jetzt direkt über das Claude-Code-Plugin-Marketplace installieren.
- v3.6 – Realismus gegenüber Detektoren: zwei neue Muster (Doppelpunkt-Titel-Schema, gleichförmiger Satzrhythmus) und eine klare Haltung dazu, was KI-Detektoren im Netz wirklich messen – und was man deshalb nicht am Text verschlimmbessern sollte.
- v3.5 – schlankere Architektur: Musterkatalog, Entscheidungstabellen und ein eigener Unicode-/Quote-Linter sind ausgelagert; der Skill lädt nur, was er gerade braucht.
Warum deutsche KI-Texte anders sind
Die meisten KI-Detector-Tools und Guides sind auf Englisch. Das Problem: Deutsche KI-Texte haben andere Muster.
Zum Beispiel:
- Partizip-I-Konstruktionen wie „gewährleistend“ oder „hervorhebend“. Im Deutschen ein Alarmsignal.
- Gedankenstriche überall. Ein Anglizismus, den Deutsche so nicht schreiben.
- „Darüber hinaus“ am Satzanfang. Drei Mal pro Absatz ist ein klares KI-Zeichen.
Die deutsche Wikipedia hat dafür eine eigene Dokumentation erstellt. Die englische Wikipedia hat eine vergleichbare Seite. Der Humanizer nutzt beide als Grundlage.
Die 65 KI-Muster in 10 Kategorien
Jedes Muster hat ein Severity-Ranking: HIGH (fast immer KI), MEDIUM (kontextabhängig) oder LOW (nur auffällig wenn gehäuft).
1. Sprache und Tonfall (17 Muster)
| Muster | Schwere | Beispiel |
|---|---|---|
| Symbolik-Überladung | HIGH | „steht als Zeugnis für“ |
| Werbesprache | HIGH | „atemberaubend“, „einzigartig“ |
| Meta-Kommentare | HIGH | „Es ist wichtig zu bemerken“ |
| Mechanische Konjunktionen | HIGH | „Darüber hinaus“, „Ferner“ |
| Abschnitts-Zusammenfassungen | HIGH | „Insgesamt“, „Zusammenfassend“ |
| Partizip-I-Konstruktionen | HIGH | „gewährleistend“, „hervorhebend“ |
| Vage Autoritäten | HIGH | „Experten sagen“, „Studien zeigen“ |
| Unpassendes „Fazit“ | MEDIUM | Fazit-Überschrift wo keine hingehört |
| Zu perfekte Schlussfolgerungen | MEDIUM | „Trotz X steht Y vor Z“ |
| Negative Parallelismen | MEDIUM | „nicht nur... sondern auch“, abgehackte Fragmente wie „kein Raten.“, „keine Kompromisse.“ |
| Trikolon-Überbenutzung | MEDIUM | Dreiergruppen ohne echten Grund |
| Falsche Erweiterungen | MEDIUM | „von traditionellen bis modernen“ |
| Abstrakta-Stapel | MEDIUM | „verschiedene Maßnahmen“, „zentrale Aspekte“ statt der konkreten Sache |
| Synonym-Rotation | MEDIUM | „die Hansestadt“, „die Elbmetropole“ für denselben Referenten |
| Modalpartikel-Anomalie | LOW | Nähe-Register ganz ohne „ja“, „eben“, „wohl“ – oder völlig überdosiert |
| KI-Marker-Vokabular | MEDIUM | „beleuchten“, „eintauchen“, „spannend“, „die digitale Landschaft“ in Häufung |
| Kopula-Vermeidung | MEDIUM | „fungiert als“, „verfügt über“, „stellt dar“ statt schlichtem „ist“/„hat“ |
Vorher (KI):
Die atemberaubende Stadt mit ihrem reichen kulturellen Erbe steht als Zeugnis für die künstlerische Brillanz vergangener Generationen.
Nachher (Mensch):
Die Stadt hat eine lange Geschichte. Ihre Denkmäler zeigen die Handwerkskunst des Mittelalters.
Der Unterschied: weniger Adjektive, mehr Substanz.
2. Stil (4 Muster)
| Muster | Schwere | Warum es KI verrät |
|---|---|---|
| Übermäßige Fettschrift | MEDIUM | KI macht alles wichtig |
| Falsche Listen | LOW | Bullet-Points wo keine hingehören |
| Emojis vor Überschriften | LOW | 🎯 Ziele, 📊 Daten, 🚀 Launch |
| Gedankenstriche-Überbenutzung | MEDIUM | Ersetzungshierarchie: Punkt > Komma > Doppelpunkt > Semikolon > Klammer > Umschreiben. Erkennt gepaarte Einschübe und Dash-Varianten (–, —, --) |
3. Kommunikation (6 Muster)
Chatbot-Reste, die in Fachtexten nichts verloren haben:
| Muster | Schwere | Beispiel |
|---|---|---|
| Briefartiges Schreiben | HIGH | „Betreff:“, „Mit freundlichen Grüßen“ |
| Kollaborative Kommunikation | HIGH | „Ich hoffe, das hilft!“ |
| Hinweise auf Wissensgrenzen | HIGH | „Stand Januar 2024...“ |
| Prompt-Ablehnung | HIGH | „Als KI-Modell kann ich nicht...“ |
| Platzhaltertext | HIGH | „[Name einfügen]“ |
| Links zu Suchanfragen | HIGH | Google-Suchen statt echten Quellen |
4. Auszeichnungstext (6 Muster)
Technische Fehler, die KI macht:
- Markdown statt Wikitext (MEDIUM)
- Fehlerhafter Wikitext und KI-Artefakte wie oaicite-Tags, contentReference-Spans, turn0search0-Referenzen (MEDIUM)
- Defekte Links (MEDIUM)
- Zitatfabrikation: erfundene DOIs, halluzinierte Publikationen, nicht-existente Journals, utm_source-Parameter (MEDIUM)
- Inkorrekte Referenzen-Formate (MEDIUM)
- Falsche Kategorien (MEDIUM)
5. Verschiedenes (3 Muster)
- Abrupte Abbrüche, also Text endet mitten im Satz (LOW)
- Stilwechsel: plötzlich formal, dann wieder locker (MEDIUM)
- Ich-Form in Metadaten: „Ich habe diesen Artikel verbessert“ (LOW)
6. Rhetorik und Struktur (11 Muster)
| Muster | Schwere | Beispiel |
|---|---|---|
| Persuasive Autoritäts-Floskeln | MEDIUM | „Im Kern“, „In Wirklichkeit“, „Die eigentliche Frage ist“ |
| Signposting | MEDIUM | „Schauen wir uns an“, „Hier ist, was Sie wissen müssen“ |
| Fragmentierte Überschriften | LOW | Generischer Einzeiler direkt nach einer Überschrift |
| Rhetorische Fragen als Fake-Engagement | MEDIUM | „Aber was bedeutet das?“, „Haben Sie sich jemals gefragt?“ |
| Universelle Menschheitserfahrungs-Eröffnung | MEDIUM | „Seit jeher“, „Seit Anbeginn der Zivilisation“ |
| „In der heutigen X-Welt“ Framing | MEDIUM | „In der heutigen digitalen Welt“, „Im Zeitalter der...“ |
| Aspirativer Unternehmensschluss | MEDIUM | „bestens aufgestellt“, „die Möglichkeiten sind grenzenlos“ |
| Diff-verankertes Schreiben | MEDIUM | „wurde jetzt ergänzt“, obwohl der Text den Ist-Zustand beschreiben sollte |
| Aphorismus-Formeln | MEDIUM | „X ist die Sprache des Y“, „X wird zur Falle“ – wohlklingende Leerformel statt konkreter Aussage |
| Isometrisches Dokument | MEDIUM | Alle Absätze 3–5 Sätze, jede Sektion gleich lang, jeder Aspekt gleich gewichtet |
| Markerloser Schließzwang | MEDIUM | Jeder Absatz endet mit einem Bewertungssatz ohne neue Information („Damit ist die Grundlage gelegt.“) |
Vorher (KI):
In der heutigen digitalen Welt ist eine starke Online-Präsenz für Unternehmen unerlässlich. Aber was bedeutet das konkret? Mit dieser Strategie ist das Unternehmen bestens aufgestellt für die Zukunft.
Nachher (Mensch):
Wer bei Google nicht auftaucht, verliert Kunden an Wettbewerber, die dort sichtbar sind. Ein gepflegtes Profil und eine schnelle Website holen die meisten davon zurück.
7. Argumentation und Evidenz (5 Muster)
| Muster | Schwere | Beispiel |
|---|---|---|
| Passivkonstruktionen und subjektlose Fragmente | MEDIUM | „wurde durchgeführt“, „Keine Konfiguration nötig.“ statt aktiver Formulierung |
| Konditional-Stapel | MEDIUM | Gehäufte „wenn/falls/sofern“-Klauseln in Schlussfolgerungen statt direkter Aussage |
| Fehlkalibriertes epistemisches Vertrauen | MEDIUM | Schwankt zwischen „grundlegend verändert“ und „könnte eventuell“ |
| Lückenfüllende Spekulation | HIGH | „hält sich bedeckt“, „vermutlich“, obwohl Quelle fehlt |
| Erfundene Ich-Erfahrung | HIGH | „Als ich letzte Woche mit einem Kunden sprach...“ – Anekdote ohne echten Träger |
LLMs verstecken den Akteur gern hinter Passiv und subjektlosen Sätzen. Gleichzeitig stapeln sie Bedingungen, wo eine direkte Aussage reichen würde. Am auffälligsten: der Wechsel zwischen Über-Behauptung („zweifellos“, „revolutionär“) und Über-Absicherung („scheint möglicherweise“) innerhalb weniger Sätze. Wenn Quellen fehlen, kommt noch ein anderes Problem dazu: Die KI schreibt nicht „nicht belegt“, sondern füllt die Lücke mit plausiblen Annahmen.
Die erfundene Ich-Erfahrung ist der Tell zweiter Ordnung: Er entsteht oft erst, wenn jemand versucht, KI-Text „menschlicher“ zu machen. Gestellte Anekdoten und forcierte Mündlichkeit („Ehrlich gesagt“, „Keine Sorge“) sind Fabrikation, kein Stilmittel. Der Humanizer erfindet deshalb beim Umschreiben selbst nie Erfahrungen – Stimme kommt nur aus der Schreibprobe oder explizit gelieferten Fakten.
8. Ergänzungen (4 Muster)
Seit v3.2 ergänzen vier Muster, die aus der Wikipedia-Leitlinie zu „Anzeichen für KI-generierte Inhalte“ und dem Schnelltest KI stammen:
| Muster | Schwere | Beispiel |
|---|---|---|
| Beleginkongruenz | HIGH | Quelle existiert, belegt aber nicht die Aussage |
| Versteckte Unicode-Zeichen | HIGH | Zero-Width-Space (U+200B), Soft-Hyphen, BOM, Bidi-Kontrollen |
| Standard-Kapitel ohne Substanz | MEDIUM | „Zukunftsperspektiven“ + unbelegter Fülltext; nicht kürzen, sondern konkretisieren/integrieren |
| Anglizismus-Strukturen | MEDIUM | Harte Calques & False Friends: „am Ende des Tages“, „eventuell“ = „schließlich“, „aktuell“ = „tatsächlich“ |
Besonders „Beleginkongruenz“ ist tückisch: Die Quelle existiert, der DOI ist gültig, der Autor hat die Publikation geschrieben. Nur belegt das Papier die Aussage im Text nicht. Klassisches LLM-Halluzinationsmuster, das einfache Fact-Checking-Tools nicht aufspüren. False Friends wie „eventuell“ (eventually = schließlich, nicht „vielleicht“) werden beim Korrigieren unabhängig vom Modus korrigiert, weil sie semantische Fehler sind.
9. Typografie und Format (7 Muster)
Diese Kategorie kam in v3.3 dazu. Sie erfasst Texte, die inhaltlich überzeugend sind, aber durch typografische Anglizismen oder dekorative Formatierung als KI-Output auffallen.
| Muster | Schwere | Beispiel |
|---|---|---|
| Falsche deutsche Anführungszeichen | HIGH | Deutscher Öffner mit U+201D/ASCII-Schlusszeichen statt U+201C |
| Englische Title-Case-Großschreibung | MEDIUM | „Die Zukunft Der Digitalen Transformation“ |
| Englisches Dezimal-/Datumsformat | LOW | „3.5 Prozent“, „May 12, 2026“ |
| Englischer Genitiv-Apostroph | MEDIUM | „Martin's Profil“ statt „Martins Profil“ |
| Stichpunkt-Interpunktion | LOW | Punkte auf reinen Stichwörtern, inkonsistente Listen |
| Obsessive Parataxe | MEDIUM | 4+ Hauptsätze gleicher Struktur ohne Nebensatz |
| Markdown-Struktur-Artefakte | MEDIUM | Ein-Zeilen-Tabellen, übersprungene Überschriften-Ebenen (H2→H4), Trennlinie --- direkt vor einer Überschrift |
Das Anführungszeichen-Problem ist besonders unangenehm: Claude setzt das deutsche Schlusszeichen systematisch falsch, und Prompting allein behebt das nicht zuverlässig. Der Humanizer markiert die Stellen, das eigentliche Fix gehört in einen Post-Processor oder Linter. Nicht jede schiefe Anführung ist dabei ein Tell: Ein echtes KI-Signal ist nur die Asymmetrie – ein deutsches öffnendes Anführungszeichen (U+201E) mit einem falschen oder geraden Schlusszeichen statt des korrekten U+201C. Durchgängig gerade Anführungszeichen sind dagegen meist ein Artefakt des CMS oder Editors, kein KI-Tell; durchgängig englische Anführungszeichen sind bestenfalls ein schwaches Indiz. Wer jede gerade Anführung als KI wertet, produziert Fehlalarme.
Obsessive Parataxe ist umgekehrt subtil: Jeder einzelne Satz ist korrekt, die Lesbarkeit ist hoch — aber die Monotonie verrät die Maschine. Die Lösung ist nicht „alles umschreiben“, sondern jeden dritten Satz als Satzgefüge umbauen. Ausnahme: Wenn Stakkato bewusstes Stilmittel ist (Werbung, Manifesto), greift die „Nicht anfassen“-Regel.
Vorher (KI):
Das Team Analysierte Die Daten. Die Ergebnisse waren eindeutig. Die Conversion stieg um 3.5 Prozent. Das Projekt wurde im Budget abgeschlossen.
Nachher (Mensch):
Das Team analysierte die Daten und kam zu einem eindeutigen Ergebnis: Die Conversion stieg um 3,5 Prozent, und das Projekt blieb im Budget.
10. Titel- und Satzbau (2 Muster)
Neu in v3.6. Zwei Muster, die fast nur in der Häufung auffallen – und die einzigen aus diesem Katalog, die auch statistische Detektoren messen (mehr dazu weiter unten).
| Muster | Schwere | Beispiel |
|---|---|---|
| Doppelpunkt-Titel-Schema | MEDIUM | Gehäuft „Schlagwort: erklärender Nachsatz“ in Titeln und Zwischenüberschriften |
| Gleichförmiger Satzrhythmus | MEDIUM | Sätze fast alle gleich lang, immer mit dem Subjekt zuerst |
Was der Humanizer nicht flaggt
v3.4 ergänzt eine Gegenprüfung gegen Over-Editing. Nicht jedes glatte oder formal korrekte Stück Text ist KI.
Nicht allein als KI-Tell zählen:
- fehlerfreie Grammatik und konsistenter Stil
- ein einzelner Gedankenstrich oder einzelne typografische Anführungszeichen
- trockener Ton ohne konkrete Muster
- ein einzelnes Übergangswort wie „allerdings“ oder „zudem“
- unbelegte Aussagen ohne weitere Beleg- oder Spekulationsmuster
Umgekehrt bleiben menschliche Signale erhalten: konkrete Details, uneindeutige Haltung, zeitgebundene Referenzen, echte Einschübe, Selbstkorrekturen und abwechslungsreiche Satzlängen. Der Skill soll KI-Artefakte entfernen, nicht Autorinnen und Autoren glattbügeln.
Warum KI-Detektoren auch saubere Texte als KI markieren
Es gibt im Netz Tools, die einen Text scannen und eine „KI-Wahrscheinlichkeit“ ausspucken. Diese Detektoren prüfen aber nicht die Muster aus diesem Artikel. Sie schätzen zwei statistische Größen:
- Perplexity – wie vorhersagbar das nächste Wort ist. Fachlich präzise, glatte Prosa ist gut vorhersagbar und bekommt eine niedrige Perplexity.
- Burstiness – wie stark Satzlänge und Satzbau variieren. Gleichmäßige Sätze ergeben eine niedrige Burstiness.
Die hübschen Labels solcher Tools – „mechanische Präzision“, „unpersönlicher Ton“, „roboterhafte Formalität“ – sind nur Übersetzungen dieser zwei Zahlen. Und genau hier liegt das Problem: Diese Detektoren bestrafen oft das, was einen guten Fachtext ausmacht. Korrekte Fachbegriffe senken die Perplexity. Sauber attribuierte Quellen klingen „unpersönlich“. Eine klare, sachliche Gliederung wirkt „mechanisch“.
Ein Text kann also komplett von Menschenhand stammen, jede Quelle stimmen, jeder Satz sitzen – und trotzdem als „KI“ markiert werden.
Die falsche Reaktion darauf ist, den Text absichtlich zu verschlechtern: Fachbegriffe verwässern, Quellen lockern, künstlich Tippfehler oder Umgangssprache einstreuen, nur um eine Zahl zu drücken. Das macht den Text schlechter, nicht menschlicher.
Der Humanizer geht den umgekehrten Weg. Er behandelt nur zwei dieser statistischen Befunde – und nur, weil sie auch ohne Detektor echte Lesbarkeitsprobleme sind:
- Doppelpunkt-Titel-Schema (Muster 54): Wenn H1, Bildunterschrift und mehrere Zwischenüberschriften alle dem Muster „Schlagwort: erklärender Nachsatz“ folgen, entsteht ein mechanischer Rhythmus. Ein einzelner Doppelpunkt-Titel ist völlig in Ordnung – die Häufung ist das Signal.
- Gleichförmiger Satzrhythmus (Muster 55): Wenn fast alle Sätze gleich lang sind und mit dem Subjekt beginnen, wird der Text monoton. Die Lösung ist nicht, Fehler einzubauen, sondern die Satzlänge bewusst zu spreizen – ein kurzer Satz neben einem langen, gegliederten.
Seit v3.8 kommt ein dritter, substanzwahrender Hebel dazu: Abstrakta-Stapel (Muster 58). Wer „verschiedene Maßnahmen zur Verbesserung der Verkehrssituation“ durch „zwei gesperrte Durchgangsstraßen und Tempo 30“ ersetzt, erhöht die Wortvarianz als Nebeneffekt von Präzision – der einzige Weg, niedrige Perplexity zu behandeln, ohne den Text zu verschlechtern. Und die Rhythmus-Diagnose ist jetzt messbar statt gefühlt: Das neue Script rhythm_lint.py zählt Satzlängen-Streuung, Subjekt-Anfänge, Absatzlängen und Konnektor-Dichte deterministisch aus und liefert Verdachtsmomente als Zahlen.
Alles andere, was ein Detektor als „zu sauber“ anmahnt, ist kein KI-Tell, sondern meistens einfach guter Text. Den lässt man in Ruhe.
Was der Humanizer NICHT ist
Der Humanizer schreibt nicht automatisch um. Er versteckt keine KI-Spuren.
Wenn du nur „KI-Spuren verstecken“ willst, bist du hier falsch. Der Humanizer ist für bessere Texte gedacht, nicht für Tarnung.
Der Humanizer zeigt dir die Probleme, du entscheidest, was du änderst. Manchmal ist „darüber hinaus“ okay. Manchmal ist ein Gedankenstrich genau richtig. Der Kontext entscheidet.
Die Philosophie dahinter
Gutes deutsches Schreiben hat Eigenschaften, die LLMs systematisch verfehlen:
- Direktheit statt Metapher: „Die Stadt ist groß“ statt „Die Stadt steht als Symbol für menschliche Ambition“
- Konkrete Details: „50.000 Einwohner“ statt „eine beachtliche Bevölkerung“
- Verben statt Nominalisierung: „Die Wirtschaft wächst“ statt „Das Wirtschaftswachstum ist evident“
- Variabilität, also unterschiedliche Satzlängen und Strukturen
Menschliches Schreiben hat Ecken. KI-Schreiben ist glatt.
Für wen ist das?
- Content-Ersteller, die KI nutzen aber authentisch klingen wollen
- Marketing-Teams, die ihre Texte auf KI-Muster prüfen wollen
- Wikipedia-Editoren, die eingereichte Artikel bewerten
- Alle, die wissen wollen, woran man KI-Texte erkennt
Open Source und kostenlos
Der Humanizer ist MIT-lizenziert. Du kannst ihn nutzen, kopieren, verändern.
Entstanden ist er Anfang 2026 als deutscher Fork des englischen Humanizer – seit v4.0.0 ist er ein eigenständiges Projekt mit eigenem Versionsschema und eigener Roadmap: Rund die Hälfte der 65 Muster hat kein Pendant im Original, dazu kommen deterministische Linter und eine Testsuite, die es dort nicht gibt.
Er basiert auf:
- Der deutschen Wikipedia-Analyse zu KI-generierten Inhalten
- Der englischen Wikipedia-Analyse zu AI-Schreibmustern
- Dem englischen Humanizer von blader
GitHub: github.com/marmbiz/humanizer-de
Changelog
v4.0.0 (Juni 2026)
- Eigenständigkeits-Release: eigenes Versionsschema ohne
-de.FORK-Suffix; das Projekt trackt keine Upstream-Versionen mehr, blader/humanizer bleibt Ideenquelle und Credit - 2 neue Muster (64–65), adaptiert aus dem englischen Original für das Deutsche: KI-Marker-Vokabular (die deutschen Gegenstücke zu „delve“ und „tapestry“: „beleuchten“, „eintauchen“, „spannend“, „nahtlos“, „die digitale Landschaft“) und Kopula-Vermeidung („fungiert als“, „verfügt über“, „stellt dar“ statt „ist“/„hat“)
- Muster 58 geschärft: Vokabel-Fallen-Liste in Muster 64 ausgelagert; 58 fokussiert auf Hypernyme und Nominalstil
- 65 Muster in 10 Kategorien
v3.8.0-de.1 (Juni 2026)
- 6 neue Muster (58–63): Abstrakta-Stapel und Hypernym-Präferenz, erfundene Ich-Erfahrung und forcierte Lockerheit, Synonym-Rotation für dieselbe Entität, isometrisches Dokument, markerloser Schließzwang, Modalpartikel-Anomalie
- 5-Pass-Ablauf: feste Reihenfolge Artefakte/Evidenz → Lexik → Struktur → Rhythmus → Selbst-Audit; Rhythmus-Arbeit (Vorfeld-Rotation, Satzlängen-Spreizung, Konnektor-Budget) ist in Locker und Sachlich jetzt Standard
- Neues Mess-Script
scripts/rhythm_lint.py: deterministische Burstiness-/Rhythmus-Kennzahlen (Satzlängen-Streuung, Subjektinitial-Quote, Absatzlängen, Konnektor-Dichte) als Verdachtsmomente für die Muster 4/51/54/55/61 - Selbst-Audit gegen neue Monotonie: Ersetzungsregeln werden rotiert, damit Fixes (z. B. Gedankenstrich → Punkt) nicht selbst neue KI-Muster erzeugen
- Golden Corpus in
tests/corpus/mit deterministisch prüfbaren Erwartungen - 63 Muster in 10 Kategorien
v3.7.0-de.1 (Juni 2026)
- 2 neue Muster (56–57): Aphorismus-Formeln (Kategorie „Rhetorik und Struktur“, jetzt 9 Muster), Markdown-Struktur-Artefakte (Kategorie „Typografie und Format“, jetzt 7 Muster)
- Aphorismus-Formeln: erkennt wohlklingende Leerformeln wie „X ist die Sprache des Y“ oder „X wird zur Falle“, die eine konkrete Aussage durch eine griffige Schablone ersetzen
- Markdown-Struktur-Artefakte: bündelt drei Format-Tells – Ein-Zeilen-Tabellen statt Prosa, übersprungene Überschriften-Ebenen (H2→H4) und dekorative Trennlinien (
---) direkt vor Überschriften - Plugin-Installation: installierbar über den Claude-Code-Plugin-Marketplace (
/plugin marketplace add marmbiz/humanizer-de) - 57 Muster in 10 Kategorien
v3.6.0-de.1 (Juni 2026)
- 2 neue Muster (54–55) in neuer Kategorie „Titel- und Satzbau“: Doppelpunkt-Titel-Schema, Gleichförmiger Satzrhythmus
- Realismus gegenüber statistischen Detektoren: neue Leitplanke, dass Perplexity-/Burstiness-Befunde meist legitime Fachsprache treffen und kein KI-Tell sind
- Muster 46 geschärft: nur die Asymmetrie (deutscher Öffner + falsches Schlusszeichen) ist ein harter Tell; durchgängig gerade Anführungszeichen sind CMS-Artefakt
- 55 Muster in 10 Kategorien
v3.5.0-de.1 (Mai 2026)
- Architektur-Umbau: SKILL.md ist jetzt ein schlanker Router; der vollständige Musterkatalog liegt in einer eigenen Referenzdatei
- Decision Tables für überlappende Befunde und eigenständiger Unicode-/Quote-Linter mit konservativem Auto-Fix
- Testsuite ergänzt; keine neuen Muster
v3.4.0-de.1 (Mai 2026)
- False-Positive-Guardrails: Neue Sektion „Was NICHT zu flaggen ist“ plus menschliche Signale, die erhalten bleiben sollen
- 2 neue Muster (52–53): Diff-verankertes Schreiben, Lückenfüllende Spekulation
- Leitplanken erweitert: Spekulative Fülltexte fallen unter die belegbezogenen Befunde und die Ausnahmeliste für substanzlose KI-Artefakte
- 53 Muster in 9 Kategorien
v3.3.0-de.1 (Mai 2026)
- 6 neue Muster (46–51) in neuer Kategorie „Typografie und Format“: Falsche deutsche Anführungszeichen, englische Title-Case-Großschreibung, englische Dezimal-/Datumsformate, Genitiv-Apostroph-Fehler, Stichpunkt-Interpunktion, obsessive Parataxe
- Muster 43 erweitert: Unicode-Scanner deckt jetzt U+2061–U+2064 ab (unsichtbare mathematische Operatoren als potentielle KI-Wasserzeichen)
- 51 Muster in 9 Kategorien
v3.2.4-de.1 (April 2026)
- 4 neue Muster (42–45): Beleginkongruenz, Versteckte Unicode-Zeichen, Standard-Kapitel ohne Substanz, Anglizismus-Strukturen – neue Kategorie „Ergänzungen“
- Basiert jetzt zusätzlich auf der Wikipedia-Leitlinie Erkennung KI-Einsatz und dem Schnelltest KI
- Leitplanken harmonisiert: „Nie Substanz kürzen“ (statt „Nie kürzen“), explizite Ausnahmeliste für Artefakt-Bereinigung
- 3+-Häufungs-Regel begrenzt auf weiche stilistische Muster; HIGH, Strukturbefunde, Belege und False Friends sind bei jedem Vorkommen zu korrigieren
- Modus-System konsistent gemacht: „Stimme einbringen“ voll im Locker, dezent im Sachlich, nicht im Formal
- Operative Präzisierungen in Muster 21, 22, 25, 26: Externe Recherche liegt außerhalb des Skill-Umfangs; stattdessen markieren
- 45 Muster in 8 Kategorien
v3.1.0-de.1 (April 2026)
- 3 neue Muster (39–41): Passivkonstruktionen, Konditional-Stapel, Fehlkalibriertes epistemisches Vertrauen — neue Kategorie „Argumentation und Evidenz“
- 4 erweiterte Muster: Negative Parallelismen (+Verneinungsfragmente), Gedankenstriche (Ersetzungshierarchie), Fehlerhafter Wikitext (+KI-Artefakte), DOIs (→vollständige Zitatfabrikation)
- „Nie kürzen“-Regel: Ausgabe deckt alles ab, was das Original enthält
- Gedankenstrich-Scan: Eigener Workflow-Schritt
- Quick Checklist: 7-Punkte-Audit vor der Ausgabe
- 41 Muster in 7 Kategorien
- Integriert 6 PRs aus dem englischen Original (blader/humanizer): #79, #80, #84, #85, #94, #96
v3.0.0-de.1 (März 2026)
- Stimmkalibrierung: Schreibstil des Benutzers aus eigenen Proben übernehmen
- 4 neue Muster (35–38): Rhetorische Fake-Fragen, Menschheits-Eröffnungen, „heutige Welt“-Framing, Aspirative Unternehmensschlüsse
- 38 Muster insgesamt
v2.3.0-de.1 (März 2026)
- 3 neue Muster (32–34): Persuasive Autoritäts-Floskeln, Signposting, Fragmentierte Überschriften
- Severity-Ranking (HIGH / MEDIUM / LOW) für alle 34 Muster
- Modus-System: Locker / Sachlich / Formal
- Kurzreferenz-Tabelle für schnelles Scannen
- „Nicht anfassen“-Regeln und Leitplanken
v2.2.0-de.2 (Februar 2026)
- 2-Pass statt Einmal-Korrektur — Entwurf, Audit, Finalversion
- Mehr Fokus auf Stimme — Rhythmus, Perspektive und Ton
- Besseres Review-Format — drei getrennte Ausgabeblöcke
Die Ironie ist mir bewusst: Dieser Artikel wurde mit KI-Unterstützung geschrieben. Aber er wurde auch mit dem Humanizer überarbeitet. Hoffentlich klingt das Ergebnis nach Mensch, weil ein Mensch die finale Entscheidung getroffen hat.