ai-powered-markdown-translatorArtikel ins Deutsche übersetzt mit gpt-5.4-mini.
Ich freue mich, Ihnen mein Projekt AI-Powered Markdown Translator vorzustellen, ein quelloffenes Python-Skript, das die Markdown-Dateien meines Blogs sowie einige README-/Dokumentationsdateien meiner GitHub-Repositories automatisch übersetzt. Durch die Integration modernster KI-Modelle wie OpenAI, Mistral AI, Anthropic (Claude) und Google Gemini übersetzt dieses Tool Artikel, README-Dateien und technische Dokumentationen in 14 Sprachen, wobei Struktur und Formatierung erhalten bleiben. Dieses Projekt unterstreicht meine Fähigkeiten in Automatisierung, KI-Integration und Zuverlässigkeitsengineering sowie meine Leidenschaft dafür, technische Inhalte für alle zugänglich zu machen.
Das ist nicht nur ein Skript: Es ist ein Beleg für meine Expertise und meine Vision einer inklusiveren digitalen Welt.
Warum dieses Projekt?
Markdown-Dateien sind ein wesentlicher Bestandteil meines digitalen Ökosystems: Sie enthalten meine Blogartikel, Tutorials und Open-Source-Dokumentationen. Indem ich ihre Übersetzung automatisiere, mache ich meine Inhalte für ein weltweites Publikum zugänglich. Mein Blog ist dank dieses Skripts inzwischen in 14 Sprachen verfügbar — fast 1.800 übersetzte Versionen (in grober Größenordnung, ohne FR-Quellen) sind heute auf jls42.org online, und der Zähler steigt mit jeder Veröffentlichung.
Version 1.9 (Mai 2026) markiert einen Meilenstein: im Pair-IA-Modus aus dem Bauch heraus (vibe coding) entwickelt (Claude Code + Codex), abgesichert durch einen industrietauglichen Quality-Stack (14 Hooks, 229 Tests, SonarCloud, KI-gestützte PR-Review), um sauberen Code anzustreben, selbst wenn nicht jede Zeile manuell gegengelesen wird.
Hier sind konkrete Beispiele des Skripts in Aktion:
- Dieser Blog jls42.org in 14 Sprachen — das gesamte mehrsprachige redaktionelle Erlebnis (Artikel, Projekte, KI-News) wird von diesem Skript erzeugt. Sie können zum Beispiel die deutsche, japanische, chinesische, spanische oder arabische Version der Seite durchstöbern — jeder übersetzte redaktionelle Inhalt wurde darüber verarbeitet (die Interface-Elemente selbst stammen aus dem nativen i18n-System von Astro).
- Das README des Projekts selbst wird auf GitHub in 14 Sprachen übersetzt. Beispiele: Englisch, Spanisch, Chinesisch.
Dieses Projekt zeigt, wie KI praktische Probleme lösen und gleichzeitig die Barrierefreiheit fördern kann.
Meine Kompetenzen im Fokus
Dieses Projekt ist ein Schaufenster meines technischen Könnens. Hier zeigt es auf:
- Multi-Model-Orchestrierung: Claude Code in Opus zum Entwickeln, Codex als Fallback, GPT-5.5 reasoning extra-high, um die Pläne zu challengen,
/pr-review-toolkitfür die Review vor dem Merge - Integration mehrerer KI-APIs: 4 verbundene Provider (OpenAI, Mistral AI, Claude, Gemini) mit Anpassung an die Besonderheiten jeder API (Verwaltung von
finish_reason/stop_reason, Antwortformate, Token-Limits) - Zuverlässigkeitsengineering: zweischichtige Post-Translations-Validierung (deterministische Anti-Verbatim-Leaks + probabilistisches
langdetect), Erkennung stiller Ausfälle (silent failures), Rückmeldungen per explizitem Status - Industrieller Quality-Stack: 14 automatisierte Hooks (ruff, mypy, shellcheck, Opengrep SAST, pip-audit, Lizard…), 229 unittest-Tests, 11 SonarCloud-Badges sowie Codacy und CodeFactor
- Open-Source-Geist: verfügbar auf GitHub, GPLv3, README in 14 Sprachen übersetzt
Diese Aspekte belegen meine Fähigkeit, leistungsstarke, zuverlässige und langfristig wartbare Werkzeuge zu entwickeln.
Hauptfunktionen
Das bietet das Skript:
- Multi-Provider: Unterstützung für 4 APIs (OpenAI, Mistral AI, Claude, Gemini)
- Modelle 2026: GPT-5.5, Claude Sonnet 4.6, Gemini 3.1 Pro standardmäßig
- Sparmodus (
--eco): schnellere und günstigere Modelle - Einzeldatei (
--file): nur eine einzelne Datei statt eines ganzen Verzeichnisses übersetzen - Namensbeibehaltung (
--keep_filename): behält den ursprünglichen Namen und die Erweiterung bei (ideal für Astro, Hugo usw.) - Unterstützung für
.env: automatisches Laden der API-Keys aus einer.env - Unterstützung für
.mdx-Dateien: zusätzlich zu klassischen.md-Dateien - Beibehaltung der Formatierung: Codeblöcke, Inline-Code, Links und Metadaten bleiben intakt
Neu in v1.9 (Mai 2026):
- Post-Translations-Validierung: automatische Erkennung stiller Ausfälle (silent failures) — Zielsprache geprüft, Trunkierungen bei allen Providern abgefangen.
- Multi-Position-Notiz (
--note_position,--note_format): oben, unten oder beides; Legacy-Format (legacy) oder Marker-Format (marker format) kompatibel mit GitHub-Embed-Card (embed card). - Erweiterter
--news-Modus: bereits in v1.8 eingeführt, um englische Quellzitate über Platzhalter zu schützen; in v1.9 profitiert der Modus von einer verschärften Validierung nach der Wiederherstellung (verbleibender Platzhalter = Fehler, Originalzitat und Attributions-URL geprüft, Ziel-/Quellflags kontrolliert) — eingesetzt für alleia-actualites-Artikel des Blogs.
| Provider | Qualität (Standard) | Sparmodus (--eco) |
|---|---|---|
| OpenAI | gpt-5.5 | gpt-5.4-mini |
| Claude | claude-sonnet-4-6 | claude-haiku-4-5-20251001 |
| Mistral | mistral-large-latest | mistral-small-latest |
| Gemini | gemini-3.1-pro-preview | gemini-3.1-flash-lite-preview |
Entwicklung v1.0 → v1.9
| Version | Datum | Wichtigste Neuerung |
|---|---|---|
| 1.0–1.4 | 2024 | OpenAI, dann Mistral, dann Claude |
| 1.5 | Sept. 2024 | Client-Refactor, Modelle 2024 (gpt-4o, claude-3.5-sonnet) |
| 1.6 | Jan. 2026 | Modelle 2026 (gpt-5, claude-sonnet-4-5, gemini-3-pro), Gemini, Sparmodus --eco, Einzeldatei (--file) |
| 1.7 | Jan. 2026 | --keep_filename, .env, Inline-Code beibehalten |
| 1.8 | März 2026 | GPT-5.4-Modelle standardmäßig, Modus --news mit Zitat-Platzhaltern |
| 1.9 | Mai 2026 | Post-Translations-Validierung, Multi-Position-Notiz, Quality-Stack mit 14 Hooks + 229 Tests + KI-Review |
Entwicklung aus dem Bauch heraus + Sicherheitsnetze
Die gesamte v1.9 wurde im Pair-IA-Modus geschrieben. Mein Ablauf: Claude Code (ausschließlich Opus) tippt den Code, Codex übernimmt, wenn Opus blockiert oder das Nutzungsfenster ausgelastet ist, GPT-5.5 (reasoning extra-high) challengt die Pläne vor der Ausführung, und der Skill /pr-review-toolkit:review-pr liest die PR vor jedem Merge gegen. Ich lese den Code nicht selbst Korrektur. Damit dieser Entwicklungsmodus in der Produktion tragfähig ist, habe ich in ein den Anforderungen entsprechendes Netz von Sicherheitsnetzen investiert:
- 14 Hooks automatisiert (pre-commit + pre-push): shellcheck, ruff, prettier, detect-secrets, Lizard CCN, mypy, Opengrep SAST, pip-audit, unittest
- 229 unittest-Tests (~98 % Abdeckung des neuen v1.9-Codes)
- Praktische Tests: Multi-Repo auf vielfältigen READMEs, interne Nutzung des Produkts (dogfooding) auf dem Blog (Produktion = Live-Test), Überprüfung des visuellen Renderings (Browser oder Markdown-Vorschau)
- 3 externe Plattformen: SonarCloud (11 Badges), Codacy, CodeFactor
- Skill
/pr-review-toolkit:review-pr: KI-gestützte Multi-Agenten-Review vor dem Merge - Zweischichtige Post-Translations-Validierung: deterministisch (Anti-Verbatim-Leaks) + probabilistisch (
langdetect)
Die Idee ist nicht, zu beweisen, dass man klassische Ingenieursarbeit beherrscht. Es geht darum, dass man keine Wahl hat: KI-Code, der nicht gegengelesen wurde, verdient mehr Sicherheitsnetze, nicht weniger. Diese Disziplin wird im technischen Deep-Dive ausführlich beschrieben.
Im Live-Betrieb auf diesem Blog
Das Projekt übersetzt sich selbst: Sein README ist in 14 Sprachen verfügbar, und es erzeugt alle mehrsprachigen Versionen dieses Blogs.
- Blogartikel, 4 Projekte und 98 Artikel ia-actualites stehen für fast 1.800 übersetzte Versionen ohne FR-Quellen (sprachliche Abdeckung je nach Inhalt unterschiedlich)
- Modus
--newssystematisch beiia-actualites-Artikeln verwendet, um die englischen Quellzitate zu bewahren - Sicherheitsnetz v1.9 seit Mai 2026 aktiv: Seit Einführung der doppelten Post-Translations-Validierung habe ich keinen Zielsprachen-Silent-Failure mehr festgestellt
- Meta-Kohärenz: Die Seite, die Sie auf Englisch, Deutsch, Japanisch… lesen, wurde von diesem Skript übersetzt
Für weiterführende Informationen
Um zu verstehen, wie diese v1.9 entstanden ist (die Neuerungen im Detail, der Multi-Model-Workflow, die eingeführten Sicherheitsnetze, um sauberen Code anzustreben, ohne gegenzulesen), sehen Sie sich den vollständigen technischen Deep-Dive an.
Und um den Ton mit einer früheren Veröffentlichung zu vergleichen, folgt der Artikel von 2024 über v1.5 einem klassischeren Release-Notes-Format.
Probieren Sie es selbst aus
Entdecken Sie das Projekt auf GitHub, testen Sie es mit Ihren Markdown-Dateien und teilen Sie Ihr Feedback. Ihre Ideen helfen mir, es weiter zu verbessern!
- Quellcode auf GitHub
- Release v1.9
- PR #2 — 75 Commits, Migration + Qualität
- README in 14 Sprachen
- CHANGELOG
Kontakt: contact@jls42.org