Multilinguale Automatisierung: Mein Script AI-Powered Markdown Translator

Projekt ansehen → GitHub

Ich freue mich, Ihnen mein Projekt AI-Powered Markdown Translator vorzustellen, ein quelloffenes Python-Skript, das die Markdown-Dateien meines Blogs sowie einige README-/Dokumentationsdateien meiner GitHub-Repositories automatisch übersetzt. Durch die Integration modernster KI-Modelle wie OpenAI, Mistral AI, Anthropic (Claude) und Google Gemini übersetzt dieses Tool Artikel, README-Dateien und technische Dokumentationen in 14 Sprachen, wobei Struktur und Formatierung erhalten bleiben. Dieses Projekt unterstreicht meine Fähigkeiten in Automatisierung, KI-Integration und Zuverlässigkeitsengineering sowie meine Leidenschaft dafür, technische Inhalte für alle zugänglich zu machen.

Das ist nicht nur ein Skript: Es ist ein Beleg für meine Expertise und meine Vision einer inklusiveren digitalen Welt.

Warum dieses Projekt?

Markdown-Dateien sind ein wesentlicher Bestandteil meines digitalen Ökosystems: Sie enthalten meine Blogartikel, Tutorials und Open-Source-Dokumentationen. Indem ich ihre Übersetzung automatisiere, mache ich meine Inhalte für ein weltweites Publikum zugänglich. Mein Blog ist dank dieses Skripts inzwischen in 14 Sprachen verfügbar — fast 1.800 übersetzte Versionen (in grober Größenordnung, ohne FR-Quellen) sind heute auf jls42.org online, und der Zähler steigt mit jeder Veröffentlichung.

Version 1.9 (Mai 2026) markiert einen Meilenstein: im Pair-IA-Modus aus dem Bauch heraus (vibe coding) entwickelt (Claude Code + Codex), abgesichert durch einen industrietauglichen Quality-Stack (14 Hooks, 229 Tests, SonarCloud, KI-gestützte PR-Review), um sauberen Code anzustreben, selbst wenn nicht jede Zeile manuell gegengelesen wird.

Hier sind konkrete Beispiele des Skripts in Aktion:

Dieser Blog jls42.org in 14 Sprachen — das gesamte mehrsprachige redaktionelle Erlebnis (Artikel, Projekte, KI-News) wird von diesem Skript erzeugt. Sie können zum Beispiel die deutsche, japanische, chinesische, spanische oder arabische Version der Seite durchstöbern — jeder übersetzte redaktionelle Inhalt wurde darüber verarbeitet (die Interface-Elemente selbst stammen aus dem nativen i18n-System von Astro).
Das README des Projekts selbst wird auf GitHub in 14 Sprachen übersetzt. Beispiele: Englisch, Spanisch, Chinesisch.

Dieses Projekt zeigt, wie KI praktische Probleme lösen und gleichzeitig die Barrierefreiheit fördern kann.

Meine Kompetenzen im Fokus

Dieses Projekt ist ein Schaufenster meines technischen Könnens. Hier zeigt es auf:

Multi-Model-Orchestrierung: Claude Code in Opus zum Entwickeln, Codex als Fallback, GPT-5.5 reasoning extra-high, um die Pläne zu challengen, /pr-review-toolkit für die Review vor dem Merge
Integration mehrerer KI-APIs: 4 verbundene Provider (OpenAI, Mistral AI, Claude, Gemini) mit Anpassung an die Besonderheiten jeder API (Verwaltung von finish_reason / stop_reason, Antwortformate, Token-Limits)
Zuverlässigkeitsengineering: zweischichtige Post-Translations-Validierung (deterministische Anti-Verbatim-Leaks + probabilistisches langdetect), Erkennung stiller Ausfälle (silent failures), Rückmeldungen per explizitem Status
Industrieller Quality-Stack: 14 automatisierte Hooks (ruff, mypy, shellcheck, Opengrep SAST, pip-audit, Lizard…), 229 unittest-Tests, 11 SonarCloud-Badges sowie Codacy und CodeFactor
Open-Source-Geist: verfügbar auf GitHub, GPLv3, README in 14 Sprachen übersetzt

Diese Aspekte belegen meine Fähigkeit, leistungsstarke, zuverlässige und langfristig wartbare Werkzeuge zu entwickeln.

Hauptfunktionen

Das bietet das Skript:

Multi-Provider: Unterstützung für 4 APIs (OpenAI, Mistral AI, Claude, Gemini)
Modelle 2026: GPT-5.5, Claude Sonnet 4.6, Gemini 3.1 Pro standardmäßig
Sparmodus (--eco): schnellere und günstigere Modelle
Einzeldatei (--file): nur eine einzelne Datei statt eines ganzen Verzeichnisses übersetzen
Namensbeibehaltung (--keep_filename): behält den ursprünglichen Namen und die Erweiterung bei (ideal für Astro, Hugo usw.)
Unterstützung für .env: automatisches Laden der API-Keys aus einer .env
Unterstützung für .mdx-Dateien: zusätzlich zu klassischen .md-Dateien
Beibehaltung der Formatierung: Codeblöcke, Inline-Code, Links und Metadaten bleiben intakt

Neu in v1.9 (Mai 2026):

Post-Translations-Validierung: automatische Erkennung stiller Ausfälle (silent failures) — Zielsprache geprüft, Trunkierungen bei allen Providern abgefangen.
Multi-Position-Notiz (--note_position, --note_format): oben, unten oder beides; Legacy-Format (legacy) oder Marker-Format (marker format) kompatibel mit GitHub-Embed-Card (embed card).
Erweiterter --news-Modus: bereits in v1.8 eingeführt, um englische Quellzitate über Platzhalter zu schützen; in v1.9 profitiert der Modus von einer verschärften Validierung nach der Wiederherstellung (verbleibender Platzhalter = Fehler, Originalzitat und Attributions-URL geprüft, Ziel-/Quellflags kontrolliert) — eingesetzt für alle ia-actualites-Artikel des Blogs.

Provider	Qualität (Standard)	Sparmodus (`--eco`)
OpenAI	`gpt-5.5`	`gpt-5.4-mini`
Claude	`claude-sonnet-4-6`	`claude-haiku-4-5-20251001`
Mistral	`mistral-large-latest`	`mistral-small-latest`
Gemini	`gemini-3.1-pro-preview`	`gemini-3.1-flash-lite-preview`

Entwicklung v1.0 → v1.9

Version	Datum	Wichtigste Neuerung
1.0–1.4	2024	OpenAI, dann Mistral, dann Claude
1.5	Sept. 2024	Client-Refactor, Modelle 2024 (gpt-4o, claude-3.5-sonnet)
1.6	Jan. 2026	Modelle 2026 (gpt-5, claude-sonnet-4-5, gemini-3-pro), Gemini, Sparmodus `--eco`, Einzeldatei (`--file`)
1.7	Jan. 2026	`--keep_filename`, `.env`, Inline-Code beibehalten
1.8	März 2026	GPT-5.4-Modelle standardmäßig, Modus `--news` mit Zitat-Platzhaltern
1.9	Mai 2026	Post-Translations-Validierung, Multi-Position-Notiz, Quality-Stack mit 14 Hooks + 229 Tests + KI-Review

Entwicklung aus dem Bauch heraus + Sicherheitsnetze

Die gesamte v1.9 wurde im Pair-IA-Modus geschrieben. Mein Ablauf: Claude Code (ausschließlich Opus) tippt den Code, Codex übernimmt, wenn Opus blockiert oder das Nutzungsfenster ausgelastet ist, GPT-5.5 (reasoning extra-high) challengt die Pläne vor der Ausführung, und der Skill /pr-review-toolkit:review-pr liest die PR vor jedem Merge gegen. Ich lese den Code nicht selbst Korrektur. Damit dieser Entwicklungsmodus in der Produktion tragfähig ist, habe ich in ein den Anforderungen entsprechendes Netz von Sicherheitsnetzen investiert:

14 Hooks automatisiert (pre-commit + pre-push): shellcheck, ruff, prettier, detect-secrets, Lizard CCN, mypy, Opengrep SAST, pip-audit, unittest
229 unittest-Tests (~98 % Abdeckung des neuen v1.9-Codes)
Praktische Tests: Multi-Repo auf vielfältigen READMEs, interne Nutzung des Produkts (dogfooding) auf dem Blog (Produktion = Live-Test), Überprüfung des visuellen Renderings (Browser oder Markdown-Vorschau)
3 externe Plattformen: SonarCloud (11 Badges), Codacy, CodeFactor
Skill /pr-review-toolkit:review-pr: KI-gestützte Multi-Agenten-Review vor dem Merge
Zweischichtige Post-Translations-Validierung: deterministisch (Anti-Verbatim-Leaks) + probabilistisch (langdetect)

Die Idee ist nicht, zu beweisen, dass man klassische Ingenieursarbeit beherrscht. Es geht darum, dass man keine Wahl hat: KI-Code, der nicht gegengelesen wurde, verdient mehr Sicherheitsnetze, nicht weniger. Diese Disziplin wird im technischen Deep-Dive ausführlich beschrieben.

Im Live-Betrieb auf diesem Blog

Das Projekt übersetzt sich selbst: Sein README ist in 14 Sprachen verfügbar, und es erzeugt alle mehrsprachigen Versionen dieses Blogs.

Blogartikel, 4 Projekte und 98 Artikel ia-actualites stehen für fast 1.800 übersetzte Versionen ohne FR-Quellen (sprachliche Abdeckung je nach Inhalt unterschiedlich)
Modus --news systematisch bei ia-actualites-Artikeln verwendet, um die englischen Quellzitate zu bewahren
Sicherheitsnetz v1.9 seit Mai 2026 aktiv: Seit Einführung der doppelten Post-Translations-Validierung habe ich keinen Zielsprachen-Silent-Failure mehr festgestellt
Meta-Kohärenz: Die Seite, die Sie auf Englisch, Deutsch, Japanisch… lesen, wurde von diesem Skript übersetzt

Für weiterführende Informationen

Um zu verstehen, wie diese v1.9 entstanden ist (die Neuerungen im Detail, der Multi-Model-Workflow, die eingeführten Sicherheitsnetze, um sauberen Code anzustreben, ohne gegenzulesen), sehen Sie sich den vollständigen technischen Deep-Dive an.

Und um den Ton mit einer früheren Veröffentlichung zu vergleichen, folgt der Artikel von 2024 über v1.5 einem klassischeren Release-Notes-Format.

Probieren Sie es selbst aus

Entdecken Sie das Projekt auf GitHub, testen Sie es mit Ihren Markdown-Dateien und teilen Sie Ihr Feedback. Ihre Ideen helfen mir, es weiter zu verbessern!

Kontakt: contact@jls42.org