Häufigkeitsanalyse

Analysiere Buchstaben-, Zeichen-, Wort-, Bigramm- und Trigramm-Häufigkeiten in beliebigen Texten. Vergleiche Verteilungen mit Sprachprofilen und nutze die Häufigkeitsanalyse für die Kryptoanalyse klassischer Chiffren.

Eingabe
0 Zeichen · 0 Bytes
Ausprobieren:
Ergebnis
✓ Analyse im Browser ✓ Unicode und mehrsprachiger Text ✓ Echtzeit-Analyse beim Tippen ✓ Verarbeitung erfolgt lokal im Browser
Beispiele
Deutsche Textanalyse
Eingabe Victor jagt zwölf Boxkämpfer quer über den großen Sylter Deich

Dieses Pangram enthält alle Buchstaben des deutschen Alphabets und eignet sich gut zum Prüfen der Buchstabenverteilung.

Caesar-Geheimtext
Eingabe KDOOR ZHOW

HALLO WELT, mit der Caesar-Chiffre und einem Schub von 3 verschlüsselt. K, D, O, R, Z, H und W zeigen die verschobenen Buchstaben des Klartexts.

Goethe-Zitat
Eingabe Habe nun ach die Philosophie durchaus studiert

Ein bekannter deutscher Satzanfang zum Testen natürlicher Buchstabenverteilungen.

Wiederholtes Buchstabenmuster
Eingabe ANGRIFF BEI DAEMMERUNG ANGRIFF BEI NACHT

Eine kurze Phrase mit wiederholten Wörtern und Buchstabenmustern. Nützlich zum Testen von Worthäufigkeiten, Bigrammen, Trigrammen und wiederholten Symbolen.

Wie die Häufigkeitsanalyse funktioniert

Die Häufigkeitsanalyse misst, wie oft Buchstaben, Symbole, Wörter oder Zeichengruppen in einem Text vorkommen. Natürliche Sprachen folgen erkennbaren statistischen Mustern: Einige Buchstaben treten deutlich häufiger auf als andere. Im Deutschen gehören zum Beispiel E, N, I, R, A und S zu den häufigsten Buchstaben.

Dieses Tool berechnet Häufigkeiten für Buchstaben, Wörter, Bigramme und Trigramme. So kannst du einen unbekannten Text mit erwarteten Sprachverteilungen vergleichen. Starke Abweichungen von normalen Sprachmustern weisen oft auf Verschlüsselung, Kodierung oder ungewöhnliche Textstrukturen hin.

Die Ergebnisse lassen sich sortieren und mit Sprachprofilen vergleichen, um die wahrscheinliche Sprache eines Textes zu bestimmen und statistische Auffälligkeiten zu erkennen.

Häufigkeitsanalyse zum Brechen von Chiffren verwenden

Die Häufigkeitsanalyse gehört zu den ältesten Techniken der Kryptoanalyse. Einfache Substitutionschiffren erhalten die statistische Struktur einer Sprache, sodass die häufigsten Symbole im Geheimtext meist den häufigsten Buchstaben im Klartext entsprechen.

Um einen Geheimtext zu untersuchen, vergleiche die beobachteten Häufigkeiten mit den erwarteten Häufigkeiten der vermuteten Sprache. Häufige Symbole, typische Bigramme und typische Trigramme liefern wertvolle Hinweise beim Rekonstruieren der ursprünglichen Nachricht.

Bei der Caesar-Chiffre zeigen Häufigkeitsspitzen den Schub oft direkt. Bei Vigenère und anderen polyalphabetischen Chiffren wird die Häufigkeitsanalyse häufig mit dem Koinzidenzindex und dem Kasiski-Test kombiniert, um vor dem Entschlüsseln die Schlüssellänge abzuschätzen.

Sprachliche Häufigkeitsprofile verstehen

Jede Sprache hat einen eigenen statistischen Fingerabdruck. Im Englischen machen bereits sechs Buchstaben fast die Hälfte des geschriebenen Textes aus, und diese Verteilung bleibt über Themen, Autoren und Zeiträume hinweg erstaunlich stabil.

Englisches Profil:

E
12.7%
T
9.1%
A
8.2%
O
7.5%
I
7.0%
N
6.7%

Im Deutschen sieht die Spitze des Profils anders aus: Besonders häufig sind E, N, I, R, A und S. Solche Häufigkeiten helfen, deutschen Klartext von zufälligen Zeichenfolgen und von Geheimtexten nach einfacher Substitution zu unterscheiden.

Deutsches Profil:

E
16.93%
N
9.78%
I
7.55%
R
7.00%
A
6.51%
S
6.42%

Kryptoanalytiker vergleichen beobachtete Geheimtext-Häufigkeiten mit solchen Profilen, um die wahrscheinliche Sprache zu erkennen und häufige Symbole möglichen Klartextbuchstaben zuzuordnen. Die klassische englische Merkhilfe ETAOIN SHRDLU bleibt als historischer Bezug nützlich; für deutsche Texte ist eine Reihenfolge wie ENIRAS praktischer.

FAQ

Häufigkeitsanalyse untersucht, wie oft Buchstaben, Symbole, Wörter oder Zeichengruppen in einem Text vorkommen. Sie ist eine grundlegende kryptoanalytische Methode, um Sprachmuster zu erkennen und viele klassische Chiffren anzugreifen.

Häufigkeitsanalyse funktioniert am besten gegen monoalphabetische Substitutionen wie die Caesar-Chiffre, affine Chiffren und einfache Ersetzungschiffren. In Kombination mit anderen Verfahren hilft sie auch bei Angriffen auf die Vigenère-Chiffre. Moderne Verschlüsselungsalgorithmen wie AES sind nicht anfällig für Häufigkeitsanalyse.

Im Englischen gehören E, T, A, O, I, N, S, H, R, D, L und C zu den häufigsten Buchstaben. Im Deutschen stehen meist E, N, I, R, A, S und T weit oben. Die genaue Verteilung hängt von Textsorte und Thema ab, bleibt in natürlicher Schriftsprache aber relativ stabil.

Der Koinzidenzindex (IC) misst, wie wahrscheinlich es ist, dass zwei zufällig ausgewählte Buchstaben aus einem Text identisch sind. Natürliche Sprachtexte haben meist einen höheren IC als Zufallstext. Kryptoanalytiker nutzen den IC, um Klartext, monoalphabetische Substitutionen und bestimmte polyalphabetische Chiffren zu unterscheiden.

Bigramme sind Folgen aus zwei Zeichen, zum Beispiel EN, ER oder CH. Trigramme sind Folgen aus drei Zeichen, zum Beispiel DER, ICH oder SCH. Sie liefern zusätzliche statistische Informationen und können die Analyse klassischer Chiffren deutlich verbessern.

Ja. Durch den Vergleich beobachteter Häufigkeiten mit bekannten Sprachprofilen kann die Häufigkeitsanalyse oft die wahrscheinlichste Sprache eines Textes abschätzen, besonders wenn genügend Text vorhanden ist.