Koinzidenzindex
Der Koinzidenzindex misst die Wahrscheinlichkeit, dass zwei aus einem Text gezogene Buchstaben gleich sind.
Definition und Formel
Der Koinzidenzindex (IC) ist die Wahrscheinlichkeit, dass zwei ohne Zurücklegen gezogene Buchstaben übereinstimmen. Für Häufigkeiten nᵢ und Gesamtzahl N: IC = Σ nᵢ(nᵢ−1) / N(N−1).
Deutung
Natürliche Sprachen haben ungleiche Häufigkeiten und meist höheren IC als ein gleichverteiltes Alphabet. Monoalphabetische Substitution erhält den IC; polyalphabetische Verschlüsselung senkt ihn oft.
Schlüsselperiode
Für eine Vigenère-Periode teilt man den Geheimtext in Spalten und mittelt deren IC. Sprachähnliche Spalten stützen den Kandidaten. Sprache, Alphabet, Normalisierung und Textlänge beeinflussen den Wert.
Eine ungleichmäßige Verteilung, passend zu Sprache oder monoalphabetischer Substitution, aber keine eindeutige Chiffrenbestimmung.
Nein. Vielfache, Teiler und Rauschen erzeugen konkurrierende Kandidaten.
Nein, wenige Buchstaben dominieren dann die Schätzung.