Индекс совпадений
Индекс совпадений измеряет вероятность того, что две случайно выбранные из текста буквы окажутся одинаковыми.
Определение и формула
Индекс совпадений (IC) — вероятность того, что две буквы, выбранные из текста без возвращения, совпадут. Для частот nᵢ и общего числа букв N: IC = Σ nᵢ(nᵢ−1) / N(N−1). Пробелы и пунктуацию обычно последовательно исключают.
Интерпретация
У естественного языка частоты неравномерны, поэтому IC обычно выше, чем у равномерного случайного алфавита. Моноалфавитная замена сохраняет частоты и IC. Полиалфавитное шифрование смешивает распределения и часто снижает общий показатель.
Оценка периода ключа
Для проверки периода Виженера шифротекст делят на столбцы с таким шагом и усредняют их IC. Если столбцы похожи на сдвинутые языковые распределения, кандидат правдоподобен. Ожидаемые значения зависят от языка, алфавита, нормализации и длины текста.
Он указывает на неравномерное распределение и повторы, совместимые с естественным языком или моноалфавитной заменой, но сам не определяет шифр.
Нет, он предлагает вероятные периоды. Кратные, делители и шум могут дать конкурирующие пики.
На короткой выборке оценка нестабильна: несколько букв слишком сильно влияют на результат.