Глоссарий

Индекс совпадений

ICиндекс соответствия

Индекс совпадений измеряет вероятность того, что две случайно выбранные из текста буквы окажутся одинаковыми.

Определение и формула

Индекс совпадений (IC) — вероятность того, что две буквы, выбранные из текста без возвращения, совпадут. Для частот nᵢ и общего числа букв N: IC = Σ nᵢ(nᵢ−1) / N(N−1). Пробелы и пунктуацию обычно последовательно исключают.

Интерпретация

У естественного языка частоты неравномерны, поэтому IC обычно выше, чем у равномерного случайного алфавита. Моноалфавитная замена сохраняет частоты и IC. Полиалфавитное шифрование смешивает распределения и часто снижает общий показатель.

Оценка периода ключа

Для проверки периода Виженера шифротекст делят на столбцы с таким шагом и усредняют их IC. Если столбцы похожи на сдвинутые языковые распределения, кандидат правдоподобен. Ожидаемые значения зависят от языка, алфавита, нормализации и длины текста.

Частые вопросы

Он указывает на неравномерное распределение и повторы, совместимые с естественным языком или моноалфавитной заменой, но сам не определяет шифр.

Нет, он предлагает вероятные периоды. Кратные, делители и шум могут дать конкурирующие пики.

На короткой выборке оценка нестабильна: несколько букв слишком сильно влияют на результат.

См. также