Частотный анализ
Анализ частот текста и сравнение с известными языковыми закономерностями для криптоанализа.
Анализируйте текст с помощью частотного анализа, языковой статистики и инструментов классического криптоанализа. Изучайте распределение букв, повторяющиеся шаблоны, n-граммы, индекс совпадений, энтропию и подсказки, которые помогают распознавать или взламывать исторические шифры.
Анализ частот текста и сравнение с известными языковыми закономерностями для криптоанализа.
Анализ текста изучает измеримые закономерности письменного языка: количество букв, распределение символов, повторяющиеся слова, частые пары и тройки знаков, пробелы, разнообразие символов и другие статистические признаки. В криптографии такие признаки особенно полезны, потому что многие классические шифры скрывают буквы, но всё равно сохраняют следы исходного языка.
Криптоанализ использует эти следы для обоснованных догадок. Частый символ может указывать на распространённую букву открытого текста, повторяющиеся группы — на ключевое слово или фразу, а необычная энтропия помогает понять, похож ли фрагмент на естественный язык, закодированные данные или зашифрованный текст.
Частотный анализ — естественная отправная точка для ручного криптоанализа. Он показывает, какие буквы, символы, слова, биграммы и триграммы встречаются чаще всего, а затем позволяет сравнить результат с ожидаемыми языковыми профилями. Для простых шифров замены это быстро даёт вероятные соответствия между шифртекстом и открытым текстом.
В шифрах со сдвигом в стиле Цезаря ярко выраженный частотный пик часто помогает сразу предположить ключ. Для шифров замены и аффинного шифра частотные таблицы дают кандидаты для сопоставления букв. Для Виженера и других полиалфавитных шифров частотный анализ становится полезнее в сочетании с методами оценки длины ключа, например индексом совпадений и анализом повторяющихся n-грамм.
Разные вопросы требуют разных измерений. Частота букв помогает определить язык и атаковать моноалфавитную замену. Анализ n-грамм выделяет повторяющиеся фрагменты и распространённые сочетания букв. Индекс совпадений помогает отличать текст, похожий на язык, от случайного набора символов и в некоторых полиалфавитных шифрах даёт оценку длины ключа.
Анализ энтропии показывает, насколько предсказуемым или случайным выглядит текст, а инструменты словесных шаблонов помогают сопоставлять формы с повторяющимися буквами, например ATTACK, PEOPLE или LETTER, с возможными словами из словаря. Вместе эти методы превращают неизвестный текст в набор практических подсказок.
Статистические методы лучше всего работают, когда текст достаточно длинный и шифр сохраняет часть структуры исходного языка. Короткие сообщения, смешанные алфавиты, сильное изменение пунктуации, перестановки, омофоническая замена или намеренное добавление лишних символов могут заметно усложнить интерпретацию результатов.
Современные алгоритмы шифрования специально устроены так, чтобы убирать полезные языковые закономерности. Поэтому эти инструменты предназначены для обучения, исторических шифров, решения головоломок, диагностики текста и исследовательского анализа, а не для атак на современную защищённую криптографию.
Используйте частотные пики, чтобы оценить сдвиг Цезаря перед расшифровкой сообщения.
Сравните распределение символов перед проверкой возможных пар ключей аффинного шифра.
Сочетайте частотные подсказки с повторяющимися шаблонами при исследовании шифртекста Виженера.