Índice de coincidencia
El índice de coincidencia mide la probabilidad de que dos letras elegidas de un texto sean iguales.
Definición y fórmula
El IC es la probabilidad de que dos letras extraídas sin reposición coincidan. Con frecuencias nᵢ y total N: IC = Σ nᵢ(nᵢ−1) / N(N−1).
Interpretación
Las lenguas tienen frecuencias desiguales y un IC normalmente mayor que un alfabeto uniforme. La sustitución monoalfabética lo conserva; el cifrado polialfabético suele reducirlo.
Período de clave
Para probar un período Vigenère se divide el texto en columnas y se promedia su IC. Columnas parecidas al idioma apoyan el candidato. Lengua, alfabeto y longitud afectan el valor.
Una distribución desigual compatible con lengua o sustitución monoalfabética, pero no identifica por sí sola el cifrado.
No. Múltiplos, divisores y ruido pueden producir candidatos rivales.
No mucho; unas pocas frecuencias dominan la estimación.