Analisi di Frequenza
Analizza le frequenze del testo e confrontale con modelli linguistici noti per la crittoanalisi.
Analizza testi con analisi delle frequenze, statistiche linguistiche e strumenti di crittoanalisi classica. Studia distribuzioni delle lettere, schemi ripetuti, n-grammi, indice di coincidenza, entropia e indizi che aiutano a riconoscere o violare cifrari storici.
Analizza le frequenze del testo e confrontale con modelli linguistici noti per la crittoanalisi.
L'analisi del testo studia gli schemi misurabili nella lingua scritta: conteggi delle lettere, distribuzione dei caratteri, parole ripetute, coppie e terne frequenti, spazi, varietà dei simboli e altri segnali statistici. In crittografia questi schemi sono particolarmente utili perché molti cifrari classici nascondono le lettere, ma conservano comunque tracce della lingua originale.
La crittoanalisi usa queste tracce per formulare ipotesi ragionate. Un simbolo molto frequente può indicare una lettera comune del testo in chiaro, gruppi ripetuti possono rivelare una parola chiave o una frase, e un'entropia insolita può suggerire se un frammento assomiglia a lingua naturale, dati codificati o testo cifrato.
L'analisi delle frequenze è un punto di partenza naturale per la crittoanalisi manuale. Mostra quali lettere, simboli, parole, bigrammi e trigrammi compaiono più spesso, poi permette di confrontare quei risultati con profili linguistici attesi. Nei sistemi di sostituzione semplici, questo può rivelare rapidamente corrispondenze probabili tra testo cifrato e testo in chiaro.
Nei cifrari a scorrimento in stile Cesare, un picco di frequenza marcato può spesso suggerire direttamente la chiave. Nei cifrari di sostituzione e nei cifrari affini, le tabelle di frequenza forniscono candidati per la mappatura delle lettere. Per Vigenere e altri cifrari polialfabetici, l'analisi delle frequenze diventa più utile quando viene combinata con metodi per stimare la lunghezza della chiave, come l'indice di coincidenza e l'analisi degli n-grammi ripetuti.
Domande diverse richiedono misurazioni diverse. La frequenza delle lettere aiuta a identificare la lingua e ad attaccare sostituzioni monoalfabetiche. L'analisi degli n-grammi evidenzia frammenti ripetuti e combinazioni frequenti di lettere. L'indice di coincidenza aiuta a distinguere un testo dall'aspetto casuale da un testo simile a una lingua naturale e, in alcuni cifrari polialfabetici, può stimare la lunghezza della chiave.
L'analisi dell'entropia misura quanto un testo sembri prevedibile o casuale, mentre gli strumenti per i pattern delle parole aiutano a confrontare forme con lettere ripetute, come ATTACK, PEOPLE o LETTER, con possibili parole di dizionario. Insieme, questi metodi trasformano un testo sconosciuto in una serie di indizi pratici.
I metodi statistici funzionano meglio quando il testo è abbastanza lungo e il cifrario conserva parte della struttura della lingua originale. Messaggi brevi, alfabeti misti, forti modifiche alla punteggiatura, trasposizione, sostituzione omofonica o riempimenti intenzionali possono rendere i risultati molto più difficili da interpretare.
Gli algoritmi di cifratura moderni sono progettati per eliminare schemi linguistici utili. Per questo questi strumenti sono pensati per l'apprendimento, i cifrari storici, la risoluzione di enigmi, la diagnostica del testo e l'analisi esplorativa, non per attaccare la crittografia moderna sicura.
Usa i picchi di frequenza per stimare uno scorrimento di Cesare prima di decifrare il messaggio.
Confronta le distribuzioni dei simboli prima di provare possibili coppie di chiavi del cifrario affine.
Combina indizi di frequenza e schemi ripetuti quando esamini un testo cifrato con Vigenere.