Ma la volpe col suo balzo ha raggiunto il quieto Fido
Questo pangramma usa le lettere dell’alfabeto italiano di base ed è utile per controllare la distribuzione delle lettere.
Analizza le frequenze di lettere, caratteri, parole, bigrammi e trigrammi in qualsiasi testo. Confronta le distribuzioni con profili linguistici e usa l’analisi di frequenza per la crittoanalisi dei cifrari classici.
Ma la volpe col suo balzo ha raggiunto il quieto Fido
Questo pangramma usa le lettere dell’alfabeto italiano di base ed è utile per controllare la distribuzione delle lettere.
FLDR PRQGR
CIAO MONDO cifrato con Cesare e spostamento 3. F, L, D, R, P, Q e G mostrano le lettere spostate dal testo in chiaro.
Nel mezzo del cammin di nostra vita mi ritrovai per una selva oscura
Una frase italiana celebre per testare la distribuzione naturale delle lettere.
ATTACCO ALL ALBA ATTACCO AL TRAMONTO
Una breve frase con parole e schemi di lettere ripetuti. Utile per testare frequenze di parole, bigrammi, trigrammi e analisi dei simboli ripetuti.
L’analisi di frequenza misura quanto spesso lettere, simboli, parole o gruppi di caratteri compaiono in un testo. Le lingue naturali seguono modelli statistici riconoscibili: alcune lettere appaiono molto più spesso di altre. In italiano, per esempio, E, A, I, O, N e L sono tra le lettere più frequenti.
Questo strumento calcola le frequenze di lettere, parole, bigrammi e trigrammi, permettendoti di confrontare un testo sconosciuto con le distribuzioni attese di una lingua. Forti deviazioni dai modelli normali spesso indicano cifratura, codifica o strutture testuali insolite.
I risultati possono essere ordinati e confrontati con profili linguistici per aiutare a identificare la lingua probabile di un testo e rilevare anomalie statistiche.
L’analisi di frequenza è una delle tecniche più antiche della crittoanalisi. I cifrari a sostituzione semplice conservano la struttura statistica di una lingua, quindi i simboli più frequenti del testo cifrato corrispondono spesso alle lettere più frequenti del testo in chiaro.
Per analizzare un testo cifrato, confronta le frequenze osservate con quelle attese della lingua sospetta. Simboli ad alta frequenza, bigrammi comuni e trigrammi comuni possono offrire indizi preziosi quando si ricostruisce il messaggio originale.
Nel cifrario di Cesare, i picchi di frequenza spesso rivelano direttamente lo spostamento. Per Vigenère e altri cifrari polialfabetici, l’analisi di frequenza viene spesso combinata con l’indice di coincidenza e l’esame di Kasiski per stimare la lunghezza della chiave prima di tentare la decifrazione.
Ogni lingua ha una propria impronta statistica. In inglese, appena sei lettere rappresentano quasi metà di tutto il testo scritto, e questa distribuzione rimane sorprendentemente stabile tra argomenti, autori e periodi diversi.
Profilo dell’inglese:
In italiano la parte alta del profilo è diversa: E, A, I, O, N e L compaiono con grande frequenza nel testo naturale. Queste frequenze aiutano a distinguere un testo italiano in chiaro da sequenze casuali e da testi cifrati con sostituzione semplice.
Profilo dell’italiano:
I crittoanalisti confrontano le frequenze osservate nel testo cifrato con profili come questi per identificare la lingua probabile e associare i simboli frequenti alle lettere più plausibili del testo in chiaro. La classica mnemonica inglese ETAOIN SHRDLU resta utile come riferimento storico; per l’italiano è più pratica una sequenza come EAIONL.