Analisi di Frequenza

Analizza le frequenze di lettere, caratteri, parole, bigrammi e trigrammi in qualsiasi testo. Confronta le distribuzioni con profili linguistici e usa l’analisi di frequenza per la crittoanalisi dei cifrari classici.

Input
0 caratt. · 0 byte
Prova:
Risultato
✓ Analisi nel browser ✓ Supporto Unicode e testo multilingue ✓ Analisi in tempo reale ✓ Elaborazione locale nel browser
Esempi
Analisi di testo italiano
Input Ma la volpe col suo balzo ha raggiunto il quieto Fido

Questo pangramma usa le lettere dell’alfabeto italiano di base ed è utile per controllare la distribuzione delle lettere.

Testo cifrato con Cesare
Input FLDR PRQGR

CIAO MONDO cifrato con Cesare e spostamento 3. F, L, D, R, P, Q e G mostrano le lettere spostate dal testo in chiaro.

Citazione letteraria
Input Nel mezzo del cammin di nostra vita mi ritrovai per una selva oscura

Una frase italiana celebre per testare la distribuzione naturale delle lettere.

Schema di lettere ripetute
Input ATTACCO ALL ALBA ATTACCO AL TRAMONTO

Una breve frase con parole e schemi di lettere ripetuti. Utile per testare frequenze di parole, bigrammi, trigrammi e analisi dei simboli ripetuti.

Come funziona l’analisi di frequenza

L’analisi di frequenza misura quanto spesso lettere, simboli, parole o gruppi di caratteri compaiono in un testo. Le lingue naturali seguono modelli statistici riconoscibili: alcune lettere appaiono molto più spesso di altre. In italiano, per esempio, E, A, I, O, N e L sono tra le lettere più frequenti.

Questo strumento calcola le frequenze di lettere, parole, bigrammi e trigrammi, permettendoti di confrontare un testo sconosciuto con le distribuzioni attese di una lingua. Forti deviazioni dai modelli normali spesso indicano cifratura, codifica o strutture testuali insolite.

I risultati possono essere ordinati e confrontati con profili linguistici per aiutare a identificare la lingua probabile di un testo e rilevare anomalie statistiche.

Usare l’analisi di frequenza per violare i cifrari

L’analisi di frequenza è una delle tecniche più antiche della crittoanalisi. I cifrari a sostituzione semplice conservano la struttura statistica di una lingua, quindi i simboli più frequenti del testo cifrato corrispondono spesso alle lettere più frequenti del testo in chiaro.

Per analizzare un testo cifrato, confronta le frequenze osservate con quelle attese della lingua sospetta. Simboli ad alta frequenza, bigrammi comuni e trigrammi comuni possono offrire indizi preziosi quando si ricostruisce il messaggio originale.

Nel cifrario di Cesare, i picchi di frequenza spesso rivelano direttamente lo spostamento. Per Vigenère e altri cifrari polialfabetici, l’analisi di frequenza viene spesso combinata con l’indice di coincidenza e l’esame di Kasiski per stimare la lunghezza della chiave prima di tentare la decifrazione.

Comprendere i profili di frequenza delle lingue

Ogni lingua ha una propria impronta statistica. In inglese, appena sei lettere rappresentano quasi metà di tutto il testo scritto, e questa distribuzione rimane sorprendentemente stabile tra argomenti, autori e periodi diversi.

Profilo dell’inglese:

E
12.7%
T
9.1%
A
8.2%
O
7.5%
I
7.0%
N
6.7%

In italiano la parte alta del profilo è diversa: E, A, I, O, N e L compaiono con grande frequenza nel testo naturale. Queste frequenze aiutano a distinguere un testo italiano in chiaro da sequenze casuali e da testi cifrati con sostituzione semplice.

Profilo dell’italiano:

E
11.79%
A
11.74%
I
11.28%
O
9.83%
N
6.88%
L
6.51%

I crittoanalisti confrontano le frequenze osservate nel testo cifrato con profili come questi per identificare la lingua probabile e associare i simboli frequenti alle lettere più plausibili del testo in chiaro. La classica mnemonica inglese ETAOIN SHRDLU resta utile come riferimento storico; per l’italiano è più pratica una sequenza come EAIONL.

FAQ

L’analisi di frequenza studia quanto spesso lettere, simboli, parole o gruppi di caratteri compaiono in un testo. È una tecnica crittoanalitica fondamentale usata per riconoscere modelli linguistici e attaccare molti cifrari classici.

L’analisi di frequenza funziona meglio contro sistemi di sostituzione monoalfabetica, come il cifrario di Cesare, il cifrario affine e i cifrari a sostituzione semplice. Può anche aiutare negli attacchi al cifrario di Vigenère quando viene combinata con altre tecniche. Gli algoritmi moderni di cifratura, come AES, non sono vulnerabili all’analisi di frequenza.

In inglese le lettere più comuni sono in genere E, T, A, O, I, N, S, H, R, D, L e C. In italiano compaiono spesso ai primi posti E, A, I, O, N, L e R. La distribuzione esatta varia in base al tipo di testo, ma le lettere principali restano abbastanza stabili nella scrittura naturale.

L’indice di coincidenza (IC) misura la probabilità che due lettere scelte a caso da un testo siano identiche. I testi in lingua naturale di solito hanno un IC più alto rispetto a un testo casuale. I crittoanalisti usano l’IC per distinguere tra testo in chiaro, sostituzioni monoalfabetiche e alcuni cifrari polialfabetici.

I bigrammi sono sequenze di due caratteri, come DI, LA o EN. I trigrammi sono sequenze di tre caratteri, come CHE, ERE o ION. Forniscono informazioni statistiche aggiuntive e possono migliorare in modo significativo l’analisi dei cifrari classici.

Sì. Confrontando le frequenze osservate con profili linguistici noti, l’analisi di frequenza può spesso stimare la lingua più probabile di un testo, soprattutto quando il testo disponibile è abbastanza lungo.