Frekans Analizi

Herhangi bir metindeki harf, karakter, kelime, bigram ve trigram frekanslarını analiz edin. Dağılımları dil profilleriyle karşılaştırın ve klasik şifrelerin kriptoanalizi için frekans analizini kullanın.

Girdi
0 kar. · 0 bayt
Dene:
Sonuç
✓ Tarayıcıda analiz ✓ Unicode ve çok dilli metin desteği ✓ Yazarken gerçek zamanlı analiz ✓ İşleme tarayıcıda yerel olarak yapılır
Örnekler
Türkçe metin analizi
Girdi Pijamalı hasta yağız şoföre çabucak güvendi

Bu pangram Türk alfabesindeki karakterleri içerir ve harf dağılımını test etmek için uygundur.

Sezar şifreli metni
Girdi PHUKDED GXQBD

MERHABA DUNYA, Sezar şifresiyle 3 kaydırma kullanılarak şifrelenmiştir. P, H, U, K, D, G, X, Q ve B açık metindeki harflerin kaydırılmış biçimleridir.

Edebi cümle
Girdi Bütün çocuklar büyükler gibi olmaya çalışır

Doğal Türkçe harf dağılımını test etmek için kısa ve akıcı bir cümle.

Tekrarlanan harf örüntüsü
Girdi SABAH SALDIRI AKSAM SALDIRI

Tekrarlanan kelimeler ve harf örüntüleri içeren kısa bir ifade. Kelime frekansı, bigram, trigram ve tekrarlanan sembol analizi için yararlıdır.

Frekans analizi nasıl çalışır

Frekans analizi, bir metinde harflerin, sembollerin, kelimelerin veya karakter gruplarının ne kadar sık geçtiğini ölçer. Doğal diller tanınabilir istatistiksel örüntüler izler: bazı harfler diğerlerinden çok daha sık görünür. Türkçede örneğin A, E, I, N, R ve L en sık rastlanan harfler arasındadır.

Bu araç harf, kelime, bigram ve trigram frekanslarını hesaplar; böylece bilinmeyen bir metni beklenen dil dağılımlarıyla karşılaştırabilirsiniz. Normal dil örüntülerinden büyük sapmalar çoğu zaman şifreleme, kodlama veya alışılmadık metin yapıları hakkında ipucu verir.

Sonuçlar sıralanabilir ve dil profilleriyle karşılaştırılabilir; bu da bir metnin olası dilini belirlemeye ve istatistiksel anomalileri yakalamaya yardımcı olur.

Şifreleri kırmak için frekans analizi kullanmak

Frekans analizi, kriptoanalizin en eski tekniklerinden biridir. Basit yerine koyma şifreleri bir dilin istatistiksel yapısını korur; bu yüzden şifreli metindeki en sık semboller genellikle açık metindeki en sık harflere karşılık gelir.

Bir şifreli metni analiz etmek için gözlenen frekansları şüphelenilen dilin beklenen frekanslarıyla karşılaştırın. Yüksek frekanslı semboller, yaygın bigramlar ve yaygın trigramlar özgün mesajı yeniden kurarken değerli ipuçları sağlayabilir.

Sezar şifresinde frekans tepe noktaları çoğu zaman kaydırmayı doğrudan gösterir. Vigenère ve diğer çok alfabeli şifrelerde frekans analizi, şifre çözmeyi denemeden önce anahtar uzunluğunu tahmin etmek için genellikle çakışma indeksi ve Kasiski incelemesiyle birlikte kullanılır.

Dil frekans profillerini anlamak

Her dilin kendine özgü istatistiksel bir izi vardır. İngilizcede yalnızca altı harf yazılı metnin neredeyse yarısını oluşturur ve bu dağılım konu, yazar ve dönemler arasında şaşırtıcı biçimde kararlı kalır.

İngilizce profili:

E
12.7%
T
9.1%
A
8.2%
O
7.5%
I
7.0%
N
6.7%

Türkçede profilin üst sırası farklıdır: doğal metinlerde A, E, I, N, R ve L sıkça öne çıkar. Bu frekanslar Türkçe açık metni rastgele karakter dizilerinden ve basit yerine koyma ile şifrelenmiş metinlerden ayırmaya yardımcı olur.

Türkçe profili:

A
11.92%
E
9.10%
I
8.60%
N
7.99%
R
7.34%
L
5.92%

Kriptoanalistler, olası dili belirlemek ve sık sembolleri muhtemel açık metin harfleriyle eşleştirmek için gözlenen şifreli metin frekanslarını bu tür profillerle karşılaştırır. Klasik İngilizce mnemonik ETAOIN SHRDLU tarihsel bir referans olarak yararlıdır; Türkçe için AEINRL gibi bir sıra daha pratiktir.

SSS

Frekans analizi, bir metinde harflerin, sembollerin, kelimelerin veya karakter gruplarının ne kadar sık geçtiğini inceleyen yöntemdir. Dil örüntülerini tanımak ve birçok klasik şifreye saldırmak için kullanılan temel bir kriptoanaliz tekniğidir.

Frekans analizi en iyi Sezar şifresi, afin şifre ve basit yerine koyma şifreleri gibi tek alfabeli yerine koyma sistemlerine karşı çalışır. Diğer tekniklerle birlikte kullanıldığında Vigenère şifresine yönelik saldırılara da yardımcı olabilir. AES gibi modern şifreleme algoritmaları frekans analizine karşı savunmasız değildir.

İngilizcede en yaygın harfler genellikle E, T, A, O, I, N, S, H, R, D, L ve C olarak sıralanır. Türkçede ise A, E, I, N, R, L ve K çoğu zaman üst sıralarda yer alır. Kesin dağılım metin türüne göre değişir, ancak doğal yazıda önde gelen harfler oldukça kararlı kalır.

Çakışma indeksi (IC), bir metinden rastgele seçilen iki harfin aynı olma olasılığını ölçer. Doğal dil metinleri genellikle rastgele metinlerden daha yüksek IC değerine sahiptir. Kriptoanalistler IC değerini açık metni, tek alfabeli yerine koymaları ve bazı çok alfabeli şifreleri ayırt etmek için kullanır.

Bigramlar iki karakterlik dizilerdir; örneğin AR, LA veya ER. Trigramlar üç karakterlik dizilerdir; örneğin LAR, BIR veya ILE. Bunlar ek istatistiksel bilgi sağlar ve klasik şifre analizini önemli ölçüde iyileştirebilir.

Evet. Gözlenen frekansları bilinen dil profilleriyle karşılaştırarak frekans analizi, özellikle yeterli metin olduğunda, metnin en olası dilini çoğu zaman tahmin edebilir.