Zeichenhäufigkeit im Text mit Balkendiagramm-Visualisierung analysieren
Zeichenhäufigkeitsanalyse zählt, wie oft jedes Zeichen in einem Text vorkommt, und drückt Ergebnisse als Zählungen und Prozentsätze aus. Dies ist eine der ältesten Techniken in der Kryptoanalyse — der arabische Mathematiker Al-Kindi beschrieb sie im 9. Jahrhundert.
Neben der Kryptografie wird die Zeichenhäufigkeitsanalyse in der Datenkomprimierung (Huffman-Kodierung), der natürlichen Sprachverarbeitung und der typografischen Analyse verwendet.
ETAOIN SHRDLU ist die ungefähre Reihenfolge der 12 häufigsten Buchstaben im Englischen. Er wurde bekannt, weil Linotype-Maschinen Tasten in dieser Reihenfolge aus Effizienzgründen anordneten.
In einer einfachen Substitutionschiffre wird jeder Klartextbuchstabe konsistent auf einen Chiffretextbuchstaben abgebildet. Die Häufigkeitsanalyse nutzt aus, dass diese Zuordnung Buchstabenhäufigkeiten beibehält.
Das Zipf'sche Gesetz besagt, dass in natürlicher Sprache die Häufigkeit eines Wortes umgekehrt proportional zu seinem Rang in der Häufigkeitstabelle ist.
Huffman-Kodierung ist ein verlustloser Datenkomprimierungsalgorithmus, der häufigeren Zeichen kürzere Binärcodes zuweist. Verwendet in deflate (ZIP, gzip, PNG), JPEG, MP3.
Groß-/Kleinschreibung · Wortzähler · Zeichenzähler · Lorem-Ipsum-Generator · Leerzeichen entfernen · Textzeilen sortieren