Huffman Codierung

Die Huffman-Kodierung geht schon auf den guten alten Morse und sein Morse-Alphabet zurück. Das Prinzip bildet die häufiger auftretenden Symbole auf kürzere, selten auftretende auf die langen Codes ab. Der in der Datenverarbeitung sehr weit verbreitete ASCII-Code codiert jedes Zeichen mit 8 Bit. Codiert man nun nach Huffman die häufiger auftretenden Zeichen mit weniger Bits und die seltener auftretenden Zeichen mit mehr Bits so spart man offenkundig Volumen ein.

Zur Festlegung, welches Zeichen mit wievielen Bits codiert werden soll, müssen also Informationen über die Zeichenhäufigkeiten vorhanden sein, wofür drei Möglichkeiten existieren:

statisch:: Die Zeichenhäufigkeiten werden vorher festgelegten Tabellen entnommen.
dynamisch:: Die Daten werden einmal ganz gelesen, um die dort geltenden Häufigkeiten zu bestimmen.
adaptierend:: Es wird mit festen Vorgaben begonnen (z.B.: alle Zeichen treten gleich oft auf, oder das e ist das häufigste Zeichen, usw..), die während der Codierung an die realen Daten angepaßt werden.

Das Verfahren nach Huffman sorgt nicht nur für eine Codierung, die eindeutig, sondern auch optimal ist, d.h., die Länge des codierten Textes wird minimal.

Zur Verdeutlichung des Verfahrens bearbeiten wir das folgende Beispiel: Das Wort ,,abrakadabra`` soll mit dem Huffman-Verfahren codiert werden.

Unterabschnitte

- Bestimmung der Zeichenhäufigkeiten:

AnyWare@Wachtler.de