Die Huffman-Kodierung geht schon auf den guten alten Morse und sein
Morse-Alphabet zurück. Das Prinzip bildet die häufiger auftretenden
Symbole auf kürzere, selten auftretende auf die langen Codes ab. Der
in der Datenverarbeitung sehr weit verbreitete ASCII-Code codiert
jedes Zeichen mit 8 Bit. Codiert man nun nach Huffman die häufiger
auftretenden Zeichen mit weniger Bits und die seltener auftretenden
Zeichen mit mehr Bits so spart man offenkundig Volumen ein.
Zur Festlegung, welches Zeichen mit wievielen Bits codiert werden
soll, müssen also Informationen über die Zeichenhäufigkeiten
vorhanden sein, wofür drei Möglichkeiten existieren:
- statisch:
- Die Zeichenhäufigkeiten werden vorher festgelegten Tabellen entnommen.
- dynamisch:
- Die Daten werden einmal ganz gelesen, um die dort geltenden Häufigkeiten zu bestimmen.
- adaptierend:
- Es wird mit festen Vorgaben begonnen (z.B.: alle
Zeichen treten gleich oft auf, oder das e ist das häufigste Zeichen,
usw..), die während der Codierung an die realen Daten angepaßt werden.
Das Verfahren nach Huffman sorgt nicht nur für eine Codierung, die
eindeutig, sondern auch optimal ist, d.h., die Länge des codierten
Textes wird minimal.
Zur Verdeutlichung des Verfahrens bearbeiten wir das folgende
Beispiel: Das Wort ,,abrakadabra`` soll mit dem Huffman-Verfahren
codiert werden.
Unterabschnitte
AnyWare@Wachtler.de