RWTH Aachen
University
Institut für Nachrichtengeräte
und Datenverarbeitung
Prof. Dr.-Ing. P. Vary
Direkt zum Inhalt
Direkt zur Navigation
Startseite
  • Deutsch
  • English
Zur Hauptseite

Veröffentlichungen – Details

Skalierbare Sprachcodierung auf Basis der Wavelet-Transformation

Autor:
Joachim Stegmann
Herausgeber:
Peter Vary
Typ:
Dissertation
Reihe:
Aachener Beiträge zu Digitalen Nachrichtensystemen (ABDN)
Nummer:
13
Lehreinrichtung:
IND, RWTH Aachen
Verlag:
Verlag Mainz
Veröffentlichungsort:
Aachen, Germany
Veröffentlich.datum:
2000
Sprache:
Deutsch

Kurzfassung

In dieser Arbeit werden skalierbare Sprachcodierungsverfahren entwickelt, deren Bitraten durch Vorgaben des Telekommunikationsnetzes (z.B. Mobilfunk, Internet) innerhalb eines großen Bereichs dynamisch variiert werden können. Wegen der angestrebten niedrigen Bitraten von weniger als 1,5 Bit pro Abtastwert werden modellgestützte hybride Codierverfahren mit linearer Prädiktion im Zeitbereich und konstanter Bitrate für die Prädiktionsfilter zugrunde gelegt.

Die Skalierbarkeit der Bitrate wird durch Transformationscodierung des Residualsignals mit adaptiver Bitzuteilung erreicht. Mit Hilfe der Wavelet-Transformation wird eine Oktavband-Zerlegung des Residualsignals durchgeführt. Man erreicht dadurch eine hohe Frequenzauflösung für Teilbänder mit niedriger Mittenfrequenz. Die Maskierungseigenschaften des Gehörs können ähnlich wie bei Frequenzbereichs-Codierung vorteilhaft genutzt werden.

Es werden die Eigenschaften der diskreten Wavelet-Transformation diskutiert und mit denen der Spektral-Transformationen auf Basis der diskreten Cosinus-Transformation hinsichtlich ihrer Eignung für den Einsatz in einem prädiktiven Transformationscodierverfahren verglichen.

Schließlich wird ein prädiktives Transformationscodierverfahren auf Basis der Wavelet-Transformation entwickelt, das für den Betrieb zwischen 4 und 32 kbit/s geeignet ist. Die Bitrate kann dabei in Schritten con minimal 0,05 kbit/s mit einer Zeitaufläsung von 20 ms skaliert werden. Das Verfahren wird bezüglich Sprachqualität und Komplexität mit verschiedenen Sprachcodec-Standards verglichen.