RWTH Aachen
University
Institut für Nachrichtengeräte
und Datenverarbeitung
Prof. Dr.-Ing. P. Vary
Direkt zum Inhalt
Direkt zur Navigation
Startseite
  • Deutsch
  • English
Zur Hauptseite

Voice over IP – Sprachcodierung & Übertragungsprotokolle

Sprachcodierung für Voice over IP

Für die Voice over IP Übertragung wird das Sprachsignal in Rahmen von 20-30 ms Länge unterteilt. In Abhängigkeit von der verfügbaren Übertragungsrate werden die Sprachrahmen zunächst mit einem Sprachcodec codiert. Üblicherweise werden hierzu Sprachcodecs verwendet, die eine Bitrate von z.B. 5.6 kbit/s (ITU-T G.723.1), 8 kbit/s (ITU-T G.729), 12.2 kbit/s (GSM-EFR), bzw. bis zu 64 kbit/s (ITU-T G.711) im Falle uncodierter Übertragung erzielen. Neben diesen sogenannten Schmalbandcodecs (300 Hz - 3.4 kHz Audiobandbreite), sind für VoIP insbesondere auch die qualitativ höher wertigen Breitbandcodecs (50 Hz - 7 kHz Audiobandbreite) von Interesse, da ihre Einführung aufgrund der flexiblen IP Übertragung keine aufwendigen Änderungen der Netzwerkinfrastruktur erfordern.

Das IND hat zur Standardisierung eines neuen Sprachcodecs beigetragen [ITU-T G.729.1], der speziell für Voice over IP in heterogenen Netzen mit unterschiedlichen Zugangsdatenraten geeignet ist. Er basiert auf dem Prinzip der skalierbaren Codierung und stellt in den niedrigen Datenraten Schmalbandqualität und in den höheren Raten Breitbandqualität zur Verfügung.

Übertragungsprotokolle

Die codierten Sprachrahmen werden mittels der RTP/UDP/IP Protokolle für die Übertragung im IP Netzwerk "verpackt". Aufgrund der Echtzeitanforderungen der Sprachtelefonie ist eine wiederholte Übertragung von verlorenen Paketen nicht möglich. Daher wird für VoIP das Übertragungsprotokoll UDP in Kombination mit RTP (Real-time Transport Protocol) anstelle von TCP verwendet.

Die Protokoll-Header von RTP/UDP/IPv4 belegen bereits 12+8+20=40 Byte eines Pakets. Dies ergibt eine Datenrate von 16 kbit/s alleine für die Protokollinformationen, wenn jede 20 ms ein Paket gesendet wird. In Abhängigkeit vom verwendeten Sprachcodec ergibt sich eine Gesamtdatenrate von 22-80 kbit/s je Richtung, mit einem Anteil von 20-73 % an Protokoll-Header Informationen. Dieser beträchtliche Aufwand für Steuerungsinformationen führt zu einer geringen Datenraten-Effizienz bei Voice over IP, was bei der Übertragung über stark begrenzte Funkkanäle zu einem Problem werden kann und gegebenenfalls den Einsatz von  Verfahren zur Header Kompromierung (z.B. ROHC) erfordert.

In Abhängigkeit von verfügbarer Datenrate und erlaubter Verzögerung läßt sich die Zahl an Sprachrahmen je Paket variieren und gegebenenfalls redundante Informationen zum Fehlerschutz hinzufügen, um eine höhere Robustheit gegenüber Übertragungsfehlern zu erzielen.