DVD Tonstandards

Erklärungen zur digitalen Darstellung

Die vielfältigen Tonformate die es gibt, werden einen Laien wohl zuerst sehr verwirren. Grundsätzlich wird dabei zuerst aber einmal zwischen analogen Ton, der die Lautstärke in Form von Spannungsveränderungen darstellt und dem digitalen Ton, der die Lautstärke in viele Bits („Nullen“ und „Einsen“) verpackt, unterschieden.

Das analoge Verfahren kann zwar Frequenzen im Idealfall zu 100% reproduzieren, hat aber ebenso viele Nachteile, weil Störungen das Signal stark beeinflussen können. Ferner können keine Informationen über den Inhalt des Signals übermittelt werden, weil alles als Frequenzschwingungen interpretiert wird.Ein großer Vorteil der digitalen Übermittlung ist, dass man die Daten im Prinzip fehlerfrei übertragen, duplizieren und mittels Korrekturmassnahmen korrigieren kann, und sogar zusätzlich Informationen über die Daten selber übertragen kann, die Art und Inhalt beschreiben. Ein weiterer sehr wichtiger Vorteil ist, dass man die Daten komprimieren kann und so einen wesentlich geringeren Platzverbrauch gegenüber dem analogen Verfahren hat.

Um in die digitale Welt einzusteigen, vorab einige elementare Informationen dazu. Die kleinste digitale Informationseinheit ist ein Bit (Binary Digit). Damit können zwei Signalzustände dargestellt werden. Eine „Null“ oder „0“ für den Zustand „Aus“ und eine „Eins“ oder „1“ für den Zustand „An“. Zur Kennzeichung einer Bit Angabe wird ein kleines b’n‘ benutzt.

Weil man mit einen Bit sehr wenig anfangen bzw. darstellen kann, werden einzelne Bits zu mehreren zusammengefasst um den damit darstellbaren Informationsgehalt beliebig zu erhöhen. Eine Anordnung von 4 Bits nennt man Nibble und bei 8 Bits nennt man es Byte. Mit 4 Bits (dem Nibble) können somit 2^4 = 16 unterschiedliche Zustände digital dargestellt werden. Bei 8 Bits (dem Byte) sind es bereits 2^8 = 256 Zustände (siehe auch untere Tabelle dazu), bei 16 Bits dann 2^16 = 65.536 Zustände, bei 20 Bits dann 2^20 = 1.049.008 Zustände und bei 24 Bits sind es bereits 2^24 = 16.777.216 Zustände. Die Wertigkeit der Bits liest sich dabei jeweils von rechts (Bit 0) nach links (Bit n). Jedes Bit nach rechts verdoppelt dabei die Wertigkeit zum vorherigen.

Zur Bestimmung des im binären Code abgebildeten Wertes, werden die Wertigkeiten aller gesetzten Bits addiert. Ein nicht gesetztes Bit wird dabei nicht betrachtet und dessen Wertigkeit ignoriert. Durch eine Kombination der Wertigkeiten der entsprechenden Bits (siehe Tabelle – Umsetzung analoger Wert in digitale Binäre Information) lassen sich somit alle Werte des Wertbereiches, welches sich mit der Anzahl der verwendeten Bits maximal darstellen läßt, komplett abbilden und in eine einfache, verständliche, verarbeitbare und speicherbare „Sprache“ übertragen.

Wertigkeit in der Binären Darstellung für 8 Bits
Bit Nummer Wertigkeit
0 1
1 2
2 4
3 8
4 16
5 32
6 64
7 128

Beispiel: Ein binärer Wert von b’01000101′ (links Bit 7, rechts Bit 0) entspricht somit:

Bit 0 = 1 = Wert 1
Bit 1 = 0 = Wert 0
Bit 2 = 1 = Wert 4
Bit 3 = 0 = Wert 0
Bit 4 = 0 = Wert 0
Bit 5 = 0 = Wert 0
Bit 6 = 1 = Wert 64
Bit 7 = 0 = Wert 0

Ergibt 1+0+4+0+0+0+64+0 = 69 Dezimal

Da eine Schreibweise mit den vielen „Nullen“ und „Einsen“ sehr unübersichtlich ist, hat man die Hexadezimale Darstellung eingeführt. Ein Hexwert beschreibt dabei jeweils 4 Bits (ein Nibble) mit einem Wert. Da 4 Bits ja 16 Zustände darstellen können, hat man lediglich die Zustände 10-15 durch die Buchstaben A-F ersetzt um eine Darstellung mit einem Wert zu erreichen. Die Hexadezimalschreibweise geht somit von 0-9 und A-F um die 16 Zustände eines Nibbles (x’1′) zu beschreiben.

Zur Kennzeichung eines Hexwertes wird ein kleines x’n‘ benutzt. Für 8 Bits benötigt man dann 2 Hexwerte (x’21‘), für 16 Bits wären es 4 Hexwerte (x’4321′), für 20 Bits wären es 5 Hexwerte (x’54321′) und die 24 Bits stellt man mit 6 Hexwerten (x’654321′) da. Auch hier wird die Wertigkeit wieder von rechts nach links gelesen.

Umsetzung analoger Wert in digitale Binäre Information
16 Analoge Werte abgebildet in 4 Bits
Analoger Wert Binäre Information
Bits – 3210
Hexadezimal
0 b’0000′ x’0′
1 b’0001′ x’1′
2 b’0010′ x’2′
3 b’0011′ x’3′
4 b’0100′ x’4′
5 b’0101′ x’5′
6 b’0110′ x’6′
7 b’0111′ x’7′
8 b’1000′ x’8′
9 b’1001′ x’9′
10 b’1010′ x’A‘
11 b’1011′ x’B‘
12 b’1100′ x’C‘
13 b’1101′ x’D‘
14 b’1110′ x’E‘
15 b’1111′ x’F‘

Grundlagen - Analog AudioBei den digitalen Übertragungsverfahren hat man Probleme, die Frequenzen und die Lautstärke zu 100% zu reproduzieren, weil hier die analogen Schwingungen des Tonsignales in einem festen Zeitintervall abgetastet und digitalisiert und übertragen werden. Bei einer CD passiert das Digitalisieren mit einer Sample Rate (Abtastfrequenz) von 44.1 kHz. Die maximale Frequenz die man so pro Kanal ermitteln und digitalisieren kann, ist jeweils die Hälfe der Abtastfreunz, und wäre somit 44.1/2 = 22.05 kHz bei einer CD. Dagegen kann die Abtasthäufigkeit bei der DVD-Video mit bis 96 kHz (max Frequenzumfang 48 kHz) und bei der DVD-Audio mit bis zu 192 kHz (max Frequenzumfang 96 kHz), die Frequenz- und Lautstärkeauflösung nochmals deutlich steigern.

Ein weiteres Problem ist die Lautstärke, die bei einer analogen Übertragung in Form von positiven und negatven Spannungsschwankungen übertragen wird. Auch hier muss für die Digitalisierung ein Raster aufgelegt werden, um die analogen Spannungen (also die damit erzeugbare Lautstärke) in die digitale Welt zu wandeln. Bei einer CD wird dieses mit der Sample Size von 65.535 Lautstärke-Abstufungen durchgeführt, was einer Tiefe von 16 Bit entspricht. Bei der DVD-Audio und DVD-video können diese Abstufungen mit einer Tiefe von bis zu 24 Bit – was 16.777.216 Stufen entspricht – schon deutlich feiner ausfallen.Grundlagen - Digital Audio

Da aber sowohl postive als auch negative Spannungen vorhanden sind, muss dieses natürlich auch bei der Digitalisierung entsprechend berücksichtigt werden. Man verwendet dazu das sogenannte Integer Sign-Bit, was eine postiven Wert kennzeichnet wenn es auf Binary „0“ ist und einen negativen Wert kennzeichnet wenn es auf Binary „1“ ist. Dazu verwendet man das Bit mit der höchsten Wertigkeit, also das ganz linke. Demnach kann man bei einer Sample Size von 16 Bit noch Werte von +0 (b’0000-0000-0000-0000′ = x’0000′) bis +32767 (b’0111-1111-1111-1111′ = x’7FFFF‘) und -1 (b’1000-0000-0000-0000′ = x’8000′) bis -32768 (b’1111-1111-1111-1111′ = x’FFFF‘) darstellen. Zu beachten ist dabei, das eine negative Zahl jeweils mit ihrem eigentlichen Wert -1 dargestellt wird. Normalerweise müsste man davon ausgehen, das -1 als (b’1000-0000-0000-0001‚ = x’8001‚) dargestellt wird, aber dann würde man einen digitalen Darstellungswert überspringen, weil es eine -0 nicht gibt.

Die im nebenstehenden Beispiel eingetragenen „Nullen“ und „Einsen“ für die Lautstärkebestimmung als kleinste digitale Informationsheit (dem Bit) stellen jeweils einen Signalzustand da und werden dann für ein Sample der Sample Rate zusammengefasst und als Werte der Sample Size gespeichert. Jedes Signal im positiven sowie im negativen wird hierbei eine „1“ und im anderen Fall eine „0“ als Informationseinheit zugewiesen. In diesem Fall sind es 10 Informationseinheiten (+5 bis -5) pro Sample, die dann in einer digitalen binären Information bestehend aus jeweils 4 Bits (max. 2^4 = 16 Möglichkeiten) digital dargestellt werden. Das ganz linke Bit 3 (die Zählweise beginnt rechts bei 0) wird dabei als das Integer Sign Bit verwendet und repräsentiert somit jeweils eine postive (bei „0“) oder negative (bei „1“) Zahl.

Anhand des Beispiels würden die 10 Samples wie folgt ins digitale übersetzt werden.

Umsetzung der Signalzustände in digitale Information
Sample Informationseinheit Wertigkeit Binäre Information
Bits – 3210
Hexadezimal
1 00111000000 -3 b’1010′ x’A‘
2 0000011000 +2 b’0010′ x’2′
3 00000011111 +5 b’0101′ x’5′
4 0000011100 +3 b’0011′ x’3′
5 0000000000 0 b’0000′ x’0′
6 0001100000 -2 b’1001′ x’9′
7 0000000000 0 b’0000′ x’0′
8 0000011000 +2 b’0010′ x’2′
9 0000011110 +4 b’0100′ x’4′
10 0000010000 +1 b’0001′ x’1′

Die Binäre Information die bei der Digitalisierung per Analog/Digital Wandler gewonnen wird, kann so in allen Medien verlustfrei weiterverarbeitet, gespeichert und transportiert werden. Allerdings ist damit auch klar, dass diese Information nicht wieder direkt zur Erzeugung von Schallwellen eingesetzt werden kann. Woher soll der Lautsprecher auch wissen, welche Lautstärke er bei einer 24 Bit Sampling Size Zahlenkolonne von b’0000-1010-1111-1101-0101-1110′ = x’0AFD5E‘ wiedergeben soll, welche ja nur in viele „Aus“ – „An“ einer konstanten Spannung resultiert.

Zur Wiedergabe in der korrekten Lautstärke muss aber pro Sample eine genau definierte analoge Spannung vorhanden sein und nicht viele digitale „Aus“ – „An“ Zustände eines binären Codes. Dazu wird das digitale Signal durch einen Digital/Analog Wandler geschickt, der hier genau den umgekehrten Fall wie bei der Digitalisierung durchführt. Hier wird passend zur digitalen Wertigkeit des binären Codes eine entsprechende analoge Spannung ausgegeben. Umso mehr Bits (also Informationseinheiten) pro Sample dafür zur Verfügung stehen, umso feiner und genauer ist das Raster der daraus resultierenden Spannung.

Beispiel: Da bei einer 24 Bit Sample Size total 16.777.216 (8.388.608 positive und 8.388.608 negative) unterschiedliche Spannungsstufen erzeugt werden können, ergibt sich daraus für den Beispielwert folgende Umrechnung in eine analoge Spannung:

Der obrige Beispielwert von b’0000-1010-1111-1101-0101-1110′ = x’0AFD5E‘ entspricht dem Dezimalwert +720.222. Bei angenommenen +5 Volt als Max Wert bei x’7FFFFF‘ = Dezimal +8.388.607 und -5 Volt als Max Wert bei x’FFFFFF‘ = Dezimal -8.388.608 ergibt dieses eine Schrittweite (Raster) von 0,000000596 Volt pro Informationseinheit. Dementsprechend ergäbe der Beispielwert eine analoge Spannung von +0,429285764 Volt. Da jedes Bit (von rechts nach links gesehen) jeweils eine Verdopplung der Wertigkeit darstellt, würde dieses bei setzen des Bit 22 (das vorletzte von links mit der Wertigkeit von 4.194.304, da das ganz linke Bit 23 ja als Integer Sign-Bit fungiert und über postiv/negativ Auskunft gibt) einen Wert von b’0100-1010-1111-1101-0101-1110′ = x‘4AFD5E‘ ergeben, was einen Dezimalwert von +4.914.26 entspricht und daraus würde bereits eine Spannung von +2,929057496 Volt resultieren. Würde man dagegen das Bit 0 setzen (das ganz rechte mit der niedrigsten Wertigkeit von 1), dann ergäbe dieses einen Wert von b’0000-1010-1111-1101-0101-1111‚ = x’0AFD5F‚ was einen Dezimalwert von +720.223 entspricht und die Spannung würde sich deswegen lediglich um 0,000000596 Volt auf 0,429286360 Volt verändern. Ein gesetztes/ungesetztes Bit an der entsprechenden Stelle (Wertigkeit) kann also relativ große Auswirkungen haben.

Unvermeidbar ist dabei allerdings immer ein mehr oder weniger ausgeprägter „Sägezahn Effekt“ (siehe Abbildung – Digital Audio), aber umso feiner die Abtastung bzw. das Raster (Größe der Sampling Size und Häufigkeit der Sampling Rate), umso geringer fällt dieser Effekt aus. Teilweise wird dieses auch durch ein „Oversampling“, also mit der Errechnung eines oder mehrerer interpolierter Zwischenwerte zwischen real existierenden Samples, weiter verfeinert. Simpel ausgedrückt werden dabei z.B. zwei Samples addiert und dann durch zwei geteilt. z.B. Sample 1 = 40 und Sample 2 = 80, dann wäre der errechnete Zwischenwert 60. Das Raster würde dadurch also doppelt so fein. Ob aber in Wirklichkeit dort auch 60 vorhanden war, was leider durch die zu grobe Abtastung nicht erfasst wurde, das weiß natürlich später niemand mehr. Die mit der „Oversampling“ Methode erzielbare feinere Rasterung bleibt somit nur eine geschätzte Annahme des ursprünglichen Wertes.


Analoger Ton

Angefangen hat alles vor einiger Zeit mit dem analogen Mono Ton. Dieser ist einkanalig und so kommt allerdings keinerlei Räumlichkeit auf. Die nächste Stufe kam dann ca. 1970 mit dem Stereo Ton in die Kinos, der durch das zweikanalige Signal bereits in der Lage war, eine räumliche Abbildung zu schaffen. Zwar keinen Rundum-Effekt (Surround Sound), aber eine Tiefenstaffelung vor dem Zuhörer. Für das Wohnzimmer folgten dann dann etliche Jahre mit vielen Versuchen, um mittels Quadrophonie und den dazugehörigen vier Lautsprechern eine Rundum-Lokalisierung des Tones und einen kompletten räumlichen Eindruck zu schaffen. Diese Technik ist aber nie richtig aus ihrem Schattendasein herausgekommen.

Dann begann der Siegeszug der Dolby Laboratories mit ihren vielfältigen Tonverfahren in den Kinos. Das hier mit dem Lichtonverfahren und nicht mit einer magnetischen Aufzeichnung gearbeitet wurde, sei nur am Rande erwähnt. Angefangen hat es Mitte 1976 mit SVA ((Stereo Variable Area „Matrixing“) und der Rauschunterdrückung Dolby A, bei dem ein Center Kanal und ein Rear Surround Kanal mittels einer Matrix Kodierung in das zweikanalige Stereosignal eingearbeitet wurden. Das Prinzip ist bis heute so gebleiben, wurde aber in den kommenden Jahren immer weiter verfeinert.

Es folgte dann im Sommer 1986 das Tonverfahren Dolby Stereo SR (Spectral-Recording), welches eine bessere Kanaltrennung durch aktive Komponenten erreichte. Ferner hat es auch eine bessere Rauschunterdrückung. Seit der Einführung ist Dolby Stereo SR der Standard-Lichtton auf den Filmen.

Daraus entwickelte sich der später der Nachfolger Dolby ProLogic, auch bekannt unter dem Namen Dolby Surround.Allen diesen Verfahren ist gemeinsam, dass sie auf einem zweikanaligen Stereosignal beruhen, in dem mittles einer Matrix die beiden zusätzlichen Kanäle (Center und Rear) untergebracht wurden. Mittels eine Decoders ist es so möglich, aus den zwei angelieferten Stereokanälen, die zwei darin versteckten Center- und Rear-Kanäle zu extrahieren, um so auf vier Tonkanäle zu kommen. Diese setzen sich aus Frontbox links, Centerbox, Frontbox rechts, und den beiden Mono Rearboxen links und rechts zusammen. Mittels dieser 5 Boxen, die um den Zuhörer plaziert wurden, konnte schon eine gute räumliche Abbildung erreicht werden.

Der Nachteil ist, dass die beiden Rear Surroundboxen nur ein Monosignal abstrahlen und so keinerlei Effekte zwischen hinten links und hinten rechts abbilden können. Ferner ist das Rearsignal auf 7 kHz beschränkt. Auch ist die Kanaltrennung nicht sonderlich hoch, so dass Tonanteile (Fragmente) schon mal aus anderen Lautsprechern kommen.


Digitaler Ton

Das Urformat für die digitalen Tonstandards ist das PCM oder LPCM (Linear Pulse Code Modulation) Format. Die Daten auf einer CD sind z.B. in diesem Format gespeichert. Die Datenrate und Platzverschwendung ist dabei mit 1.44 Mbit/sec sehr hoch.

Als weiteres Format wurde das MPEG (Moving Picture Expert Group) mit vielfältigen Unterformaten (des Layers) vom Frauenhofer Institut entwickelt. Auch MP3 basiert mit dem Layer 3 auf dem MPEG Tonstandard mit dem (Audio Layer 3). Da MPEG-1 Layer 2 nur zweikanalig ausgelegt war, sollte auch eine Mehrkanalton Varinale entwickelt werden, die aber abwärts kompatibel zum alten, zweikanaligen MPEG-1 Layer 2 Format sein sollte. Der Grund war, dass MPEG-1 Layer 2 bereits bei dem digitalen Fernsehen als Tonstandard verwendet wird und um Übertragungskapazität für einen extra Tonkanal mit ca. 400-500 kbps sparen, sollte die Mehrkanalton Information nur als Delta Signal in dem bereits genutzen MPEG-2 Layer 2 Tonkanal übertragen werden. Dabei gelang es aber nicht, den MPEG-2 Multichannel genannten Tonstandard soweit zu entwickeln, bis er richtig funktionierte. Die Probleme durch die abwärts Kompatibilität waren dabei zu groß und die europäische Industrie wolle endlich mit der DVD und einem funktionierendem Mehrkanalton antreten. So wurde bis auf ein paar wenige DVD-Versuche der MPEG-2 Multichannel wieder zu Grabe getragen (und hoffentlich bleibt er da auch!), weil es auch kaum MPEG-2 Multichannel Decoder gab und auch heute nicht mehr gibt.

Mit den digitalen Mehrkanalton Varianten, wie sie Dolby Digital und DTS (Digital Theater Systems) verwenden, können mehrere Kanäle vollkommen unabhänging voneinander (also discrete) übermittelt werden. Beide Verfahren mussten nicht, wie MPEG II Multichannel, abwärts kompatibel sein und konnten so kompromisslos auf Kanaltrennung ausgelegt werden. Jeder Kanal hat dabei einen Frequenzumfang von 20 bis 20.000 Hz. Zusätzlich hat man auch einen Tiefton-Kanal vorgesehen, den LFE Kanal (Low Frequency Effect), der nur Frequenzen bis 120 Hz überträgt, dabei aber eine sehr grosse Dynamik haben kann.

Im Kino Bereich haben sich zuerst ab Juni 1992 mit Batman Returns Dolby Digital und dann zusätzlich 1997 mit Jurassic Park DTS als Tonformate etabliert. Es gibt im Kino noch das von Sony verwendete SDDS Verfahren, welches aber nur eine geringe Bedeutung und Verbreitung hat und im Home Cinema Bereich gar nicht vertreten und auch nicht als optionaler Tonstandard auf der DVD vorgesehen ist.Der Dolby Digital Tonstandard kann dabei maximal 6 Kanäle verwalten, also 5 normale Kanäle plus den Subwoofer LFE Kanal. Daraus ergibt sich auch die Bezeichung Dolby Digital 5.1 welches die Anzahl der verwendeten Kanäle kennzeichnet. Der DTS Tonstandard kann sogar bis zu 8 Kanäle verwalten. Im Normalfall werden aber auch hier nur 6 Kanäle verwendet, sodass DTS 5.1 die gleiche Lautsprecher Konfiguration wie Dolby Digital 5.1 verwendet.

Erst vor einiger Zeit wurde mit dem neuen Tonstandard DTS ES Discrete 6.1 das Verfahren erweitert und verwendet nun total 7 Kanäle – 6 normale Kanäle plus den Subwoofer LFE Kanal. Der zusätzliche Kanal ist für ein oder zwei Rear Center Lautsprecher gedacht, die sich mittig hinter dem Zuhörer befinden. Solch eine Lösung wurde auch von Dolby mit dem Tonstandard Dolby Digital Surround EX geboten, welches aber den Nachteil hat, dass Dolby Digital nur 6 Kanäle transportieren kann, so dass der Rear Center Kanal wie bei der analogen Dolby Surround Technik in die beiden Rear Surround Kanäle mittels einer Matrix Lösung untergbracht werden musste. Die Kanaltrennung ist dabei natürlich nicht so hoch wie bei einem diskreten Kanal wie sie die DTS ES Discrete 6.1 Lösung bietet. Als Vergänger dieser diskreten Version hatte DTS auch kurzfristig eine DTS ES Matrix 6.1 auf den Markt gebracht, die wie die Lösung von Dolby mit einer analogen Matrix Kodierung des Rear Center Kanals in den beiden Rear Surround Kanälen arbeitet.

Anzumerken bleibt noch, das die beiden neuen Verfahren Dolby Digital Surround EX und DTS ES Discrete 6.1 zu den älteren digitalen Tonstandard Verfahren abwärts kompatibel sind. Jeder Dolby Digital oder DTS Decoder kann diese Formate wiedergeben. Die Daten des zusätzlichen Rear Center Kanals werden dabei den beiden Rear Surround Kanälen beigemischt und als Mono Signal wiedergegeben. Dadurch wird dieses Signal auch aus der Mitte empfunden, aber nicht so stabil wie bei zusätzlichen Rear Center Boxen.

Hier noch einige Anmerkungen zur Vergangenheit und Zukunft: Im Januar 1995 kamen die ersten Verbraucher-Geräte mit Dolby Digital Unterstützng auf den Markt. Ebenfalls im Januar 1995 demonstrierten Toshiba und Time Warner den ersten DVD Prototyp mit Dolby Digital AC-3. Im Dezember 1997 wurde Dolby Digital auch als Standard für PAL DVDs zugelassen. Bis zu diesem Zeitpunkt war es nur als optionaler Tonstandard zugelassen und alle PAL DVDs sollten mit dem mittlerweile nicht mehr verwendeten MPEG II Multichannel Tonstandard gefertigt werden. Das zusätzliche Kürzel AC-3 (Audio Coding 3) wird nun nicht mehr verwendet. Im Oktober 1998 wurde das Tonverfahren Dolby Digital – Surround EX mit einem zusätzlichen Rear Center Kanal angekündigt. Im Juli 1999 wurde Dolby Digital auch als optionales Tonformat für das digitale Fernsehen DVB (Digital Video Broadcasting) zugelassen.

Tonstandards

Damit der Ton auf einer DVDs auch in allen und mit allen Geräten wiedergegeben werden kann, hat das DVD Konsortium Pflicht Tonstandards, die auf jeder DVD enthalten sein müssen, vorgeschrieben.

Andere Tonstandards wie z.B. DTS (Ref.: Tonformate – DTS) oder eines oder mehrere der vorgenannten Tonstandards können jeweils zusätzlich optional vorhanden werden.


Analog

Die bisher verwendeten Formate auf Ton Kassetten, VHS Kassetten, TV Übertragungen usw. verwenden alle ein analogen Tonstandard. Dieses ist entweder Mono 1 kanalig, oder Stereo 2 kanalig. Ist in beiden Stereo Kanälen ein identisches Signal, dann spricht man auch hier von einem Mono Signal.

Der große Nachteil des analogen Tonstandards ist es, das keinerlei Kennzeichen über den Inhalt und Verwendung enthalten sind. So ist es nicht möglich anhand des Signals zu erkennen, ob nun ein Stereo oder Dolby Surround Signal enthalten ist. Da Dolby Surround auf einem 2 kanaligen Stereo Signal aufbaut, kann ein nachgeschalteter Decoder nicht erkennen, ob nun lediglich ein 2 kanaliges Stereo Signal oder ein 4 kanaliges Dolby Surround Signal enthalten ist. Hier ist der Mensch gefragt und muss entscheiden, welches Tonformat er denn gerne hören möchte.


PCM oder LPCM

Dieser Tonstandard nennt sich Liniar Pulse Code Modulation und wird von fast allen Geräten erkannt und verarbeitet. Auch normale CD Player mit digital Ausgang geben die Daten im PCM Tonformat aus, weil die Daten (bzw. die Musik) genauso auf der CD gespeichert sind. Das Tonformat kann 2 Tonkanäle (Stereo (Ref.: Tonformate – Stereo) bzw. Dolby Surround (Ref.: Tonformate – Dolby Surround)) aufnehmen und arbeitet mit einer Datenrate von 1,44 MBit/Sec.

Das PCM Format ist das Urformat aller digitalen Tonsignale. Bei einer CD beträgt die Auflösung (Samplingsize) 16 Bit was 65.536 Abstufungen in der Lautstärke entspricht bei einer Abtastrate (Samplingrate) von 44.1 kHz, was eine maximale Frequenzauflösung von 22.05 erlaubt, aber intern auf 20 kHz berenzt wird.

Bei der DVD Video ist eine Abtastfrequenz von bis zu 96 kHz möglich, was somit maximal 48 kHz Frequenzauflösung pro Kanal ermöglicht, sowie einer Auflösung von 24 Bit, entspricht 16,7 Millionen Lautstärke Abstufungen.
Die DVD Audio erlaubt sogar Abtastfrequenzen bis 192 kHz und erreicht somit eine maximale Frequenzauflösung von bis zu 96 kHz pro Kanal.Generelle PCM Parameter der DVD-Video sind:

  • Sampling Frequency 48 KHz oder 96 kHz
  • Sampling Size 16, 20 oder 24 Bits
  • Kanäle 1 bis 8

Generelle PCM Parameter der DVD-Audio sind:

  • Sampling Frequency 44.1, 48.0, 88.2, 96.0 176.4 oder 192 KHz
  • Sampling Size 16, 20 oder 24 Bits
  • Kanäle 1 bis 6

MPEG

Dieser Tonstandard nennt sich Moving Picture Expert Group und wird in vielen Variationen verwendet. (Auch das MP3 Format basiert auf dem MPEG-1 Layer 3 Tonformat). Der Vorteil des MPEG-1 Tonstandards gegenüber des PCM Tonstandards ist aber, die Daten werden komprimiert gespeichert und nicht hörbarer Töne werden zudem entfernt.

Da der Tonstandard ursprünglich wie das der PCM Tonstandard (Ref.: Tonformate – PCM oder LPCM) nur 2 Tonkanäle (Stereo) verwalten konnte, wurde eine Mehrkanalton Variante unter dem Begriff MPEG-2 Multichannel erschaffen, welche es aber eigentlich nicht mehr gibt. Dieses Tonformat war abwärts kompatible zum alten MPEG-1 Layer 2 Tonformat und ist wohl deswegen gescheitert. Bedingt durch die abwärts Kompatibilität konne die Trennung der Kanäle im Decoder nicht mehr exakt durchgeführt werden. Einige weniger Code-2 DVDs der ersten Stunde von Columbia Tristar hatten einen MPEG-2 Multichannel Tontrack (z.B. In the Line of Fire oder Jumanji), aber mangels Decoder in den Haushalten konnte kaum jemand diesen Tonstandard anhören.

Zwar wurde ein neueres MPEG-2 Multichannel Verfahren entwickelt, welches sich MPEG-2 Audio NBC (Non Backward Compatible) nennt, und später in MPEG-2 Audio AAC (Advanced Audio Coding) umbenannt wurde, dieses aber keine Zulassung für die DVD hat, weil es nicht kompatible zu dem MPEG-1 Layer 2 Format ist.

Da die Industrie keinen MPEG Mehrkanalton liefern konnte, weil der MPEG-2 Multichannel Tonstandard nicht zum laufen kam, aber Dolby Digital (Ref.: Tonformate – Dolby Digital) zu diesem Zeitpunkt noch nicht als Standardformat für PAL DVDs zugelassen war, musste man so zwangläufig die ersten PAL DVDs mit dem MPEG-1 Layer 2 Tonstandard in Dolby Surround (Ref.: Tonformate – Dolby Surround) erstellen. Da richtiger Mehrkanalton somit nicht möglich war, konnte dieses natürlich kein Zustand auf Dauer sein. Mit einem mittleren Paukenschlag wurde deswegen durch das DVD-Forum am 5 Dezember 1997 im Hotel Continental in Tokio das Dolby Digital Format vom Optionalen in den Status eines Standardformates für PAL DVDs gehoben und war somit gleichberechtigt mit den bisherigen Standardformaten PCM und MPEG. Ab diesem Zeitpunkt war das Ende des MPEG Tonformats im Prinzip besiegelt. Auch weitere Vorstösse von Philips und Sony konnten dem MPEG-2 Multichannel Format nicht mehr zum Durchbruch verhelfen.

Heute spielt der MPEG Tonstandard auf der DVD kaum noch eine Rolle. Einige wenige Menüs sind (evtl. versehentlich ?) noch in diesem Tonstandard erstellt worden. In aller Regel verwendet man aber heute das Dolby Digital 1.0 (für Mono) oder Dolby Digital 2.0 (für Mono oder Stereo) Tonformat zur Speicherung von Tonsignalen. Auch haben die meisten Decoder mit dem MPEG Tonformat ihre Probleme, sodass man die digitalen Daten, bevor diese den DVD Player verlassen, per DVD Player Setup in das PCM Tonformat wandeln sollte.Generelle MPEG Parameter der DVD-Video sind:

  • Sampling Frequency 48 KHz
  • Sampling Size bis zu 20 Bits
  • MPEG-1 – Nur Layer II
  • MPEG-1 Bitrate – 64 bis 192 kbps (Mono) oder 63 bis 384 kbps (Stereo)
  • MPEG-2 – Nur BC (Backward Compatiblity) Matrix Mode
  • MPEG-2 Bitrate – 62 bis 912 kbps (incl. Extention Streams)
  • Extention Streams für 5.1 Kanal oder 7.1 Kanal
  • Tonformate (Front/Rear) 1/0, 2/0, 2/1, 2/2, 3/0, 3/1, 3/2 5/2
  • Der LFE Kanal kann in allen Kombinationen verwendet werden

Dolby Digital

Logo - Dolby DigitalDieses ist wohl eines der bekanntesten Tonstandards, welches seit dem 5 Dezember 1997 auch zu den Standard Tonformaten für PAL DVDs gehört. Ursprünglich war als Tonformat für PAL DVDs das MPEG Format vergesehen und Dolby Digital hätte immer nur als zusätzliche Tonspur vorhanden sein können. Da die MPEG Fraktion aber keinen funktionierenden Mehrkanalton Codec entwickeln konnte, keine MPEG Decoder in den Haushalten vorhanden waren und die Industrie endlich auch in Europa mit der DVD starten wollte, wurde Dolby Digital nachträglich in den Status eines Standardformates für PAL DVDs gehoben.

Das Tonformat Dolby Digital ist sehr vielseitig und kann von 1 – 6 Kanälen Daten diskret speichern. Dabei haben alle normalen Kanäle einen Frequenzumfang von 20Hz – 20.000Hz und der LFE (Low Frequency Effekt) Subwoofer Kanal einen Frequenzumfang von 20Hz – 120Hz.

Tonformate - Dolby Digital 1.0 Tonformate - Dolby Digital 2.0 DS=Off
DD 1.0 1/0/0
(Mono, kein Subwoofer)
DD 2.0 DS=Off 2/0/0
(Stereo, kein Subwoofer)

Mit dem Dolby Digital Tonformat lassen sich auch Mono Tonsignale bei Verwendung des DD 1.0 (nur 1 Kanal wird benutzt) übertragen. Ebenso ist es natürlich möglich auch nur ein Stereo Tonsignal zu übertragen. Dazu wird das DD 2.0 Format benutzt, bei dem zwei Kanäle benutzt werden und als Indikator für Stereo das Dolby Surround Flag auf Off (DS=Off) gesetzt wird. Da mit einem einem DD 2.0 Signal auch Dolby Surround Informationen übertragen werden könnten, ist dieser Indikator als Unterscheidungs Merkmal sehr wichtig und den Ton auch korrekt Reproduzieren zu können.

Siehe dazu auch das passende Schaubild in (Ref.: Grundlagen – Stereo) für weitere Informationen.

Tonformate - Dolby Digital 2.0 DS=On Tonformate - Dolby Digital 4.0
DD 2.0 DS=On 3/1/0
(Front Links/Center/Rechts,
Rear Mitte,
kein Subwoofer)

Dolby Surround mit
Matrix Kodiertem Signal.
DD 4.0 3/1/0
(Front Links/Center/Rechts,
Rear Mitte,
kein Subwoofer)

Dolby Surround mit
diskreten Kanälen.
Tonformate - Dolby Digital 5.0 Tonformate - Dolby Digital 5.1
DD 5.0 3/2/0
(Front Links/Center/Rechts,
Rear Links/Rechts,
kein Subwoofer)
DD 5.1 3/2/0
(Front Links/Center/Rechts,
Rear Links/Rechts,
Subwoofer)

Genau genommen ist Dolby Digital (wie DTS (Ref.: Tonformate – DTS)) nur eine Verpackungsform für die Tonsignale. Deswegen muss bei Dolby Digital (und auch DTS) immer die Anzahl der verwendeten Kanäle angegeben werden, damit man weiß, was letztendlich damit gemeint ist.

Dabei wird eine Kanalzahl vor und nach dem Punkt angegeben. z.B. DD x.y bedeutet, x reguläre Kanäle und y Subwoofer Kanäle. Es gibt auch eine Schreibweise bei der die Anordung der Kanäle ersichtlich wird. Diese werden dabei durch Striche getrennt. z.B. x/y/z bedeutet, x Kanäle im Frontbereich, y Kanäle im Rear Bereich und z Kanäle im Subwoofer Bereich.

Das Format DD 2.0 ist ein besonderes Format, weil dieses ein Stereo Signal (rein 2 kanalig) oder ein Dolby Surround Signal (4 kanalig per Matrix Kodierung im Stereo Signal) sein kann. Dazu gibt es im Datenstream ein DS Flag (Dolby Surround (Ref.: Tonformate – Dolby Surround)). Ist dieses Flag auf 0ff, dann liegt ein normales 2 kanaliges Stereo Signal vor. Ist dieses Flag aber auf On gesetzt, dann bedeutet es, das hier ein Dolby Surround Signal enthalten ist.

Das DS Flag ist aber auch öfters falsch gesetzt und viele Decoder ignorieren es auch. Deswegen ist durchaus ein Versuch angebracht, bei einem „angeblichen“ DD 2.0 Stereo Track mal den Dolby Surround Modus zu aktivieren. Auch viele CDs klingen im Dolby Surround Modus viel besser. Oftmals sind diese bereits richtig räumlich abgemischt, aber aus Lizenzgründen wurde das Dolby Surround Logo nicht angebracht. Einfach mal probieren und zwischen den beiden Modi umschalten.

Siehe dazu auch das passende Schaubild in (Ref.: Grundlagen – Dolby Surround und Dolby Pro Logic II) und (Ref.: Grundlagen – Dolby Digital 5.1 oder DTS 5.1) für weitere Informationen.

Tonformate - Dolby Digital Surround EX
Dolby Digital Surround EX 3/3/1
(Front Links/Center/Rechts,
Rear Links/Center/Rechts,
Subwoofer)

Als Erweiterung ist vor einiger Zeit das Dolby Digital Surround EX Tonformat, welches einen zusätzlichen 7. Center Kanal im Rear Breich zur Verfügung stellt, hinzu gekommen. Dabei musste aber Zwangsläufig der Weg der diskreten Trennung der Kanäle aufgegeben werden, da Dolby Digital nur für maximal 6 diskrete Kanäle ausgelegt ist. Um den neuen Rear Center Kanal unterzubringen, wurde dieser per Matrix Codierung in die beiden Rear Surround Kanäle eingearbeitet. Bisher wurde Dolby Digital Surround EX nur in Verbindung mit THX™ (Ref.: Tonformate – THX™ Anmerkungen) vermarktet, und war deswegen (offizell) nur in solch zertifizierten Geräten zu finden. Diese Kopplung wurde aber jetzt aufgehoben.

Wenn man es genau nimmt, ist dieses eigentlich eher ein Marketing Gag, weil die Rear Center Informationen sind ja ebenfalls in jeden normalen Dolby Digital 5.1 Track enthalten. Jegliche Tonanteile die zu gleichen Teilen (der Monoanteil) in beiden Rear Surround Kanälen vorhanden sind, entsprechnen dem neuen Rear Center Kanal, dieses wird aber in einer nicht Dolby Digital Surround EX fähigen Anlage auch von beiden Rear Surround Boxen ebenfalls wiedergegeben und auch als ein mittiges Signal empfunden. Der Vorteil der extra Rear Center Boxen (typischerweise 2 Boxen) ist das stabiliere Klangbild. Dieses ist auch der Grund dafür, das man bei Dolby Digital Surround EX fähigen Geräten bei manueller Zuschaltung des Rear Center Kanales dort immer etwas hört, weil ja immer Monoanteile vorhanden und zu hören sind. Sicher gibt es auch spezielle Dolby Digital Suround EX Abmischungen die den Rear Center Kanal mehr oder extra betonen. Zu vergleichen ist es mit dem Frontabbild. Einmal mit und ohne Center Lautsprecher, wobei dem Rear Center aber deutlich wenig Gewicht beizumessen ist.

Mit dem Dolby Digital Professional Encoder 7.0 (Stand 28.05.2001) ist es jetzt auch möglich ein EX Flag im Datastream zu setzen was einen entsprechenden Decoder, der dieses Flag auswertet, automatisch in den EX Modus schaltet. Bisher musste dieses Umschalten immer manuell durchgeführt werden, weil keine Kennung im Datastream vorhanden war und Dolby Digital 5.1 und Dolby Digital Surround EX keine erkennbare Unterscheidung aufwiesen.

Siehe dazu auch das passende Schaubild in (Ref.: Grundlagen – Dolby Digital Surround EX oder DTS-ES) für weitere Informationen.

Hinweis: Viele DTS ES fähige Geräte können auch Dolby Digital Surround EX wiedergeben, obwohl es nicht in den Anleitungen erwähnt wird. Der Grund ist lediglich die fehlende THX™ Zertifizierung, warum es nicht als Feature gelistet wird.

Auf der DVD wird meistens bei einem Dolby Digital 5.1 Tonformat mit einer Datenrate von 384 kbps oder 448 kbps gearbeitet. Bei einem Dolby Digital 2.0 (Stereo oder Dolby Surround) Tonformat wird meistens mit 192 kbps gearbeitet.

Generelle Dolby Digital Parameter der DVD-Video sind:

  • Sampling Frequency 48 KHz
  • Sampling Size bis zu 24 Bits
  • Bitraten von 64 bis 448 kpbs (typisch 384 oder 448 kbps)
  • Kompressionsraten
    • Dolby Digital 2.0 bei 192 kbps 8:1 = 87%
    • Dolby Digital 5.1 bei 384 kbps 12:1 = 92%
    • Dolby Digital 5.1 bei 448 kbps 10:1 = 90%
  • Tonformate (Front/Rear) 1/0, 2/0, 3/0, 2/1, 2/2, 3/1, 3/2, 1+1/0
  • Der LFE Kanal kann in allen Kombinationen verwendet werden

Im Kino wird übrigens eine Datenrate von 328 kbps verwendet.

DTS

Logo - DTSDer Digital Theater Systems Tonstandard hat erst recht spät seinen Einzug in die Heimkino Welt gehalten. Die Ursprüngliche DVD Spezifikationen sah DTS nicht vor. Deswegen können alte DVD Player diesen Tonstandard gar nicht erkennen und ausgeben. Erst nachträglich wurde DTS als optionaler Tonstandard auf der DVD zugelassen.


Tonformate - DTS 5.1

DTS 5.1 3/2/1
(Front Links/Center/Rechts,
Rear Links//Rechts,
Subwoofer)

DTS ist wie Dolby Digital ein Mehrkanlton Speicherformat und kann dabei von 1-8 Kanäle diskret aufnehmen. Typischerweise wird DTS 5.1 als ein Standard Format angesehen. Aber auch hier sind wie bei Dolby Digital viele Abstufen vorgesehen.

Siehe dazu auch das passende Schaubild in (Ref.: Grundlagen – Dolby Digital 5.1 oder DTS 5.1) für weitere Informationen.

Tonformate - DTS-ES Matrix 6.1 Tonformate - DTS-ES Discrete 6.1
DTS-ES Matrix 6.1 3/3/1
(Front Links/Center/Rechts,
Rear Links/Center/Rechts,
Subwoofer)
DTS-ES Discrete 6.1 3/3/1
(Front Links/Center/Rechts,
Rear Links/Center/Rechts,
Subwoofer)

Zusätzlich wurden vor einiger Zeit die Erweiterungen DTS-ES Matrix 6.1 und DTS-ES Discrete 6.1 ins Leben gerufen. Während DTS-ES Matrix 6.1 wie Dolby Digital Surround EX einen Rear Center Kanal in die beiden bereits vorhanden Rear Surround Kanäle per Maxtrix Kodierung einarbeitet, benutzt das DTS-ES Discrete 6.1 Format einen neuen zusätzlichen diskreten Kanal dafür. Deswegen ist eigentlich nur das DTS-ES Discrete 6.1 das Format welches auch das Attribute 6.1 tragen sollte.

Auch hier gelten bei gleichen Anmerkungen wie bei Dolby Digital Surround EX (Ref.: Tonformate – Dolby Digital) was den Rear Center Kanal betrifft. Diese Informationen waren auch schon vorher vorhanden, werden aber mit dem extra spezifizierten Kanal nun separat verarbeitet und wiedergegeben.

Im DTS Stream ist ein ES Flag vorgesehen, welches einem DTS-ES Decoder signalisiert das ein weiterer Kanal vorhanden ist und so automatisch den ES Modus aktiviert.

Siehe dazu auch das passende Schaubild in (Ref.: Grundlagen – Dolby Digital Surround EX oder DTS-ES) für weitere Informationen.

Auf der DVD wird mit einer Datenrate von bis zu 1536 kbps und seit neuesten durch einen neuen Codec auch mit 768 kbps gearbeitet. Zudem versucht DTS seit einiger Zeit das DTS 96/24 Format am Markt zu etablieren, bei dem mit einer Abtastfrequenz von 96 kHz gearbeitet wird.

Generelle DTS Parameter der DVD-Video sind:

  • Sampling Frequency 48 KHz (neu auch bis 96 kHz)
  • Sampling Size bis zu 24 Bits
  • Bitraten von 64 bis 1536 kpbs (typisch 768 oder 1536 kbps)
  • Kompressionsraten
    • DTS 5.1 bei 768 kbps 6:1 = 83%
    • DTS 5.1 bei 1536 kbps 3:1 = 67%
  • Tonformate (Front/Rear) 1/0, 2/0, 3/0, 2/1, 2/2, 3/2, 3/3
  • Der LFE Kanal kann in allen Kombinationen verwendet werden

Im Kino wird DTS, der Ton wird dort von CDs abgespielt, mit einer Datenrate von 1440 kbps verwendet.