| |
Entwicklungsgeschichte und frühere
Standards
H.261 ist ein Standard, der für Videostreams
im Bereich von Videokonferenzen und Videotelefon-Anwendungen geschaffen
wurde. Es gibt dabei zwei unterschiedliche Typen von Frames: I-Frames (auch
key-frame) sind vom Typ her dem JPG sehr ähnlich, und sind immer gefolgt
von drei P(pseudo-differences)-Frames, die den Unterschied zum vorherigen
Bild darstellen. Ein VideoStream nach diesem Standard ist eine Abfolge
aus immer einem Referenzbild und jeweils drei folgenden 'Bildern', in denen
jeweils nur Veränderungen zum vorangegangen Referenzbild vermerkt
werden.
Für den MPEG-1 Standard, der zur Kodierung von Audio-
und Videostreams konzipiert wurde, hat man diesen Mechanismus erweitert.
Ein Nachteil von H.261 war, daß die drei P-Frames immer auf den vorangegangen
I-Frame referenzieren konnten, was aber nicht sinnvoll ist, um flüssige
stufenlose Animation zu ermöglichen. Aus diesem Grunde hat man hier
einen dritten Frame spezifiziert, den B-Frame, der auch die Referenzierung
von Frames erlaubt, die vor (zeitlich in der Zukunft des streams) dem Betrachtungszeitraum
liegen. Dadurch konnte die Bildqualität eines komprimierten Videostreams
deutlich gesteigert werden, ohne die Bitrate erheblich anheben zu müssen.
In MPEG-2 kam dann die Möglichkeit hinzu, Zusatzinformation
zu Streams zu speichern. Desweiteren sollte der Standard auch in der Filmindustrie
Fuß fassen. MPEG-3 gab es nur eine kurze Zeit. Der Standard sollte
insbesondere für Anwendungen im Bereich des HDTV (1920 x 1080) verwendet
werden, ist am Ende der Entwicklung in MPEG-2 aufgegangen.
Die Arbeiten an MPEG-1 wurden bereits 1992 abgeschlossen.
Er setzt sich aus fünf Bestandteilen zusammen (System, Video, Audio,
Compliance Testing, Software Simulation) wobei die ersten drei abgeschlossen
und als Layer 1-3 bezeichnet werden.
MPEG-2 besteht im Vergleich dazu aus neun Teilen (System,
Video, Audio, Compliance Testing, Software Simulation, System Extensions,
Audio NBC, Video Extensions, Realtime Interface Specification, Conformance
Extensions) wovon die ersten drei seit 1994 als standardisiert gelten.
MPEG-4
MPEG-4 hat folgende Zielsetzungen:
-
Repräsentation visueller und audiophiler Inhalte, welche
natürlichen Ursprungs (wie Kameraaufzeichnungen oder Tonaufnahmen)
wie auch synthetischer Herkunft sein können,
-
Es existiert ein Sprache zur Komposition dieser Medienobjekte,
die man dann audiovisuelle Szenen nennt.
-
Ein weiterer Mechanismus ist das De/Multiplexen von Daten/-Strömen,
was den Transport und dessen Qualität sichern soll.
-
Es ist möglich, über MPEG-4 mit der audiovisuellen
Szene zu interagieren, d.h. es wird möglich sein, Objekte in einer
Szene zu plazieren, gruppieren, transformieren, ihre Attribute zu modifizieren,
sowie den Betrachtungsstandort des Benutzers variabel zu halten.
Abgesehen von den Standardobjekten herkömmlicher
Kompressionsverfahren wie Bilder, Video und Audio, Text und Grafiken, wird
es in MPEG-4 auch 3D-Daten geben, beispielsweise sprechende Köpfe,
oder aber auch Sound, der synthetisch vom Computer generiert wird, und
auch noch verändert werden kann.
Der MPEG-4 Standard wurde von der MPEG-Gruppe in Etappen festgelegt.
Die erste Version wurde im Oktober 1999 festgeschrieben. Die Arbeit am Standard
ging seither weiter, so daß im Dezember 1999 die Version 2 fixiert wurde.
Neue Erweiterungen, vor allem in den Bereichen Visual und System sind bis heute
in Entwicklung.
Um die Rückwärtskompatibilität zu MPEG-4 v1 zu
gewährleisten, erweitert die Version 2 die Funktionalität mittels
neuer bzw. erweiterter Profile.
|
| |
|
|