• Schalter wissen.de
  • Schalter wissenschaft
  • Schalter scinexx
  • Schalter scienceblogs
  • Schalter damals
  • Schalter natur
Scinexx-Logo
Logo Fachmedien und Mittelstand
Scinexx-Claim
Facebook-Claim
Google+ Logo
Twitter-Logo
YouTube-Logo
Feedburner Logo
Freitag, 20.10.2017
Hintergrund Farbverlauf Facebook-Leiste Facebook-Leiste Facebook-Leiste
Scinexx-Logo Facebook-Leiste

Neues Audioformat für Telefon und Co.

„Low Delay Advanced Audio Coding“ ermöglicht Echtzeit-Kompression in hoher Klangqualität

Das Audioformat mp3 ist heute bei Musik und Videos längst Standard. Doch für Telefonate und Videokonferenzen war das Kompressionsverfahren bisher zu langsam. Jetzt haben Forscher das Audiocodierverfahren so weiter entwickelt, dass auch Echtzeit-Kommunikation in einer Klangqualität möglich ist, die der direkten Kommunikation sehr nahe kommt – fast so also säßen sich die Gesprächspartner direkt gegenüber.
Marc Gayer, Manfred Lutzky und Markus Schnell gelang es mit Audiocodierverfahren, die Telefonie entscheidend zu verbessern.

Marc Gayer, Manfred Lutzky und Markus Schnell gelang es mit Audiocodierverfahren, die Telefonie entscheidend zu verbessern.

mp3 fürs Telefon: Wer an die Sprachqualität vieler Telefongespräche denkt, hält das für eine gute Idee. Insbesondere Videotelefonate sind so manches Mal unfreiwillig komisch, da durch den Zeitverzug in der Übertragung die Gesprächspartner gleichzeitig anfangen zu sprechen. Grund dafür sind hohe Verzögerungszeiten und die schlechte Qualität, mit der solche Gespräche bislang übertragen werden. Also ging es darum, die Qualität zu verbessern und gleichzeitig die Verzögerungszeit zu minimieren. Die Technologie, die das möglich macht, heißt Low Delay Advanced Audio Coding, kurz AAC-LD. Entwickelt wurde sie von einem Team um Marc Gayer, Manfred Lutzky und Markus Schnell vom Fraunhofer-Institut für Integrierte Schaltungen IIS in Erlangen.

mp3 für Telefon und Videokonferenz gesucht


Das IIS ist bekannt für mp3, das Audiocodierverfahren, mit dem es gelang, die Größe von Musik- oder anderen Audiodateien stark zu reduzieren, ohne den Klang zu verschlechtern. Etwas ähnliches für Telefon und Co. umzusetzen, war allerdings leichter gesagt als getan. „Der Algorithmus benötigt eine gewisse Zeit, um die Daten zu komprimieren und am anderen Ende der Leitung wieder zu dekomprimieren. Dafür braucht das Verfahren Daten, die in der Zukunft liegen. Das kann dazu führen, dass interaktive Kommunikation nur schwer möglich ist“, erklärt Schnell.

Mehrere Jahre lang hat das Forscherteam den Algorithmus immer weiter verbessert, um die Verzögerung, englisch „delay“, zu verkürzen und gleichzeitig die Qualität nicht zu verschlechtern. Der Trick: „Wir haben versucht, diesen Bereich, der in die Zukunft schaut, immer weiter zu minimieren und nur noch die Daten der Gegenwart zu verarbeiten. Das haben wir so lange gemacht, bis ein Optimum aus Qualität und Delay gefunden wurde“, so Schnell.


Sauberer Klang bei nur 15 Millisekunden Verzögerung


Das Ergebnis kann sich hören lassen: Nur noch etwa 15 Millisekunden beträgt die Verzögerung beim Enhanced Low Delay AAC, einer weiter perfektionierten Variante des Advanced Audio Codings. In dieser extrem kurzen Zeit schafft es der Algorithmus, Audiodaten auf weniger als ein Dreißigstel ihres ursprünglichen Umfangs zu reduzieren, ohne gravierende Abstriche in der Klangqualität. Aufgrund seiner enormen Leistungsfähigkeit hat sich das Kodierungsverfahren bereits in vielen Bereichen durchgesetzt, erläutert Marc Gayer: „AAC Low Delay ist heutzutage eigentlich der Standard für viele Videokonferenz-Anlagen. Aber auch im Rundfunk, etwa bei Liveübertragungen im Sport, kommt das Verfahren verstärkt zum Einsatz.“

Neue Technologie auch in iPhone und iPad


Der Vorteil der verbesserten Sprachübertragung kommt beispielsweise auch in Smartphones zum Klingen, etwa dem iPhone4 und im iPad2. Dort wird insbesondere die Telefonie per Bild unterstützt. Eine ganz besondere Anwendung haben die Entwickler für das EU-Projekt TA2 „Together Anywhere, Together Anytime“ – geschaffen. Hier ging es darum, die Kommunikation zwischen sozial nahestehenden Gruppen zu fördern. Entstanden ist ein System, das zum Beispiel gemeinsames Spielen über Städte- oder Ländergrenzen hinweg ermöglicht. „Dank der optimierten Bild- und Tonqualität entsteht der Eindruck, die weit voneinander entfernten Spielpartner säßen sich nicht per Bildschirm, sondern direkt gegenüber“, sagt Manfred Lutzky.

Derzeit arbeiten am IIS über 120 Wissenschaftler und Ingenieure an Audio- und Multimediatechnologien. Stellvertretend für das gesamte Team erhalten Marc Gayer, Manfred Lutzky und Markus Schnell den Joseph-von-Fraunhofer-Preis 2011.
(Fraunhofer-Gesellschaft, 01.06.2011 - NPO)
 
Printer IconShare Icon