
Eine der am häufigsten verwendeten Softwarelösungen im Bereich der Klangrestaurierung ist iZotope RX, die in drei Versionen mit steigender Leistung erhältlich ist: Elements, Standard und Advanced.
Die Funktionen, für die es bekannt wurde und vor wenigen Wochen sogar Version 11 erreichte, sind wahrscheinlich die Möglichkeit, das Klangspektrum zu zeichnen, zu korrigieren und zu rekonstruieren, fast so, als würden wir Photoshop verwenden (aber der grafische Editor ist in der Elements-Version nicht mehr verfügbar), sowie die Funktionen zur Bereinigung von Stimmen von verschiedenen Arten von Geräuschen, insbesondere mit dem Modul „Dialogue Isolate“, das als Wunder gefeiert wurde und zu einem nahezu unverzichtbaren Werkzeug in vielen Bereichen wurde, einschließlich der Bearbeitung von Live-Aufnahmen für Film und Fernsehen.
Die neueste Version hat die allgemeine Leistung verbessert, den MS-Modus hinzugefügt (zerlegt klassisches LR-Stereo in Mitten- und Seitenkomponenten), einen Loudness Optimizer hinzugefügt, um die wahrgenommene Gesamtlautstärke leicht zu erhöhen, während die gemessene Lautstärke konstant bleibt, und ein Streaming Preview-Modul hinzugefügt, das nützlich ist, um die Qualität mit Diensten wie Spotify, Apple Music, Tidal usw. zu überprüfen, insbesondere in Versionen, die destruktive Kompression verwenden. Auch die ARA-Kompatibilität wurde erweitert und wird sehr bald auch in Pro Tools verfügbar sein, was die Arbeit mit dem Spektrogramm direkt in unseren bevorzugten DAWs ermöglicht.
Es mag aufschlussreich sein, die Funktionsweise des besagten Loudness Optimizers zu analysieren: Wie Sie vielleicht wissen, ist Loudness ein Maß für die vom menschlichen Ohr wahrgenommene Lautstärke, obwohl sie im digitalen Bereich gemessen wird; in der „integrierten“ Version wird ein Durchschnitt über das gesamte Programm gebildet, der eine einzige Endzahl liefert, die im Falle von Fernsehprogrammen, Filmen, Dokumentationen, Live-Übertragungen usw. in Europa einen Wert von -23 LUFS (Loudness Units bezogen auf den digitalen Vollpegel) und in den USA -24 LKFS liefern muss (LUFS und LKFS sind dasselbe, aber die Amerikaner bevorzugen die zweite Bezeichnung, die uns an die vom Algorithmus angewendete K-Gewichtungskurve erinnert). Nun, im Falle der integrierten Loudness wird der Durchschnitt zweimal berechnet: Das erste Mal erhält man einen Wert, unter dem alle Programmteile, die mehr als 10 LU darunter liegen, bei der endgültigen Durchschnittsmessung verworfen werden; praktisch werden die Teile verworfen, die wahrscheinlich keinen Dialog, keine Musik oder keine dominierenden Geräusche enthalten. iZotope hat dieses Verhalten genutzt, um das Signal dieser schwachen Teile leicht anzuheben, damit es stattdessen zur Berechnung des endgültigen Durchschnitts beiträgt und diesen senkt, und wenn er sinkt, muss das Programm ansteigen, um zum gewünschten Wert zurückzukehren. Dies ist ein Trick, der funktioniert, wenn das Programm ausreichend dynamisch ist: Es ist offensichtlich, dass diese Technik nicht genutzt werden kann, wenn der Pegel praktisch konstant ist. Außerdem sollte man es nicht übertreiben: Die Änderung der internen Dynamik eines Films wurde vom Mischtonmeister zusammen mit dem Regisseur, dem Musiker und anderen Mitarbeitern mit Geschmack und Urteilsvermögen entschieden.
Zurück zu iZotope RX11 möchten wir darauf hinweisen, dass das leistungsstarke Dialogue Isolate nun durch das ergänzt wird, was zuvor ein separates Modul zur Reduzierung des Halles im Dialog war, nämlich Dialogue De-reverb, und in der Standard-Version verfügbar ist, ohne dass man mehr als 1000 Euro ausgeben muss.
Weitere sehr interessante Funktionen sind EQ Match, das ausgewähltes Audio so entzerrt, dass es einem Referenz ähnelt, Dialogue Contour, nützlich, um die Sprachintonation zu ändern, z. B. um einen Satz, der behauptend klingt, in eine Frage umzuwandeln, De-rustle, um das Reibungsgeräusch von Lavalier-Mikrofonen an Kleidung zu reduzieren, Spectral Recovery, um die Sprachausdehnung wiederherzustellen, verschiedene Arten von De-click, De-breath zur Kontrolle von Atemgeräuschen und vieles mehr; wir dürfen auch nicht vergessen, dass ein Großteil dieser Funktionen im Batch-Modus ohne Begrenzung der zu verarbeitenden Dateianzahl angewendet werden kann, während man weiterarbeiten kann, ohne dass der Editor im Wartezustand unterbrochen wird; zum Beispiel könnten wir ihn eine Version für CD-Audio und eine in MP3 oder anderen Formaten generieren lassen, ausgehend von hochauflösenden Titeln, die in spezielle Ordner geleitet werden, oder eine Reihe von Standardbehandlungen für die Stimme durchführen, wie einen Hochpassfilter, einen Mouth-Declick, einen sanften De-esser, einen integrierten Loudness-Normalisierer. Es können auch Plug-ins von Drittanbietern im VST3-Format (aber nicht die von Waves) oder Audio Unit angewendet werden!
Für diejenigen, die tiefer eintauchen möchten, empfehlen wir das Buch des CESMA-Dozenten Simone Corelli, der unter anderem Klangrestaurierung am Centro Sperimentale di Cinematografia in Rom unterrichtet, mit dem Titel „Den Klang mit iZotope RX röntgen“ (in der Rezension auf „Audiofader“ erhielt es 9,7 von 10 Punkten und die zweite, hochaktuelle Auflage ist in Arbeit).
Andere leistungsstarke Software zur Stimmrestaurierung sind beispielsweise Waves Clarity Vx, Accentize dxRevive, und einiges ist jetzt in DaVinci Resolve oder Adobe Audition integriert: Künstliche Intelligenz revolutioniert nicht nur den Markt für Fotos und Videos, das ist offensichtlich.
Am CESMA halten wir Augen und Ohren offen für das Phänomen der KI und passen uns dementsprechend an, indem wir beispielsweise dem „konzeptionellen“ Sounddesign mehr Raum geben: Es ist besser zu studieren, warum man einen Klang wählt, als ihn technisch realisieren zu können, da die KI unsere Wünsche sehr gut erfüllen wird, indem sie die mühsamsten und kompliziertesten Teile unserer Arbeit als Experten für Klangkommunikation reduziert oder eliminiert. Eine tiefgreifende Revolution steht uns bevor, und wir möchten, dass unsere Studenten sie als Akteure meistern können. Daher sind unsere Kurse darauf ausgelegt, auf dem neuesten Stand zu sein und Theorie und Praxis in einer anregenden und kollaborativen Lernumgebung zu verbinden.

Die neue grafische Benutzeroberfläche zur Kontrolle von Rauschen und Hall im Dialog in iZotope RX Version 11, am Beispiel eines Dokumentarfilms.

Der Audio-Editor von RX11, wo das Spektrogramm sichtbar und bearbeitbar ist; links die automatische Texttranskription mit Sprecheridentifikation, leider noch nicht sehr zuverlässig und nur für die englische Sprache verfügbar.
Herzliche Grüße von Simone Corelli!