
Cesma ist immer auf der Höhe der Zeit und versucht, wenn möglich, ihr voraus zu sein.
Vor einigen Jahren haben wir eine Produktionserfahrung mit Virtual-Reality-Inhalten realisiert, indem wir eine 360-Grad-Kamera und das Ambisonics-Mikrofon von Sennheiser verwendet haben. Das Ergebnis war dann auf einem Oculus GO zu sehen, und wir haben es auch auf der Internationalen Musikmesse in Mailand 2019 unseren zukünftigen Studenten und Studentinnen zum Ausprobieren angeboten.
Die Aufnahmen wurden mit Blick auf einen hypothetischen Besuch unseres Hauptsitzes in Bioggio realisiert, beginnend im Inneren eines Zuges, dem Aussteigen an einem nahegelegenen Bahnhof, dem Einsteigen in ein Auto und der Ankunft auf dem Parkplatz, dem Aussteigen aus dem Auto und dem Betreten der Klassenzimmer.
Die erweiterte Realität
Diese Art von Aufnahmen wird dank des Impulses verschiedener Hersteller von Augmented- und Virtual-Reality-Headsets, wie Apple mit seinem Vision Pro, immer häufiger werden, da diese in der Lage sind, stereoskopische Aufnahmen zu machen, ebenso wie die neuesten und leistungsstärksten iPhones und die brandneue Blackmagic Design Ursa Cine Immersive 8K-Kamera mit einer beeindruckenden Auflösung von 8160 x 7200 Pixeln pro Auge auf einem Sichtfeld von satten 180 Grad.
Seitdem es in den USA erhältlich ist, haben wir das Apple Vision Pro vorab getestet, das zwar teuer und etwas unbequem ist, uns aber einen bemerkenswerten Blick in die Zukunft ermöglicht, indem wir hochwertige stereoskopische VR-Produkte wie Konzerte, Sportveranstaltungen und vor allem den Kurzfilm Submerged, der in einem U-Boot spielt, testen. Sehr wahrscheinlich ist dies die Zukunft des audiovisuellen Bereichs.
Das Ambisonics-Audio
Um auf unser Experiment von vor über 5 Jahren zurückzukommen, ist es vielleicht interessant zu erklären, wie die Ambisonics-Mikrofonaufnahme funktioniert: Theoretisch sollten mehrere zusammenfallende (oder fast zusammenfallende, angesichts der Undurchdringlichkeit von Körpern!) Kapseln kombiniert werden, von denen eine mit „omnidirektionaler“ Empfindlichkeit (nimmt in alle Richtungen gleich auf) und drei mit „Achterform“ (nimmt vorne und hinten, aber nicht seitlich auf), die auf drei orthogonalen Achsen, x, y, z, ausgerichtet sind. Mathematisch ermöglicht die Kombination dieser 4 Komponenten in verschiedenen Proportionen den Aufbau einer beliebigen Anzahl virtueller Mikrofone, normalerweise direktional „Niere“ (nimmt hauptsächlich vorne auf), die in jede beliebige Richtung zeigen, auch nach der Aufnahme. Wir weisen jedoch darauf hin, dass die Nierenempfindlichkeit nicht besonders selektiv ist, da Geräusche, die sogar um 90 Grad außerhalb der Achse kommen, nur um 6 dB gedämpft werden, so dass die „Übersprechung“ (d. h. die Überlagerung der Signale) zwischen den virtuellen Mikrofonen nicht vernachlässigbar ist. Durch die Verwendung komplexerer Ambisonics-Mikrofone, so genannter zweiter oder dritter Ordnung, ist es beispielsweise möglich, die Selektivität zu erhöhen und die virtuellen Mikrofone sehr gut zu fokussieren, wodurch Quellen, die sich nicht auf ihrer Achse befinden, gedämpft werden.
Die Kombination der vier Ambisonics-Komponenten erster Ordnung ist mathematisch und damit auch rechentechnisch sehr einfach, so dass sie sich gut für eine Echtzeitwiedergabe eignet, die auf die Richtung reagiert, in die der Benutzer eines Virtual-Reality-Headsets von Moment zu Moment blickt, sowohl auf der horizontalen als auch auf der vertikalen Achse.
Um das Bild zu vervollständigen, sei gesagt, dass anstelle der 4 genannten Kapseln in der Regel 4 Nierenkapseln verwendet werden, die mathematisch völlig gleichwertig sind und es ermöglichen, die 4 gewünschten Signale zu erhalten, die für die Erzeugung der virtuellen Signale nützlich sind. Die 4 Signale, die von den 4 um 120 Grad zueinander abgewinkelten Nieren kommen, liegen in einem Ambisonics-Format vor, das als A-Format bezeichnet wird, während ihre Umwandlung in eine omnidirektionale Kapsel und 3 orthogonale Achterkapseln als B-Format bezeichnet wird.
Diese Art von Mikrofon ist sehr praktisch, da es auf sehr kleinem Raum, wie einem einfachen Monomikrofon, den gesamten Schallbereich erfassen und beispielsweise ein 5.1, ein 7.1 oder sogar ein Dolby Atmos extrahieren kann, wie wir ihn in der Regie des Cesma haben; unser Dozent Simone Corelli hat es beispielsweise für den Umgebungsklang einer Atmos-Produktion des Requiems von Verdi mit der Accademia di Santa Cecilia in Rom im Jahr 2024 verwendet.
Die neuesten tragbaren Recorder mit mindestens 4 Mikrofoneingängen bieten in der Regel die Möglichkeit, Ambisonics beim Abhören oder bei der Aufnahme zu dekodieren, was ein Zeichen für die wachsende Wertschätzung dieser Technologie ist, zu der Michael Gerzon (den Nutzern der Plugins von Waves bestens bekannt) in den siebziger Jahren einen grundlegenden Beitrag geleistet hat. Wir laden Sie ein, diesen Artikel zu lesen, um mehr zu erfahren.
oder den vierten Absatz des technischen Anhangs von „Dialoghi, Musica, Effetti: il Suono nell’Audiovisivo“, einem der gewaltigen Bücher, die wir unseren Studenten zur Verfügung stellen. Es gibt auch ein großartiges Video, das wir Ihnen empfehlen.
Unsere Studenten verfügen über modernste Werkzeuge und werden ermutigt, diese zu nutzen und ihren Einsatz zu erproben, bevor sie sich in der Arbeitswelt „outen“, wo es dagegen wichtig ist, klare Vorstellungen zu haben und nicht zu viel zu riskieren. Am Cesma lernt man, „spielt“ mit Audio und Video und entwickelt die Kompetenzen, um langfristig zwei Stufen höher zu sein als die Konkurrenz.