Benvenuti nel nostro blog, dove ogni mese andremo a trattare diversi argomenti relativi al mondo audio e video, se ti interessa approfondire l’argomento iscriviti alla nostra newsletter!

Nell’articolo di questo mese spiegheremo l’Extension .MP4: il formato ideale per lo streaming in rete.

Extension .MP4: il formato ideale per lo streaming in rete!

 

Di Carlo Solarino

Pressoché tutti i file multimediali generati da computer e inoltrati in rete, smartphone inclusi, si attengono al formato Extension .MP4, la cui principale caratteristica è quella di applicare, alla versione originaria, una specifica compressione che ne riduce fortemente il peso e il conseguente bitrate di trasmissione, preservandone tuttavia quasi completamente la qualità dei contenuti.

Questa “Extension” – da intendersi come “stesura”, a cui i dati del file vengono convertiti – trae origine dallo standard di compressione del segnale video in alta definizione pubblicato una ventina di anni fa. 

Siamo infatti appena entrati nel nuovo millennio, quando le esigenze delle trasmissioni in rete, dalle precedenti e sole pagine scritte e immagini fisse, si sta sempre più spostando verso la multimedialità, il cui principale ostacolo è però rappresentato, rispetto ai tradizionali documenti, dal forte “peso” dei relativi file. Una pagina scritta può pesare attorno ai 20 KB e una singola foto attorno ai 500 KB (rispettivamente, 20.000 e 500.000 Byte). Ma un video impone la trasmissione di immagini a cadenza ripetuta di almeno 30 volte al secondo (30 Hz) con il risultato di generare file, per ogni secondo, dal peso attorno ai 15 MB (ovvero, 15.000.000 di Byte). Senza poi entrare nell’alta definizione che richiede pesi almeno quattro volte superiori. 

Che fare dunque per gestire e trasmettere file così pesanti?

Ed ecco le compressioni

Da quanto detto, emerge subito l’importanza delle “compressioni”, intese quali procedure di riduzione del peso dei file, ma dalla capacità di conservare pressoché immutato il livello di qualità dei contenuti originali. Un procedimento esclusivo, in particolare, delle tecnologie digitali che, rispetto alle precedenti analogiche, ne conferma ulteriormente efficacia e validità. E che ha inoltre determinato una altrettanto forte riduzione del bitrate di segnale consentendo – per esempio con riferimento alla rete italiana – alla Rai da passare, dai soli tre programmi nazionale di un tempo, ai ben 15 e oltre attuali; nonché, rivolgendo l’attenzione proprio allo streaming che qui ci interessa, un più agile e veloce traffico in rete. 

Ed eccoci allora nel nuovo millennio e, precisamente, nel 2003, l’anno d’emissione della normativa ISO/IEC 14496-14 (International Standard Organization/International Electrotechnical Commission), che ha stabilito, appunto, le principali regole della compressione. Ma non basta. Questa normativa viene subito accolta e adottata anche dall’ITU (International Telecommunication Union), l’ente che gestisce le comunicazioni tanto via etere (radio e tv) quanto in rete. Più in dettaglio, l’ITU ha pubblicato in merito il – più che noto, per gli addetti ai lavori – documento H.264, che declina la precedente normativa nelle due versioni destinate, rispettivamente, al mondo della televisione, e qui indicata come AVC (Advanced Video Coding), e al mondo della rete e dello streaming, e qui chiamata MP4 (Motion Pictures 4) e sui cui, appunto, ci soffermiamo. Da notare, in particolare, che il prefisso “H”, presente nel documento, va inteso come iniziale di “Hybrid” con riferimento a questo doppio ambiente di applicazione: l’etere, per la televisione, e la rete, per lo streaming.

Quella descritta, dunque, la breve storia che ha portato alla nascita dell’MP4, da intendersi quale norma essenziale per la stesura dei messaggi audio video da inoltrare in rete. Prima di entrare nelle sue caratteristiche, può essere utile precisare che le compressioni audio video rientrano in due precise classi di riferimento: 

La Compressione Lossy, ovvero “a perdita”, tipica dell’audio ma sulle frequenze meno percepite dall’orecchio umano, ovvero su quelle dei gravi (o bassi) e degli acuti (o alti); 

La Compressione Lossless, ovvero “senza perdita”, tipica invece del video. Quest’ultima avviene, in particolare, grazie ad appositi encoder che, in uscita dai terminali d’emissione, eliminano tutte le informazioni ripetitive e ridondanti; e a corrispondenti decoder che, in entrata su quelli di destinazione, le recuperano integralmente. Entrambe operazioni che impongono qualche secondo d’attesa prima delle effettive fruizioni ma che, una volta avviate, rispettano anch’esse il tempo reale. Naturalmente, poi, audio e video restano tra loro perfettamente sincroni.

Gli algoritmi

Ed eccoci, dunque, all’esecuzione delle compressioni basate, soprattutto nel video, su appositi e talvolta complicati procedimenti. Tre, in ogni caso, tali procedimenti facenti capo ad altrettanti precisi algoritmi indicati, rispettivamente, come spaziale, temporale ed entropico.

  • L’algoritmo spaziale provvede, all’interno di ogni singola immagine, a eliminare tutti i pixel ripetitivi. Se quindi un’immagine presenta un’estesa uniformità (per esempio, la parete a tinta unita di una stanza), il relativo segnale riporterà soltanto un numero limitato di pixel, ovvero dei bit ad essi associati, gestiti poi da una serie di comandi di “copia e incolla” in corrispondenza a tutti gli altri pixel identici ai precedenti. Sul totale della compressione, questo algoritmo incide per il 50% circa.
  • L’algoritmo temporale compie qualcosa di analogo, ma su un’intera immagine che si presenti in modo ripetitivo all’interno di una prestabilita sequenza: sequenza che, denominata GOP, Group Of Pictures, viene costruita anch’essa grazie a numerosi “copia e incolla” limitando così ulteriormente il peso dei file. La sua potenzialità è del 30-40% circa.
  • Più evoluto e complesso, infine, è l’algoritmo entropico che, analizzato qualsiasi contenuto da cui si possano eliminare dei dati senza ricadute sulla perdita di qualità, agisce di conseguenza. Per esempio, il segnale relativo a un titolo con lettere chiare su sfondo scuro viene costruito sulla base di due soli livelli (chiaro e scuro, appunto), eliminando tutti i bit richiesti dai valori intermedi, di fatto assenti. La sua portata media, infine, è del 10-20% circa.

Ma vediamo infine l’audio, le cui normative di compressione, sempre con riferimento allo standard H.264, si rifanno allo standard MPEG-1 (Motion Pictures Expert Group) pubblicato già nel 1991, ai tempi di avvio dei primi CD-ROM. In base ad esso, l’audio viene “tagliato” (compressione lossy, lo ricordiamo) sui suoni gravi e acuti, dando origine alle tre compressioni: 

  • MP1, con rapporto sull’originale di 1:4; 
  • MP2, con rapporti 1:6 oppure 1:8; ed 
  • MP3, quello maggiormente usato e non solo nell’MP4, con rapporti di compressione 1:12 oppure 1:14. Capace, così, di far scendere il bitrate di un canale audio originale da 768 Kbps (48 KHz x 16 bit) a soli 50 o 60 Kbps circa. 

E finalmente entriamo in rete

Sommando, dunque, gli effetti delle compressioni video e audio, si ottiene un rapporto di compressione finale stimabile su un valore medio di 1 a 60 circa. Il che significa che un bitrate originale di 891 Mbps, tipico dei video in alta definizione, viene portato a soli 14-15 Mbps. E che il bitrate relativo alla definizione standard scende addirittura vero i 3 Mbps.  Entrambi valori del tutto compatibili con le correnti velocità di rete e senza palesi perdite sulle qualità di fruizione. 

Ed è questo, infatti, il vero valore dell’Extension .MP4, da cui il suo ampio impiego non solo nelle trasmissioni in rete ma anche nella formattazione pressoché di tutti i file multimediali da creare o archiviare sul proprio computer.  

————————–

DIDA: Le tre compressioni video: Spaziale, sui pixel d’immagine; Temporale, sui frame di una sequenza; ed Entropica, con apposite analisi sui contenuti d’immagine.

Questi argomenti, ma in modo ben più approfondito, sono trattati sui due agili manuali dello stesso autore “Saper fare televisione – I volume, La grammatica: immagini, segnali e streaming” e “La post-televisione – Strumenti, piattaforme e regole nell’era del video in rete”, entrambi pubblicati da Dino Audino Editore.