Il formato audio MP3 - Tutto meno che perfetto

Premessa

Questo documento descrive i difetti del formato audio MP3. Si tratta di un formato utilizzato su vastissima scala. Praticamente non c'e' apparecchiatura multimediale che non lo gestisca e non lo sfrutti per generare audio apparentemente di ottima qualita'.
Non e' assolutamente mia intenzione banalizzare il lavoro svolto da tantissimi e bravissimi programmatori che hanno portato a livelli altissimi le possibilita' di utilizzo di audio "a buona qualita'" su una serie diversissima di apparecchiature, utilizzo che, senza il formato MP3 non sarebbe praticamente stato possibile..
Del resto non e' nemmeno accetttabile che un formato audio "poco pulito" venga invece considerato acriticamente "perfetto" solo perche' e' "digitale" (un'associazione troppe volte fatta dal comune utente).

Ogni buon audiofilo (gia' un po' scettico sulla possibilita' che si possa trattare il suono digitalmente con una qualita' decentemente elevata) , trovera' in queste righe forse una conferma ulteriore ai suoi sospetti.
Va precisato che quanto vado a descrivere non e' per nulla sconosciuto a chi ha creato tale formato, ne' si tratta di un difetto "nascosto". Il formato MP3 ha infatti l'obbiettivo di convertire un segnale audio di eccellente qualita' (di grande occupazione fisica in megabytes) in un segnale "accettabilmente simile al segnale originale" (secondo una serie complessa di criteri psicoacustici) ma di occupazione estremamente inferiore (anche piu' di dieci volte inferiore) a quella del formato originale.
Pertanto e' ovvio (ed e' previsto) che il procedimento sia "difettoso". Anzi, intervenendo nel processo di conversione in MP3 su alcuni parametri e' possibile scegliere con estrema precisione il fattore di degrado che si vuole introdurre (piu' spazio si vuole risparmiare piu' il segnale viene degradato e viceversa).
In internet e' presente una enorme quantita' di documentazione sul formato MP3, per cui sicuramente e' possibile approfondire l'argomento con la profondita' necessaria.
Io mi limitero' al minimo indispensabile per la verifica oggetto di questo articolo.
Ovviamente sono disponibile per qualunque approfondimento.

Il caso specifico - un segnale campione

Per cercare di rendere il piu' semplice possibile la comprensione del problema, ho scelto un caso in cui fosse abbastanza facile percepire macroscopicamente le anomalie, tramite una visualizzazione piuttosto impietosa dei difetti: l'esame di un campione di breve durata di un suono campione, di forma d'onda assolutamente "semplice". In questo caso un suono di frequenza fissa pari a 440 cicli al secondo (440 hertz) di forma "pura" (sinusoidale).

Il segnale ha la forma seguente (visualizzo un singolo ciclo per semplicita'):

Ho quindi proceduto prendendo il segnale (un frammento della durata di 10 secondi) e convertendolo in formato MP3 (ho effettuato la prova con piu' convertitori di diversissima costruzione, ottenendo risultati omogenei). I parametri di conversione sono quelli che normalmente si utilizzano per un audio di alta qualita' (l'audio tipico di un film in DVD, per intenderci). Qualita' comunque enormemente superiore al necessario, data la semplicita' del segnale.

Dopo di che' ho catturato un piccolissimo campione di questa coppia di files (l'originale e il convertito) e li ho messi a confronto, semplicemente sovrapponendo le forme d'onda.

Ho ottenuto il seguente grafico (per vedere il grafico a risoluzione piena cliccate qui e ingrandite il piu' possibile la finestra, oppure salvate l'immagine ed apritela con un editor grafico, oppure osservate i due frammenti incriminati riportati piu' sotto):


E' immediatamente visibile che le due forme d'onda (blu, originale e rossa, mp3) hanno differenze significative ed evidentissime. Ne ho evidenziate due, chiamate "Difetto1" e "Difetto 2" che ora vi faccio vedere in dettaglio e con visualizzazione accettabilmente precisa.
Il primo difetto evidenzia uno "sbandamento" nel tempo (ritardo) della parte del solo fronte di discesa della forma d'onda. L'errore e' di 7 pixel orizzontali e di 20 pixel verticali, una percentuale significativa di distorsione. (distorsioni anche impercettibili all'occhio si traducono spesso in effetti audio facilmente udibili).
Non si tratta di un banale errore di slittamento della frequenza complessiva, in quanto poi la curva si rimette in carreggiata, giungendo all'inizio del ciclo successivo perfettamente sincronizzata.


Il secondo difetto, anche questo visibilissimo, riguarda l'altezza del picco della forma d'onda. Altezza che non viene raggiunta con una carenza di 14 punti. Considerato che il campione ha un'altezza della semionda ascendente di 285 punti, si tratta di quasi il 2,5% di errore complessivo, un valore sicuramente consistente.


Naturalmente quello che ad occhio e' evidentissimo ha anche effetti molto significativi sul suono.
Ho quindi elaborato gli spettri audio dei due segnali (originale e convertito MP3) ottenendo i seguenti risultati:

Spettro del segnale audio originale (440hz, durata 10 secondi)

Spettro del segnale audio dopo conversione MP3
(440hz, durata 10 secondi)

Come si vede il secondo grafico (quello del segnale "passato" a MP3) e' molto poco pulito rispetto a quello del suono originale che e' praticamente "puro". La sporcizia alle frequenze "vicine" al segnale e' quella parte che piu' sara' apprezzabile nel risultato audio complessivo.


Conclusioni

Quello che volevo sottolineare (e mi scuso con gli esperti per la banalita' di questo esempio pratico) e' il fatto che il formato MP3 introduce distorsioni e anomalie nel suono originale, anche consistenti, al di la' del fatto che la conversione sia impostata su parametri che dovrebbero garantire una "buona qualita' di conversione" (ed e' cosa nota, lo ribadisco, non c'e' nessun sotterfugio da parte di chi ha creato il formato MP3, anzi).

A suo tempo ho effettuato test ben piu' significativi (forme d'onda complesse, transienti, tracce audio reali, etc) avendo anche lo scrupolo di effettuare vari e piu' significativi esami dei segnali risultanti.
Naturalmente l'ascolto diretto dei risultati e' sicuramente la verifica ultima e significativa, soprattutto per gli audiofili che possono non avere estrema fiducia negli strumenti diversi dall'orecchio.

Come valuti questo documento?

Il documento che hai letto ha scopo didattico/informativo/divulgativo ed e' redatto da professionisti che operano in questo ed in tanti altri settori.

Ci interessa avere un tuo giudizio,
capire quali sono i tuoi interessi e le tue esigenze.

Ogni tua necessita' puo' trovare risposta nei professionisti di Digital Expert. Scrivici!
byartaigiechina