Dopo l'articolo sul suono analogico ecco degli appunti sul suono digitale.

La conversione A-D del suono

Per trattare il suono con apparecchi digitali come i computer o i lettori di CD occorre che il suono, grandezza analogica, sia convertito in numeri: questo è il lavoro del convertitore analogico-digitale che realizza quanto previsto dal metodo di rappresentazione digitale di una variabile analogica definita come PCM (Pulse Code Modulation) (vedi wikipedia)

conversione2

Vedi anche UNITO (prof Rossano Gaeta) e forum Indire.

Detto questo occorre allora fissare la frequenza di campionamento del convertitore che deve essere il doppio della massima frequenza del suono che si vuole registrare (teorema di Shannon-Nyquist) e la gamma di livelli da estrarre dal segnale.

Per la musica viene fissato a 44,1kHz come minimo (nota 1).

In musica si utilizzano almeno due Byte per quantizzare il suono analogico in suono digitale.

In questo modo si dice che una musica digitale è a 16 bit con cui si dispone di circa 65.000 livelli per la quantizzazione del suono (risoluzione).

Vedi wikipedia "audio digitale"

La tecnologia permette di impiegare anche 3 byte per una maggiore risoluzione e campionamenti a velocità superiori.

La quantizzazione del suono analogico comporta sempre una perdita di dettagli ed in definitiva una perdita di qualità.

La perdita di qualità può essere impercettibile al punto da rendere estremamente conveniente digitalizzare un suono visti i vantaggi in termini di manipolazione, memorizzazione e trasmissione effettuata con apparecchiature digitali.

 

Un esercizio numerico

La musica per i CD viene campionata a 44,1kHz con una risoluzione di 16bit (due Byte).

Questo significa che ogni secondo e per ciascuno dei due canali stereo vengono registrati 44.100 * 2 = 88.200 Byte

Per registrare un secondo di musica stereofonica ci vogliono, allora, 166.400 Byte.

Per registrare un'ora (3.600 secondi) di musica stereo occorrono 166.400 * 3.600 = 599.040.000Byte circa 600MB che è proprio la capacità utile di un CD musicale (nota 2). 

 

L'elaborazione digitale del suono

Con il suono in formato digitale é possibile effettuare diverse manipolazioni con software specifici senza più la necessità di disporre di apparecchiature ingombranti, costose e dagli esiti incerti (nota 3).

Oggi si usano software, anche gratuiti, che permettono di effettuare operazioni elementari di "copia, taglia, incolla" e di sovrapposizione di più brani.

Altre funzioni permettono di modificare radicalmente il suono con variazioni di durata, frequenza, normalizzazione (amplificare tutto il brano fino al limite della saturazione (0dB) per ottimizzare il rapporto segnale/rumore), compressione, dissolvenza …

Molto diffuso è il software graturio di Audacity, ma basta scrivere nel motore di ricerca "editing audio gratis" e si trova di sicuro quello che fa al caso proprio.

 

Il formato del suono digitale

Una volta in possesso del formato digitale PCM-based, quello che producono gli ADC, è necessario memorizzare tutti i dati per cui occorre scegliere un formato idenel al trattamento che i vuole fare.

Altrimenti detto un file con un audio in formato grezzo (RAW) può essere troppo grande da memorizzare, trasmettere ...

Decidere in che modo vada memorizzato è quindi un problema tecnico ed economico specialmente se si considera il fatto che si può ridurre la dimensione del file senza che sia possibile accorgersi della manipolazione.

Tre tipi di formato:

- RAW o grezzo, così com'è stato codificato. Vi appartengono i formati AIFF (MacOS) e WAW (Windows).

- lossless sono formati compressi senza perdite. Sono i formati FLAC, ALAC e APE.  Occupano meno spazio (metà) dei formati grezzi e non contengono perdita di qualità.

- lossy sono formati compressi con perdite. Sono i formati più diffusi per la loro dimensione: MP3, WMA, AAC, Ogg Vorbis. Ci sono perdite di qualità che possono essere così modeste da non essere percepite in normali condizioni di utilizzo.

Quando si manipola un file audio è sempre meglio lavorare sul formato AIFF o WAW originario se è disponibile e solo alla fine fare la compressione.

Il file AIFF/WAW ricavato convertendo un file compresso lossy non ha una qualità migliore del file di provenienza: non è mai possibile recuperare perdite di qualità. Quando con una compressione viene effettuata una riduzione dei contenuti perdendo qualità, questi dettagli non sono più recuperabili con un precorso a ritroso (nota 4).

Molte applicazioni per l'editing audio posseggono all'interno convertitori di formato per cui è possibile importare file di un qualunque formato e restituirli con qualunque formato.

Altrimenti si scaricano dal web con la voce "convertitori audio" nel motore di ricerca.

 

La conversione D-A del file

Alla fine bisognerà pur restituire il suono a partire al file digitale.convDAC

I lettori CD, mp3, i PC hanno un apparato elettronico che produce una tensione variabile a partire da un file digitale: è il convertitore Digitale Analogico (DAC) seguito da un filtro e da un amplificatore analogico.

La tensione di uscita può essere il livello Line Level in modo che possa essere utilizzato subito da alcuni tipi di cuffie (accordo) o da amplificatori di tensione (nota 5). 

 

La tensione ricostruita risente delle digitalizzazione in quanto la forma della tensione è a scalini.

In figura si vede la tensione originaria in blu come entra nel ADC e la tensione quantizzata in rosso come esce dal DAC.

saturazione

Si vedono:

- la presenza dei gradini che derivano dalla quantizzazione (la suddivisione in verticale in livelli) e dal campionamento (la suddivisione orizzontale dell'intervallo di campionamento),

- l'effetto della saturazione che "taglia" la parte alta spianando la parte di tensione che oltrepassa il livello massimo quantizzabile (clipping),

- la perdita del dettaglio delle due piccole ondulazioni in basso non "catturate" dal ADC perchè non è stata raggiunta la soglia.

Il filtro serve per "smorzare" gli scalini i quali, però, introducono nel circuito audio componenti di frequenza più elevata della banda passante e comunque di frequenza così alta da non essere percettibili dall'orecchio umano.

 

nota 1: è la frequenza di campionamento usata per i CD musicali.

nota 2: Un CD contiene molti altre informazioni digitali che sono utilizzate per controllare gli errori e permettere al lettore di correggerli.

nota 3: prima dell'avvento dei PC multimediali, la correzione, il montaggio di un brano musicale su nastro o di video su pellicola veniva fatto a casa con le forbici e la colla e nelle sale di produzione con costosissime apparecchiature.

nota 4: in un certo senso, questa regola è una conseguenza del secondo principio della termodinamica.

nota 5: Per cuffie di alta qualità potrebbe essere necessario avere una apposita uscita o un amplificatore per cuffia: