<< torna all'indice <<>> paragrafo successivo >>

Tecnologie per la registrazione e riproduzione audio

La natura del suono

Il suono è un fenomeno fisico che percepiamo con l'organo che è deputato a ciò: l'orecchio.

Il suono ha origine dalla vibrazione di un corpo e si propaga come un'onda di pressione in un mezzo.

Il mezzo più comune in cui avviene la propagazione del suono è l'aria, che è un aeriforme, ma i suoni si propagano anche nei liquidi e nei solidi.

A differenza delle radiazioni elettromagnetiche, che si propagano anche nel vuoto, il suono per propagarsi ha bisogno della presenza di materia: nel vuoto non si propaga.

Guardiamo questa animazione cliccando qui (è necessario avere javascript attivo sul proprio browser), e aspettiamo che l'onda si propaghi fino alla parte destra della pagina.

Quella rappresentata nell'animazione è un'onda che si propaga in modo rettilineo, ma le onde sonore possono propagarsi anche in modo sferico, nello spazio, a partire da una sorgente sonora.

Se osserviamo una qualsiasi zona contenuta tra due linee verticali vediamo che, poiché le due linee si avvicinano e si allontanano periodicamente, la zona compresa tra di esse si allarga e si restringe. Ma poiché nel fare questo ogni zona "spinge" e "tira" le zone adiacenti, e il risultato è che ogni zona oltre ad allargasi e restringersi si sposta a destra e sinistra periodicamente.

Se pensiamo alla pagina animata come fatta di aria, vediamo che l'aria contenuta  in una zona si comprime e si rarefa periodicamente, e al tempo stesso possiamo immaginare che le particelle di aria si spostino verso destra e sinistra.

Quella che si vede nell'animazione è pertanto un'onda di pressione: la pressione varia tra un minimo e un massimo, e questa variazione si propaga con una certa velocità di propagazione costante.

La velocità di propagazione non è la velocità con cui oscilla ogni zona di aria! Quest'ultima varia periodicamente da un massimo positivo (quando si muove verso destra) a un massimo negativo (quando si muove verso sinistra).

Quando la velocità dell'oscillazione è massima (a metà dell'oscillazione), anche la pressione è massima (le linee verticali sono vicine), quando la velocità è minima (nel senso che è massima in direzione negativa), anche la pressione è minima (le linee verticali sono lontane).

Quindi l'onda è caratterizzata da una velocità di propagazione, che dipende dal mezzo in cui si propaga. Nell'aria, a 0°C, e alla normale pressione atmosferica, è circa 340 m/s (circa 1˙200 km/h).

La velocità di propagazione in letteratura scientifica è spesso indicata con la lettera c. Qui preferiamo indicarla con il simbolo vc

L'onda è caratterizzata anche da un'ampiezza d'onda, che rappresenta l'entità del fenomeno, e che può essere pensata come la massima variazione di pressione (in più o in meno) rispetto alla normale pressione atmosferica che si ha in assenza di suono, oppure (che è lo stesso) come la differenza tra la pressione massima (o minima) e la normale pressione atmosferica che si ha in assenza di suono. Oppure ancora, che è sempre lo stesso, come la semidifferenza tra la pressione massima e la pressione minima.

Ricordiamo che la normale pressione atmosferica misura 101˙325 Pa (pari a 1,01325 bar,  ossia circa 1 bar).

1 Pa = 1N/m2, ed è ovviamente una pressione piccolissima, se riferita alla normale pressione atmosferica, meno di 1/100˙000.

L'onda è caratterizzata anche da una frequenza, ossia dal numero di oscillazioni che compie nell'unità di tempo. Il numero di oscillazioni compiute in un secondo prende il nome di hertz [Hz].

Quando l'onda arriva al nostro orecchio mette in vibrazione una membrana al suo interno (il timpano), che, attraverso una complessa serie di minuscole ossa mette in vibrazione un liquido (la perilinfa) contenuto in una cavità detta coclea contenente delle terminazioni nervose che inviano il segnale uditivo al cervello (questa è una descrizione anatomica per forza di cose assai semplificata).

Ma non è che tutte le onde di pressione siano suono: per parlare di suono dobbiamo essere in grado di percepirle con il nostro sistema orecchio-cervello.

L'orecchio umano percepisce come suono le frequenze comprese tra circa 16 Hz e 16˙000 Hz (pari a 16 kHz). Al di fuori di questo intervallo si parla di infrasuoni e ultrasuoni. Ma invecchiando si peggiora, e si fa maggior fatica a percepire specialmente i suoni più acuti (oltre a quelli più deboli, e a distinguere più suoni che avvengono contemporaneamente).

Dalla frequenza della vibrazione dipende la sensazione di altezza o registro di un suono:

Dall'ampiezza d'onda (e quindi dalla massima variazione di pressione rispetto pressione atmosferica normale) dipende la sensazione di intensità o forza di un suono:

Oltre a venire trasmessi nei mezzi (gas, liquidi e solidi) i suoni vengono anche riflessi dalle superfici solide. Poiché la velocità nell'aria, pur essendo abbastanza alta, non è infinita, ne deriva che può succedere che quando un suono viene emesso da una sorgente, e poi riflesso da una superficie, potrebbe raggiungere in due o più tempi diversi il nostro orecchio (prima arriva il suono diretto, e poi quello riflesso), da cui il noto fenomeno dell'eco che abbiamo provato tutti facendo una gita in montagna, oppure del riverbero che si può percepire in certi ambienti chiusi (eco e riverbero sono fenomeni analoghi, ma si parla di riverbero quando il tempo di ritorno del suono è inferiore a 1/10 di secondo: i due suoni non si percepiscono più come ben distinti tra loro).

Per cui, poiché la velocità è il rapporto tra lo spazio percorso e il tempo impiegato a percorrerlo, risulterà che un suono prodotto da una sorgente sonora, se che viene riflesso da una parete posta a una distanza d dalla sorgente sonora stessa, poiché dovrà percorrere due volte la distanza stessa (andata e ritorno), avrà un tempo di riverbero (o di eco) tr pari a:

tr = 2·d/vc

dove vc è la velocità di propagazione, pari, nell'aria, a circa 340 m/s

I suoni vengono anche assorbiti da alcuni materiali (si provi a cantare in un appartamento vuoto, prima di avere fatto un trasloco, e poi dopo avere messo mobili, librerie, tendaggi e tappeti, e si ascolti come cambia acusticamente l'ambiente).

Un ambiente che non riflette i suoni viene detto anecoico: si può realizzare rivestendo un ambiente con materiali assorbenti. Un prato senza edifici né ostacoli attorno approssima in una certa misura un ambiente anecoico.



Una camera anecoica per la misurazione delle prestazioni di apparecchiature acustiche (in questo caso di un altoparlante)

Analizziamo ora le più importanti grandezze fisiche che hanno a che fare con lo studio del suono. Premettiamo che, in queste accezioni,  l'aggettivo "sonoro" è sinonimo di "acustico". Per cui i termini pressione sonora e pressione acustica indicano la stessa cosa, così come intensità sonora e intensità acustica, etc.

La pressione sonora (o pressione acustica)

La pressione sonora rappresenta la sovrappressione (rispetto alla normale pressione atmosferica) che raggiunge l'aria in presenza di suono. Poiché nella pratica è in genere un valore assai piccolo, risulta comodo utilizzare come unità di misura il pascal (o i suoi sottomultipli).

Può essere utile conoscere la pressione sonora istantanea (in un certo istante) oppure la pressione sonora media.

In realtà è una media un pò particolare che si chiama media quadratica.

Si può visualizzare con un grafico la variazione della pressione in funzione del tempo, in un certo punto dello spazio:


Nel grafico rappresentato si inizia ad avvertire il suono non appena inizia la perturbazione della normale pressione atmosferica

Si vede dal grafico che la pressione sonora, poiché rappresenta un'alterazione oscillante della normale pressione atmosferica, ha valore che passa con continuità da valori positivi a valori negativi. La forza o intensità di un suono dipende dall'ampiezza media dell'oscillazione della pressione.

Quando invece, per qualche motivo, è necessario riferirsi proprio alla pressione che si ha in un certo preciso istante, è opportuno specificare che si ci si sta riferendo alla pressione sonora istantanea.

L'ampiezza media non è però la media aritmetica: se si facesse la semplice media aritmetica di tale oscillazione, si vedrebbe che questa vale zero, perché si passa da valori positivi a valori opposti negativi (sarebbe come fare la media di +1, -1, +1, -1 ...).

Pertanto la media che si considera è una media particolare che si chiama media quadratica, e che dipende dal valore massimo (e minimo) della pressione sonora ma anche della forma dell'oscillazione.

Quando si parla quindi di ampiezza media dell'oscillazione della pressione sonora, o più semplicemente di pressione sonora media, si sottintende sempre che si sta parlando della sua media quadratica (la trattazione matematica che spiega rigorosamente come arrivare al valore della media quadratica a partire dalla forma del grafico che descrive l'oscillazione è abbastanza complessa e richiede la conoscenza del calcolo integrale, e viene pertanto qui omessa).

È poiché è proprio il valore dell'ampiezza media (quadratica) dell'oscillazione pressione sonora quella che percepiamo come correlata alla sensazione di forza di un suono, in genere, quando si parla di valore della pressione sonora, si sottintende che si sta parlando della sua media quadratica e non del suo valore istantaneo.

La media quadratica viene spesso indicata, nelle applicazioni acustiche (ma anche in altre applicazioni che coinvolgono altre grandezze periodiche), con l'acronimo inglese RMS (che significa "Root Mean Square", e significa proprio "media quadratica"): per esempio il simbolo ps RMS indicherebbe quindi la pressione sonora media (quadratica);

La ampiezza media (quadratica) dell'oscillazione della pressione sonora dipende dall'ampiezza massima e dalla forma del grafico pressione sonora. Si mostrano qui tre semplici forme di grafico della pressione sonora e le relazioni tra ampiezza massima e ampiezza media quadratica. Nei tre esempi i tre suoni registrati hanno tutti è tre la medesima ampiezza massima, ma è facile rendersi conto, anche dall'ascolto, di come l'ampiezza media sia differente, e quindi anche la forza dei tre suoni, poiché ampiezza media e forza del suono sono correlati:

La pressione sonora media è quindi legata alla sensazione di forza o di intensità di un suono, ma attenzione che con il termine "intensità acustica" o "intensità sonora" si intende una grandezza definita in maniera diversa rispetto alla pressione sonora, e che verrà descritta più avanti.

Alcune proprietà importanti della pressione sonora

Intensità sonora (o intensità acustica)

In questa trattazione raramente useremo la nozione di intensità sonora o acustica. Limitiamoci a dire che rappresenta l'energia trasportata da un'onda sonora per ogni unità di superficie. Esiste una relazione tra intensità sonora e intensità: l'intensità sonora è proporzionale al quadrato della pressione sonora. La sua unità di misura è il W/m2.

Soglia uditiva

Per soglia uditiva si intende il suono più debole che riusciamo a percepire, che per convenzione è fissato come un suono che ha una pressione sonora di 20 µPa


20 µPa =  20 micropascal = 20·10-6 Pa = 20/1˙000˙000 Pa = 1/50˙000 Pa =  0,00002 Pa = 20 milionesimi di Pa.

Ovviamente tale soglia non è uguale per tutti, ma è presa come convenzione. Solo per avere un'idea si può pensare come corrispondente al suono prodotto da una zanzara a 1 metro di distanza (qualcuno dice a 3 metri di distanza, ma evidentemente non tutte le zanzare fanno lo stesso rumore!)

Il livello di pressione sonora (o livello di pressione acustico)

Spessissimo la pressione sonora si indica attraverso il valore del livello di pressione sonora, un po' impropriamente a volte indicato semplicemente come livello sonoro, o anche solo livello (del suono, o del rumore).

È questo il modo più comune di indicare la pressione acustica e si misura in decibel [dB]

Il livello è legato (biunivocamente) alla pressione sonora media (quadratica) dalla seguente relazione:

Ls = 20 · log (p/p0)

dove:

Se pertanto abbiamo un suono con una pressione sonora pari, ad esempio, a 40 Pa, il livello sonoro varrà Ls = 126 dB

essendo: Ls = 20 · log [40 Pa/(20µPa)] = 20 · log [40 Pa/(20·10-6 Pa)] = 20 · log [40 Pa/(20·10-6 Pa)] =  20 · log [2 ·106)] =

= 20 · 6,3 dB = 126 dB

(che è un suono bello forte, più o meno come a un concerto di heavy-metal proprio davanti alle casse).

Un suono avente la stessa intensità della soglia uditiva ha livello pari a 0 dB.

Si osservi che si avesse un suono (inudibile, o quasi) inferiore alla soglia uditiva, il suo livello sonoro (espresso in dB) sarebbe un valore negativo.

Pressione sonora e livello sonoro sono dunque due diversi modi di indicare la stessa cosa: nota una è possibile calcolare l'altra.

La relazione inversa è:

p = p0 ·10Ls/20

Questo apparentemente strano modo di indicare la pressione sonora attraverso il concetto il livello sonoro risulta in realtà spesso utile e comodo, e ha delle proprietà importanti, alcune delle quali si ricavano da quelle viste nel paragrafo "alcune proprietà importanti sulla pressione sonora", applicando le proprietà dei logaritmi, e che è bene memorizzare.

Alcune  importanti proprietà del livello di pressione sonora

Non si faccia l'errore di sommare e sottrarre i livelli sonori senza tenere conto del fatto che derivano da relazioni logaritmiche. Pertanto:

Una serie di suoni con livello sonoro decrescente di 6 dB in 6 dB (quindi con pressione sonora che ogni volta è dimezzata):

Può essere comoda la seguente tabella (i cui valori sono stati arrotondati):

pressione sonora
livello sonoro
20 µPa
0 dB
40 µPa
6 dB
80 µPa
12 dB
... ...
125 mPa
76 dB
250 mPa
82 dB
500mPa
88 dB
1 Pa 94dB
1,25 Pa
96 dB
... ...
1 bar = 100˙000 Pa  194 dB

Qui si può effettuare automaticamente la conversione:

pressione sonora RMS=

 

Ed ecco una tabella, del tutto indicativa, di alcuni tipici livelli sonori:

suono: livello sonoro:
soglia uditiva 0 dB
stanza silenziosa 40 dB
conversazione normale (a distanza di conversazione) 60 dB
automobile a 5 m di distanza 80 dB
aspirapolvere a 1 metro di distanza 90 dB
concerto heavy metal davanti alle casse 126 dB
soglia del dolore 130 dB
aereo al decollo a 200 metri di distanza 140 dB
massima intensità di un tono non distorto 194 dB

Rumore, e suono. Suoni determinati e indeterminati

Da un punto di vista fisico non c'è alcuna differenza tra il significato di suono o rumore, ma al termine rumore si dà a volte il significato di suono non desiderato.

Il dizionario Treccani definisce il rumore come: "Qualsiasi perturbazione sonora che, emergendo dal silenzio (o anche da altri suoni), dia luogo a una sensazione acustica [...] è quindi sinonimo di suono, ma si usa soprattutto per suoni soggettivamente giudicati non musicali o che comunque riescano sgradevoli, fastidiosi, molesti, o addirittura dannosi".

In campo musicale si parla anche di suoni determinati e di suoni indeterminati, ma anche questa classificazione è assai sfumata:

Ma vediamo di analizzare il suono emesso da uno strumento.

Le note

Abbiamo visto che la frequenza del suono è legato alla sensazione di altezza.

Tutti conoscono la successione delle note musicali: DO, RE, MI, FA, SOL, LA, SI (nei paesi anglosassoni: C, D, E, F, G, A, B).

Il LA centrale dalla tastiera di un pianoforte, ha una frequenza fondamentale di 440 Hz. È un suono che ha la stessa frequenza di quello emesso da un normale diapason, strumento utilizzato come riferimento per accordare gli strumenti musicali.

Zephyris at the English language Wikipedia / CC BY-SA (http://creativecommons.org/licenses/by-sa/3.0/)
Un diapason accordato a 440Hz. Accorciando i due rami della forcella la frequenza aumenta: il suono emesso diventa più acuto.

Si parla di frequenza fondamentale perché ad esso sono sovrapposti dei suoni più deboli di frequenza più alta: gli armonici, di cui parleremo più avanti.

Ogni volta che la frequenza fondamentale di un suono raddoppia si dice che il suono sale di un intervallo di un'ottava, ogni volta che si dimezza la frequenza il suono scende di un ottava.

Ogni volta che si sale di un ottava il "nome" della nota rimane lo stesso: suoni con una frequenza di 880 Hz, o di 220 Hz sono sempre dei LA.


Tre suoni di frequenza rispettivamente 220 Hz, 440 Hz, 880 Hz: sono tutti e tre dei LA


La posizione delle note nella tastiera del pianoforte; in giallo sono contrassegnati i DO (a sinistra dei due tasti neri vicini); in rosso è contrassegnato il LA centrale dalla frequenza di 440 Hz.

I tasti bianchi corrispondono alle note DO, RE, MI, FA, SOL, LA, SI, ma si vede che tra alcuni tasti bianchi sono presenti dei tasti neri che corrispondono alle note cosiddette alterate o accidentate. Una nota emessa da un tasto nero può indicarsi con il simbolo # (diesis) dopo al nome della nota che la precede, oppure con il simbolo ♭ (bemolle) dopo al nome della nota che la segue). Un LA# è pertanto equivalente a un SI♭. Si vede che tra i SI e i DO e tra i MI e i FA non c'è alcun tasto nero.

La successione che le comprende tutte può indicarsi: DO, DO#, RE, MI♭, MI, FA, FA#, SOL, SOL#, LA, SI♭, SI: sono quindi 12 note diverse, che costituiscono la scala cromatica, alla base del sistema musicale più comune.

Spostandosi tra due note adiacenti, indifferentemente se si stratta di tasti bianchi o neri (ad esempio da un DO a un DO#, oppure da un MI a un FA), si sale di un semitono.

Il rapporto tra le frequenze di due suoni posti alla distanza di un semitono è sempre la radice dodicesima di 2 = 12√2 = 21/12 ≈ 1,059...

Questo avviene nel cosiddetto "sistema temperato", reso pressoché universale, nella musica occidentale, da Johann Sebastian Bach con la raccolta di composizioni "Il clavicembalo ben temperato", il cui primo libro venne pubblicato nel 1722.

I primi due preludi e fughe in DO maggiore e in DO minore, del primo libro del clavicembalo ben temperato eseguito da Glenn Gould al pianoforte

Gli armonici

Il suono emesso da uno strumento a suono determinato ha una frequenza fondamentale riconoscibile, ed è fatto di tanti armonici sovrapposti, ossia è una combinazione di tante vibrazioni con una particolare forma sinusoidale, le cui frequenze stanno in rapporto intero con la frequenza fondamentale. In pratica può essere scomposto nei suoi armonici.

Ad esempio, il LA centrale del pianoforte ha la frequenza fondamentale di 440 Hz, ma contiene anche un suono di minore intensità con frequenza doppia (880 Hz, che è sempre un LA), un suono di intensità ancora inferiore con frequenza tripla (440 x 3 = 1320 Hz, che è un MI), un suono ancora meno intenso con frequenza quadrupla (440 x 4 = 1760 Hz, che è ancora un LA, un suono ancora meno intenso con frequenza quintupla (440 x 5 = 2200 Hz, che è assai prossimo a un DO#), e così via.

Il rapporto tra le intensità dei vari armonici è uno degli elemento che caratterizza il timbro, ossia la "voce" caratteristica, di ciascuno strumento.

Si parla pertanto di suono fondamentale, o primo armonico (il primo LA), secondo armonico, terzo armonico e così via.

Il suono qui sotto rappresentato ha una frequenza di 264 Hz (è circa un DO):

e suonerà così:


Può essere scomposto nei suoi armonici (qui sono rappresentati i primi 8):


Le loro frequenze sono pari a:

che eseguiti in successione suoneranno così:



Il timbro di uno strumento, ossia la caratteristica del suono per cui distinguiamo, ad esempio, una tromba da un flauto, dipende dai rapporti delle intensità dei diversi armonici, ma anche come varia l'intensità durante l'emissione: una nota emessa con una tromba potrà durare finché il trombettista avrà fiato...

un FA# di tromba (frequenza fondamentale circa 366 Hz)

La visualizzazione di un frammento del suono precedente: non è una sinusoide, ma si individua una periodicità, anche se il suono, muovendosi lungo l'asse temporale cambia leggermente: non è sempre identico a se stesso. Ma è un suono reale, non sintetico, e si può sentire il vibrato eseguito dal musicista


...una nota emessa con un pianoforte ha invece un decadimento:

un SOL (frequenza fondamentale 392 hZ) ripetuto tre volte al pianoforte.

la visualizzazione del suono precedente, si vede il decadimento delle tre note

Un suono fatto di frequenze che non stanno in rapporti interi tra loro viene considerato discordante, e potrebbe, al nostro orecchio, risultare sgradevole, più che altro per una questione culturale: la musica occidentale ha per secoli cercato di evitare la discordanza, favorendo i rapporti tra note che hanno frequenze che stanno in rapporti che sono numeri quasi interi. Altre culture musciali sono invece del tutto a loro agio con quelle che sono altrimenti considerate discordanze.

un suono fatto di due frequenze in rapporto √2, quindi un rapporto non intero ma irrazionale: è il cosiddetto "tritono", nel medioevo chiamato "diabolus in musica": lo sono, ad esempio, un FA e un SI.


la visualizzazione del suono precedente: non si individua alcuna periodicità della vibrazione

Il rumore bianco è un suono formato da moltissime frequenze sovrapposte casualmente. Non si può parlare certo di armonici:

un rumore bianco

e la sua visualizzazione; 

Un rumore di pioggia intensa assomiglia invece al cosiddetto "rumore rosa", un rumore fatto di frequenze casuali sovrapposte con livello sonoro decrescente al crescere della frequenza.

Temporale con grandine a Milano il 3 maggio 2019




Sitografia:

http://www.maurograziani.org/

http://www.sengpielaudio.com/ (una parte però è solo in tedesco: usate il traduttore se non conoscete il tedesco)

Uno strumento utile e gratuito: Audacity (applicazione molto completa per la registrazione e il trattamento dei suoni, per Windows, Mac OS, Linux): https://www.audacityteam.org/




<< torna all'indice << >> paragrafo successivo >>



Livio Colombo
Alcuni diritti riservati:
Licenza Creative Commons
Quest'opera è distribuita con Licenza Creative Commons Attribuzione - Non commerciale - Non opere derivate 3.0 Italia.