www.iua.upf.es/~sergi/ - sergi.jorda@iua.upf.es
Publicado en Resonancias con permiso del autor - (c) 1997-2003 Sergi
Jordà Puig
1.1. Introducción
Aunque se puede hacer música sin tener demasiados conocimientos
de acústica, parece imposible comprender lo que es el sonido digital
si no se tiene una idea de lo que es el sonido
en general. Por ello, este capítulo describe de forma básica los
aspectos físicos y matemáticos de las ondas sonoras que, junto con
sus consecuencias psicológicas, son la base de toda experiencia
musical. Empecemos pues por el principio.
1.2. ¿Qué
es el sonido?
Lo que entendemos por sonido es fruto de una
compleja interacción entre un objeto vibrante, un medio transmisor
(frecuentemente el aire), el oído, y el cerebro. Para que la vibración
sea audible para un ser humano, este objeto debe oscilar aproximadamente
entre 20 y 20.000 veces por segundo. Al oscilar, el objeto desplaza
el aire que lo rodea, comprimiendo y descomprimiendo periódicamente
las moléculas que lo integran, y modificando por consiguiente la
presión del aire de forma periódica. Dado que las moléculas desplazadas
van empujando a la contiguas, la variación periódica de la presión
se propaga originando lo que recibe el nombre de ondas
sonoras. Cuando las ondas llegan al oído, el cerebro interpreta
estas variaciones de presión como sonido.
Si la presión del aire que circunda el oído se mantiene constante,
no oímos nada, u "oímos el silencio".
La ondas sonoras se propagan
en el espacio, formando invisibles esferas centradas en el objeto
que oscila. Conforme aumenta la distancia al origen y el radio de
estas ondas, aumenta también el volumen y la masa de aire que éstas
deben desplazar, por lo que las oscilaciones se hacen cada vez más
débiles (la presión del aire varía cada vez menos, aunque siga haciéndolo
con la misma frecuencia) hasta que, a una cierta distancia, se tornan
imperceptibles.
Este principio es válido
independientemente del objeto oscilador, que puede ser por ejemplo
una cuerda (guitarras, violines, pianos, cuerdas vocales, etc.),
una columna de aire semicerrada y excitada por una caña o una boquilla
(saxofones, flautas, trompetas, órganos, etc.), una pieza de madera,
metal, piel, piedra, etc. golpeada (percusiones), o un cono de papel
(altavoces). En muchos casos, los objetos que entran en vibración
son en realidad varios, como es el caso de la guitarra (o de la
voz) donde lo que oímos es la suma de las vibraciones de las cuerdas
y de la caja.
Asimismo, cuando estas
ondas encuentran un obstáculo, parte de las moléculas que las componen
son absorbidas por el material, mientras que las restantes son reflejadas.
Este fenómeno origina que en la mayoría de los casos, lo que nos
llega al oído sea una suma del sonido directo combinado con múltiples
reflexiones de este sonido, ligeramente retardadas1.
1.3. Características de los sonidos
musicales
Para describir un sonido musical se utilizan
tres términos: altura, timbre e intensidad. Todo sonido tiene una
duración y, a lo largo de ésta, cualquiera de estos tres parámetros
puede variar (los sonidos naturales jamás son perfectamente estables
o constantes).
1.3.1. La altura
y la frecuencia
La altura está directamente relacionada con
la frecuencia de la oscilación, pero ambos términos no son sinónimos.
De hecho, muchos sonidos (como los percusivos) no tienen una altura
definida. El motivo de esta aparente paradoja es que, mientras la
frecuencia es una propiedad física indisociable de todo aquello
que, como el sonido, vibra u oscila, la altura es una cualidad subjetiva
que percibimos sólo en algunos sonidos2.
Si golpeamos, por ejemplo, un bombo o un platillo, podremos sin
duda afirmar que el platillo suena más agudo que el bombo, pero
no podremos decir si estos sonidos correspondían a un Do o a un
La.
¿Qué es lo que
hace que un sonido posea o no una altura clara? Básicamente, su
periodicidad. Es necesario que un sonido sea aproximadamente periódico,
es decir que su frecuencia de oscilación no varíe (o varíe poco)
dentro de un determinado lapso de tiempo, para que lleguemos a percibir
una altura. En una escala temporal mayor, la frecuencia sí que puede
variar, y en este caso, lo que percibiremos son alturas variables
en el tiempo.
 |
|
Figura 1.1. Variación
de la presión en función del tiempo en un sonido periódico |
En la figura 1.1 se muestra un sonido periódico,
ya que la forma de la onda se repite claramente. La frecuencia de
este sonido vendrá dada por el tiempo que dura este período, ya
que ambas magnitudes son inversas. Si este período durase por ejemplo
una centésima de segundo, su frecuencia sería de 100 Hz3.
1.3.2. La octava y las
notas
Un fenómeno muy importante relacionado con la apreciación de las
alturas, es el de la octava. Si escuchamos dos sonidos cuyas frecuencias
guardan una relación de 2:1 (por ejemplo 400 Hz y 200 Hz), nos sonarán
muy cercanos. El motivo es que entre los dos dista exactamente una
octava.
Dado que cada vez que se dobla la frecuencia se sube
una octava, un sonido de 880 Hz estará dos octavas por encima de
uno de 220 Hz. Esta idea de octava se repite en casi todas las culturas,
a lo largo de la historia. Lo que sí varía enormemente de una cultura
a otra es el número de subdivisiones que se aplican a la octava.
En la música occidental, la octava se divide en doce alturas o semitonos,
de las cuales siete tienen "nombre propio" y corresponden a las
teclas blancas de un piano. Las cinco restantes (que corresponden
a las teclas negras) pueden tomar el nombre de la inmediatamente
anterior, en cuyo caso se les añade el símbolo # (sostenido), o
de bien la posterior, en cuyo caso se les añade el símbolo b (bemol).
De esta forma las doce notas de una octava pueden nombrarse de dos
maneras diferentes ( "do, do#, re, re#,
mi, fa, fa#, sol, sol#, la, la# y
si", o bien "do, reb, re, mib,
mi, fa, solb, sol, lab, la, sib y si").
En la nomenclatura sajona las notas se designan mediante letras
mayúsculas, de acuerdo con la siguiente equivalencia (que conviene
tener presente, dado que, como se verá en la segunda parte de este
libro, los programas MIDI la utilizan profusamente)4.
Do |
Re |
Mi |
Fa |
Sol |
La |
Si |
C |
D |
E |
F |
G |
A |
B |
Conviene indicar que antes de J.S.Bach (siglo XVIII),
la división de la octava se basaba en las teorías del filósofo griego
Pitágoras, según la cual los intervalos formados por cada nota y
la siguiente no eran siempre idénticos. Para simplificar la construcción
de instrumentos, en el siglo XVIII se decidió dividir la octava
en doce partes iguales, por lo que actualmente, la relación de frecuencias
entre cualquier nota y la siguiente es siempre igual a 21/12
(1.05946). De esta forma, al avanzar doce semitonos (una octava),
obtenemos un factor de (21/12)12
que es efectivamente igual a 2.
1.3.3.
El timbre y los armónicos
El timbre podría definirse como el "color" de un sonido,
y es lo que nos ayuda a caracterizar y distinguir diferentes tipos
de instrumentos, o a reconocer a las personas por su voz. Un La
de 440 Hz en una clarinete suena diferente que el mismo La en un
saxo; aunque ambos tienen la misma altura, sus timbres no son iguales.
La figura 1.2, que muestra fragmentos de estos dos sonidos, junto
con un tercer fragmento correspondiente a onda sinusoidal pura de
la misma altura, nos puede ayudar a comprender la naturaleza física
del timbre. En los tres fragmentos, el período es el mismo (pues
tienen la misma altura), pero sus formas son diferentes.
 |
|
Figura 1.2. Fragmentos
de tres sonidos de la misma altura (La de 440 Hz) en un clarinete
(a), un saxofón (b) y una onda sinusoidal pura (c) |
El motivo de esta diferencia de forma, es que las
ondas de los sonidos naturales son más complejas porque vibran con
varias frecuencias simultáneas. En la naturaleza no se encuentran
sonidos puros con una sola frecuencia, como el de la figura 1.2.c;
éstos sólo son obtenibles por medios electrónicos.
En los sonidos naturales, la frecuencia de vibración
más grave es la que determina normalmente el período y la altura,
y se denomina frecuencia base. Las restantes frecuencias, que suelen
ser múltiplos de la frecuencia base
se denominan armónicos,
y cada tipo de instrumento tiene, por su construcción, una serie
diferente de armónicos de amplitudes diferentes, que son los que
definen su timbre y otorgan las "señas de identidad" al instrumento.
Las matemáticas relacionadas con este concepto, fueron
establecidas en el siglo XIX por el físico Jean-Baptiste Fourier,
que descubrió que toda señal periódica, por compleja que esta sea,
puede descomponerse como una suma de señales sinusoidales armónicas,
es decir de frecuencias múltiplos de la original. En la figura 1.3
se muestra la descomposición de una onda periódica (d) en sus varias
ondas sinusoidales simples armónicas, de amplitudes diferentes.
Dicho de otro modo, la señal d es la resultante de sumar de las
señales a, b y c.
 |
|
Figura 1.3. Descomposición
de Fourier de una señal periódica en varias señales sinusoidales |
1.3.4. La intensidad y
los decibelios
Si la altura viene determinada por el número
de oscilaciones por unidad de tiempo, la intensidad depende del
cuadrado de la amplitud de estas oscilaciones, o la diferencia entre
las presiones máxima y mínima que la onda puede alcanzar. La percepción
de la intensidad sonora es, en realidad, un fenómeno auditivo muy
complejo, mucho más que el de la altura, y lo que sigue es una inevitable
simplificación.
Las
intensidades de diferentes sonidos pueden variar, aunque parezca
increíble, en varios millones de ordenes de magnitud (es decir,
el sonido más intenso que podamos oír, lo será varios millones de
veces más, que el más tenue). Por ello, la intensidad se mide en
una escala logarítmica, los decibelios (dB), de acuerdo con la siguiente
fórmula
Nivel
de intensidad en decibelios (dB) = 10 x log10
(amplitud2/amplitud referencia2)
Esta
expresión determina un nivel o diferencia de intensidad entre dos
amplitudes. El origen (0 dB) corresponde al umbral de audición (mínimo
sonido audible). Por debajo de este valor tenemos el auténtico silencio,
aunque en el mundo en que vivimos la experimentación del silencio
se hace francamente difícil, por lo que muchos de nosotros probablemente
no lleguemos a conocer nunca el significado real de esta palabra.
Por encima de los 130 dB se produce una sensación dolorosa. Valores
superiores prolongados llegan a destrozar el tímpano. En la tabla
1.1 siguiente se muestran algunos valores típicos.
Descripción |
Nivel (dB) |
Relación de intensidad |
Despegue de cohete espacial |
190 |
1019 |
Despegue de un reactor |
150 |
1015 |
Umbral de dolor |
130 |
1013 |
Concierto de heavy metal |
120 |
1012
|
Martillazos sobre una plancha
metálica (a 50 cm) |
110 |
1011
|
Tráfico en calle concurrida |
70 |
10.000.000 |
Conversación normal (a 1 m) |
60 |
1.000.000 |
Restaurante concurrido |
50 |
100.000 |
Casa en la ciudad |
40 |
10.000 |
Iglesia vacía |
30 |
1.000 |
Estudio de grabación |
20 |
100 |
Umbral de audición |
0 |
1 |
|
|
Tabla 1.1. Ejemplos de
niveles sonoros en dB. |
He aquí algunas consideraciones adicionales:
- El oído no es normalmente capaz de distinguir
diferencias inferiores a 3 dB.
- La intensidad de un sonido decrece aproximadamente
en 6 dB cada vez que se dobla la distancia.
1.3.5. El rango dinámico
La diferencia entre los valores mínimos y máximos
en dB, que un sistema puede producir se denomina rango
dinámico. En la tabla 1.2 se indican algunos valores típicos.
Clarinete |
86 |
Piano |
94 |
Disco
compacto |
96
|
Trombón |
107 |
Orquesta
sinfónica |
120 |
|
|
Tabla
1.2. Varios ejemplos de rangos dinámicos (en dB). |
En
la mayoría de dispositivos de audio (amplificadores, pletinas de
casete, reproductores de compactos, altavoces, etc.) este valor
figura entre las especificaciones técnicas, como rango dinámico
o relación señal/ruido5.
En un aparato electrónico, el rango dinámico indica la diferencia
entre el nivel máximo que el dispositivo puede emitir, y el nivel
del ruido existente cuando no hay señal (el ruido de fondo). Cuanto
mayor sea esta diferencia, más limpio será el sonido del dispositivo.
En una cadena de varios dispositivos de audio (emisor, amplificador,
altavoces, etc.) el valor real, es decir el máximo rango dinámico
que podremos llegar a apreciar, corresponderá al del dispositivo
con peores características.
En
aparatos de cierta calidad, este valor suele estar comprendido entre
los 80 y los 95 dB. Tal como se indica en la tabla 1.2, en los reproductores
de compactos, y en cualquier otro dispositivo de sonido digital
de 16 bits, este valor no podrá nunca ser superior a 96 dB (en el
próximo capítulo explicaremos la razón), pero incluso pocas veces
se alcanza este máximo teórico, ya que la circuitería analógica
presente en el dispositivo tiende a añadir ruido.
1.4.
El sonido analógico
Hasta la aparición de los ordenadores, el sonido se grababa siempre
de forma analógica. Pero ¿qué significa exactamente este término?
El
término analógico se utiliza
actualmente en contraposición a digital.
Las señales analógicas son funciones de variables continuas (frecuentemente
del voltaje) cuyas evoluciones temporales imitan (son una analogía
de) las señales originales. La representación gráfica de un sonido
grabado analógicamente tendrá aproximadamente la misma forma que
el sonido original, pero la curva indicará variaciones de voltaje,
en lugar de variaciones de presión de aire. Esta nuevas señales
analógicas se obtienen por medio de transductores, término con el
que se designa a todo dispositivo capaz de convertir una magnitud
física en otra.
El
micrófono y los altavoces son los dos transductores básicos utilizados
en la grabación y reproducción del sonido. En primer lugar, el micrófono
convierte la variación de la presión de aire ejercida sobre su membrana,
en una señal de voltaje variable en el tiempo. Este voltaje puede
ser grabado, utilizando diferentes tecnologías, sobre una cinta
magnética o en los surcos de un disco de vinilo. Cuando deseamos
reproducir el sonido, la señal eléctrica generada por el cabezal
de la pletina o la aguja del tocadiscos, es amplificada y enviada
a los altavoces, donde un nuevo transductor la convierte en un campo
magnético capaz de desplazar y de hacer oscilar (con las frecuencias
originales) los conos de papel de los altavoces.
Conviene
resaltar que aunque la grabación se realice digitalmente, tal como
se describe en el próximo capítulo, "Principios
de sonido digital", se seguirán llevando a cabo las transducciones
analógicas en el micrófono y en los altavoces. En la figura 1.4
se esquematizan los dos procesos de grabación alternativos.
 |
|
Figura 1.4. Esquema de
los procesos de grabación analógica y digital |
Al contrario de lo que opina la mayoría, una grabación
analógica no tiene por qué sonar peor que una grabación digital
(en condiciones óptimas, suena de hecho mejor). Sus inconvenientes
radican en que la señal analógica se degrada mucho más rápidamente
(las cintas magnéticas se desmagnetizan, y los surcos en el vinilo
se desgastan), y que en cada nueva generación se produce una pequeña
pero inevitable perdida, de forma que, a cada nueva copia, la señal
se parece cada vez menos a la original.
Por estas razones el sonido digital ha tomado definitivamente
el relevo del analógico. Al margen de la discutible cuestión de
la calidad, en este libro se verá porque el sonido digital aporta
un sinfín de nuevas y excitantes posibilidades en la manipulación,
creación y experimentación sonoras.
[1] El tiempo de estos retardos
será proporcional a la distancia adicional recorrida, teniendo en
cuenta que la velocidad del sonido en el aire, es de aproximadamente
344 m/s.
[2] Por este motivo hemos añadido el epíteto "musicales",
en el título de este apartado. Eso no significa que estos sonidos
sean los únicos válidos para hacer música, y la percusión es un
claro ejemplo de ello.
[3] El Hz o hertzio es la magnitud física que mide
la frecuencia, e indica el número de veces por segundo que se repite
determinado fenómeno.
[4] En el apéndice B se indican las frecuencias de
todas las notas MIDI, y se puede observar como efectivamente, estas
frecuencias se duplican en cada nueva octava.
[5] Aunque ambos términos no son exactamente idénticos,
de momento podemos obviar la diferencia.
[...] Índice
[<<] Capítulo anterior
[>>] Capítulo
siguiente [+] Anexos |