Seminario de Audio Instituto de Ingenier´ıa El´ectrica IIE, Facultad de Ingenier´ıa - UDELAR. Montevideo - Uruguay http://iie.fing.edu.uy/investigacion/grupos/gmm/audio/seminario/gmm@fing.edu.uy
Conceptos b´ asicos de la Psicoac´ ustica Documento anexo
Ing. Andr´es Rodr´ıguez
Agosto - Diciembre 2005
Abstract En este documento se desrciben y desarrollan brevemente los conceptos b´asicos que esta relacionados con la percepci´on del sonido. Con este objetivo es que se expondr´an los resultados de diversos experimentos psicoac´ usticos que aparecen en la literatura de cabecera. El documento comienza definiendo que es la psicoac´ ustica, que objetivos tiene y cuales son lo m´etodos y procedimientos que utiliza para obtener resultados, para luego dar paso a los principales conceptos de ls psicoac´ ustica.
2
´Indice general 1. Introducci´ on
5
1.1. Introducci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
1.2. Psicoac´ ustica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
1.3. M´etodos de medidas y consideraciones especiales . . . . . . . . . . . . . . . . . . . . . . .
6
2. Conceptos b´ asicos de la Psicoac´ ustica
8
2.1. Umbrales de la audici´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
2.1.1. Umbrales absolutos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
2.1.2. Umbrales diferenciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.2. Enmascaramiento sonoro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.2.1. Enmascaramiento simult´aneo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.2.2. Enmascaramiento no simult´aneo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Pre-enmascaramiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Post-enmascaramiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.3. Bandas cr´ıticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.3.1. Filtros de bandas cr´ıticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.3.2. Escala de bandas cr´ıticas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 2.3.3. Banda cr´ıtica y membrana basilar. . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.4. Sonoridad o Loudness . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 2.4.1. Curvas de igual sonoridad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.4.2. Filtros de ponderaci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 3
2.4.3. Escala de sonoridad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.4.4. Sonoridad para sonidos compuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 2.5. Efectos temporales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 2.5.1. Resoluci´on temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 Interrupciones de un sonido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 Variaciones de la se˜ nal en el tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . 35 Umbrales diferenciales de duraci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4
Cap´ıtulo 1
Introducci´ on 1.1.
Introducci´ on
Los seres humanos poseemos la capacidad para detectar sonidos que se encuentran en un determinado rango de amplitudes y frecuencias. Es por ello que se define el rango din´amico de nuestra audici´on como la relaci´on entre la m´axima potencia sonora que nuestro sistema auditivo es capaz de manejar y la m´ınima potencia que es necesaria para detectar un sonido. El rango de amplitudes o presiones sonoras es de unos 150 dB, que tiene una correspondencia directa con el desplazamiento de la membrana basilar. Se a comprobado que para presiones cercanas al umbral de audibilidad los desplazamientos son inferiores a 10−10 m1 . En cuanto a el rango de frecuencias que se maneja tradicionalmente estos van desde los 20 Hz hasta los 20 kHz, rango que var´ıa de un sujeto a otro, que se ve afectado por el envejecimiento y pude ser variado por trastornos auditivos como exposici´on prolongada a sonidos de elevada intensidad. Un punto muy importante que exploraremos a lo largo de este documento es que; la sensibilidad de nuestro sistema auditivo no es independiente de la frecuencia, por el contrario vemos que dos sonidos de igual presi´on sonora son capaces de provocar diferente sensaci´on dependiendo de su contenido espectral.
1.2.
Psicoac´ ustica
La psicoac´ ustica esta comprendida dentro de la psicof´ısica, ´area de la ciencia que estudia la relaci´on existente entre el est´ımulo de naturaleza f´ısico y la respuesta de car´acter psicol´ogico que el est´ımulo f´ısico provoca. En otras palabras estudia la interconexi´on entre las propiedades f´ısicas del sonido y la interpretaci´on que el ser humano hace de estas propiedades2 . En cuanto a los objetivos de la psicoac´ ustica son; 1. Caracterizar la respuesta de nuestro sistema auditivo. 2. Obtener el umbral absoluto de la sensaci´on. 1 Tal maravillosa y sorprendente sensibilidad se cree que se debe a los mecanismos activos y no lineales del sistema auditivo 2 En
las primeras etapas de estudiaba casi exclusivamente el comportamiento del sistema auditivo perif´ erico.
5
3. Obtener el umbral diferencial de determinados par´ametros de los est´ımulos, estos umbrales son la m´ınima variaci´on y m´ınima diferencia perceptibles. 4. Comprender y obtener la capacidad de resoluci´on del sistema auditivo para separar est´ımulos simult´aneos, o para conjugar est´ımulos separados para crear sensaciones. 5. Entender la variaci´on temporal de la sensaci´on del est´ımulo. Como vemos la psicoac´ ustica debe dise˜ nar experimentos a efectos de recolectar valores y escalas que puedan reflejar las propiedades del sistema auditivo. Sin embargo esta no es la u ´nica tarea, adem´as de la interpretaci´on de los resultados, la otra rama de estudio comprende el dise˜ no de modelos que permitan explicar los resultados obtenidos experimentalmente. En este documneto no se tratar´a el tema de modelado, sino que se expondr´an algunos resultados de experimentos de la psicoac´ ustica.
1.3.
M´ etodos de medidas y consideraciones especiales
En psicoac´ ustica, el dise˜ no de los experimentos y las condiciones en la que se deben realizar de modo de obtener resultados v´alidos, es un tema muy delicado, ya que como bien es sabido, todas los resultados derivados pueden ser cuestionados si el dise˜ no del experimento no ha contemplado los diversas variables que pueden influir sobre los resultados. Cuando nuestro organismo reacciona a un tipo de est´ımulo, este reacciona con una intensidad que depende en forma muy compleja de la intensidad propia del est´ımulo. Es posible entonces realizar experimentos para medir la sensaci´on ante determinados est´ımulos por medio del informe directo de alg´ un sujeto, incluso ante la existencia de efectos de subjetividad. La forma de separar estos efectos es en general, utilizando t´ecnicas estad´ısticas, sometiendo las variables involucradas a un estricto control. Los resultados suelen ser v´alidos s´olo en determinado contexto sociogeogr´afico. Existen m´etodos est´andares para la obtenci´on de mediciones, entre estos m´etodos se encuentran: M´etodo de ajuste. En este tipo de metodolog´ıa el sujeto bajo experimentaci´on tiene el control sobre el est´ımulo que se le provoca. M´etodo de seguimiento o tracking. Al igual que el m´etdo de ajuste el sujeto tiene control sobre el est´ımulo, pero reducido a la direcci´on en el cual var´ıa el est´ımulo3 . M´etodo de estimaci´on de magnitud. Esta metodolog´ıa consiste en asignar n´ umeros a la magnitud de los est´ımulos que son percibidos en alguna de las dimensiones posibles. M´etodo binario o m´etodo S´ı - No. Este procedimiento consiste en hacer que el sujeto bajo experimentaci´on decida si una cierta se˜ nal esta o no esta presente. Como se puede apreciar este procedimiento es de elecci´on forzada, M´etodo por elecci´on forzada de dos intervalos. Es parecido al m´etodo anterior con la diferencia que al sujeto se le presentan dos intervalos y debe decidir si la se˜ nal ocurre en el primero o el segundo intervalo. M´etodo adaptable. Con esta metodolog´ıa el investigador es quien decide la serie de est´ımulos, quien basado en las respuestas le presenta diferentes est´ımulos al sujeto bajo estudio. 3 En
la literatura se le puede encontrar como “Seguimiento de B´ ek´ esy”
6
Por u ´ltimo esta el m´etodo de comparaci´on de pares de est´ımulos. Este m´etodo consiste en presentar un par de est´ımulos que tienen diferencias en un dimensi´on y otro par de est´ımulos que tiene diferencias en otra dimensi´on diferentes al primer par. A partir de estos pares de est´ımulos el sujeto bajo estudio debe decidir como es la diferencia que percibe en el primer par con respecto a la percibida por el segundo par, es decir, mayor, menor o igual.
7
Cap´ıtulo 2
Conceptos b´ asicos de la Psicoac´ ustica 2.1.
Umbrales de la audici´ on
Un caracter´ıstica muy importante de nuestro sistema auditivo son los umbrales de la audici´on. Por lo general son f´aciles de medir y corresponden al m´ınimo nivel que un determinado est´ımulo debe tener para provocar una reacci´on en el sujeto bajo ensayo. B´asicamente existen dos tipos diferentes de umbrales, estos son; El umbral absoluto. El umbral diferencial. Es importante precisar que ambos tipos de umbrales no son valores perfectamente determinados, ya que primero; diferentes m´etodos de determinaci´on pueden determinar diferentes valores, y segundo, el mismo m´etodo pude arrojar diferentes valores para diferentes sujetos.
2.1.1.
Umbrales absolutos.
Los umbrales absolutos de la audici´on son aquellos valores de uno de los par´ametros del est´ımulo f´ısico a partir del cual la sensaci´on comienza a o deja de producirse. M´as precisamente, este umbral determina la m´ınima intensidad que un determinado est´ımulo para el cual en un 50 % de las veces los sujetos han confirmado la presencia del est´ımulo. La medici´on de estos umbrales es una tarea que requiere especificar las condiciones para las cuales se determinar´ a el umbral. Ejemplos de las condiciones pueden ser; intensidad del sonido, tipo de recinto, etc. En general para determinar estos umbrales se utilizan dos variantes del m´etodo S´ı - No: el m´etodo
8
de los m´ınimos cambios1 y de est´ımulos constantes2 Dentro de este tipo de umbral esta el umbral auditivo, el cual est´a definido por el valor m´ınimo o la presi´on m´ınima para que un sonido pueda ser percibido. Las primeras curvas de umbrales de audibilidad fueron determinadas por Fletcher y Munson, quienes hab´ıan definido al umbral como la m´ınima presi´on necesaria para percibir un tono puro de 1 kHz. Ellos determinaron este valor en 2 · 10−5 N/m2 ´o 1 · 10−12 W/m2 , valor que fue tomado como referencia, es decir 0 dB para 1 kHz. Sin embargo posteriores determinaciones realizadas por Robinson y Dadson, arrojaron nuevas curvas que demostraron que si se mantiene el valor de referencia en 2 · 10−5 N/m2 ´o 1 · 10−12 W/m2 , el valor del umbral es de 3 dB para 1 kHz. El umbral de audibilidad no depende s´olo de la intensidad o presi´on, sino que tambi´en es dependiente de la frecuencia del sonido senoidal de prueba. La forma de medir este tipo de umbrales se por medio de las siguientes t´ecnicas; 1. M´ınima presi´on audible, MAP. Consiste en medir colocando peque˜ nos micr´ofonos dentro del canal auditivo, y los est´ımulos son enviados por medio de auriculares. 2. M´ınimo campo audible, MAF. Este tipo de medici´on se realiza en ausencia del sujeto, en c´amaras anec´ocias, colocando un micr´ofono en el centro mismo donde se encontraba la cabeza del sujeto bajo estudio. En ambos m´etodos se utilizan para la medici´on tonos puros con duraciones temporales de m´as de 200 ms, el cual es detectado por el 50 % de un poblaci´on j´oven3 y audiol´ogicamente normales. Es importante recordar nuevamente que estas curvas representan una medida estad´ıstica asociada con la probabilidad de detecci´on de un tono de determinada frecuencia y amplitud, por lo que tienen que ser utilizadas con mucho cuidado. A la izquierda de la figura 2.1 podemos observar las curvas correspondientes a los umbrales de audibilidad mediadas por el m´etodo MAP y MAF. Las diferencias fundamentales entre una curva y otra se presentan en la zona comprendida entre 1, 5 kHz y los 6 kHz y son consecuencia de las resonancias producidas por el pabell´on auditivo y el canal auditivo4 . Las diferencias entre los niveles de presi´on sonora en el t´ımpano y en campo libre se pueden apreciar en la curva presentada a la derecha de la figura 2.1. Una posible descomposici´on de las partes que componen las curvas de audibilidad se creen que son causadas por; 1. La atenuaci´on introducida por la respuesta en frecuencia del o´ıdo externo y el o´ıdo medio, por encima de 1 kHz. 2. Un patr´on de enmascaramiento debido a ruidos corporales de baja frecuencia, como por ejemplo los debidos a los latidos card´ıacos, el movimiento de los m´ usculos, sonidos siempre presentes, y posibles responsables del incremento del umbral de audibilidad hacia las bajas frecuencias. 1 Consiste en acercarse gradualmente de manera ascendente hasta que el sujeto exprese que el est´ ımulo est´ a presente, y luego descendentemente bajando hasta que el sujeto indique que el est´ımulo no est´ a presente. Finalmente de promedian los valores que el sujeto ha declarado. 2 Consiste en estimular al sujeto bajo estudio con intensidades constantes alrededor de un probable umbral, los cuales se repiten aleatoriamente. El umbral es determinado con el valor que el sujeto indique como presente un 50 % de las oportunidades. 3 De
entre 18 y 25 a˜ nos de edad.
4 Se
ha comprobado que el o´ıdo externo aumenta la presi´ on sonora en el t´ımpano en unos 15 dB para frecuencias en el rango de frecuencias comprendidas entre 1, 5 kHz y 6 kHz, por lo cual se concluye que la transmisi´ on del o´ıdo medio es m´ as eficiente para frecuencias medias.
9
Figura 2.1: A la izquierda; umbrales de audibilidad medidas por el m´etodo MAP y MAF. A la derecha; diferencia entre los niveles de presi´on sonora en el t´ımpano y en el campo libre.
3. Ruido neural, debido a la descargas de los receptores auditivos. Como indicamos anteriormente por lo general el rango de frecuencias que nuestro sistema auditivo es capaz de detectar esta comprendido entre 20 Hz y 20 kHz, que se pude denominar tambi´en umbral de frecuencia de la audici´on5 . El proceso natural de envejecimiento hace que este umbral, especialmente el superior, dependa muy fuertemente de la edad, esto es consecuencia del deterioro de las c´elulas ciliadas del ´organo de Corti, lo que tiene como consecuencia que cada vez percibamos menos las frecuencias agudas. Un gr´afico muy ilustrativo de los par´ametros en juego del o´ıdo, rango din´amico, respuesta en frecuencia y sensibilidad en funci´on de la frecuencia se presenta en la figura 2.2.
´ Figura 2.2: Areas de la audici´on. El trazo superior de la figura 2.2 determina la frontera para el dolor, frontera que define las presiones sonoras m´aximas al cual nuestro o´ıdo puede ser sometido sin presentar da˜ nos. Por debajo de este trazo 5 En
alguna literatura pueden encontrarse el rango de valores que va desde 16 Hz hasta 16 kHz.
10
se encuentra la frontera que determina el l´ımite de riesgo de da˜ nos, ´osea determina los niveles m´aximos para los cuales no se debe someter al o´ıdo por per´ıodos prolongados ya que pueden producir la p´erdida permanente de sensibilidad. A´ un m´as abajo, encontramos el umbral de audibilidad, que representa la sensibilidad de nuestro sistema auditivo, es decir, el valor m´ınimo de presi´on sonora que debe tener un sonido para que seamos capaces de percibirlo.
2.1.2.
Umbrales diferenciales
Los umbrales diferenciales de la audici´on se˜ nalan las m´ınimas variaciones de uno de los par´ametros del est´ımulo f´ısico, necesarias para que se produzca un cambio en la sensaci´on. M´as precisamente es la m´ınima intensidad con que un est´ımulo debe exceder a otro para que el sujeto los reconozca como diferentes en un 50 % de las pruebas. Para la determinaci´on del umbral diferencial pueden utilizarse el m´etodo de los m´ınimos cambios o el de est´ımulos constantes, o bien el m´etodo del error promedio6 Otra clasificaci´on de los m´etodos para la medici´on de los umbrales pueden ser la siguiente; 1. Umbrales de m´ınima variaci´on perceptible, MVP. Estos se miden variando uno de los par´ametros de un sonido, por ejemplo, mediante modulaci´on de amplitud o de frecuencia. 2. Umbrales de m´ınima diferencia perceptible, MDP. Estos umbrales son obtenidos presentando dos se˜ nales diferentes al sujeto bajo estudio. Los umbrales pueden ser umbrales diferenciales de intensidad o umbrales diferenciales de frecuencia. En las figuras 2.3, 2.4, y 2.5 podemos observar curvas t´ıpicas de umbrales diferenciales para diferentes casos.
Figura 2.3: En la figura izquierda; umbral de m´ınima variaci´on perceptible de intensidad, para una frecuencia de modulaci´on de 4 Hz, para un sonido senoidal de 1 kHz y para ruido blanco, en funci´on del nivel de presi´on sonora del sonido de prueba. A la derecha, umbral de m´ınima variaci´on perceptible para un sonido senoidal de 1 kHz y ruido blanco en funci´on de la frecuencia de modulaci´on. Es interesante notar que la curva a la izquierda de la figura 2.5 nos muestra que el umbral de m´ınima variaci´on es aproximadamente constante hasta los 500 Hz, a partir de all´ı el umbral aumenta con una pendiente aproximada de 0, 007 · f 7 . En cuanto a la figura restante hace evidente que nuestro sistema 6 Este m´ etodo es una variante del m´ etodo de ajuste, es particular el sujeto bajo estudio controla la intensidad del est´ımulo y lo ajusta hasta hacerlo “igual” a la de un est´ımulo fijo, entonces se define el error promedio cometido como el umbral diferencial. 7 Lo
que implica que podemos percibir variaciones del 0,7 % de la frecuencia.
11
Figura 2.4: Izquierda, umbral de m´ınima diferencia perceptible para un sonido senoidal con una frecuencia de 1 kHz en funci´on de su nivel de presi´on sonora. A la derecha, umbrales de m´ınima diferencia perceptible para diferentes frecuencias, representativas de las distintas frecuencias, en funci´on del nivel de presi´on sonora del sonido de prueba.
Figura 2.5: A la izquierda, podemos apreciar el umbral de m´ınima variaci´on perceptible en funci´on de la frecuencia del sonido senoidal de prueba y a la derecha, umbral de m´ınima diferencia perceptible en Hz en funci´on de la frecuencia del sonido senoidal de prueba.
auditivo puede percibir diferencias de frecuencias de casi 1 Hz hasta los 500 Hz, a parir de la cual la curva crece con una pendiente aproximadamente de 0, 002 · f .
2.2.
Enmascaramiento sonoro
El enmascaramiento es parte de los fen´omenos estudiados en psicoac´ ustica que busca determinar como la presencia de un sonido afecta la percepci´on de otro sonido. El enmascaramiento sonoro pude ser definido como un proceso en el cual el umbral de audibilidad correspondiente a un sonido se eleva, debido a la presencia de otro sonido. Entonces hablamos de enmascaramiento cuando un sonido impide la percepci´on de otro sonido, es decir, lo enmascara. Podemos apreciar este fen´omeno cuando dos personas conversan y el sonido urbano impide que una escuche total o parcialmente lo que esta diciendo la otra. Algunos investigadores creen que el enmascaramiento tiene su origen en los receptores auditivos situados 12
en la membrana basilar, c´elulas ciliadas. Con esta concepci´on, se produce enmascaramiento cuando las c´elulas ciliadas internas que se encuentran estimuladas por una se˜ nal deben recibir un nuevo nivel de estimulaci´on debido a que otra se˜ nal, enmascarante, tal que la diferencia entre la estimulaci´on conjunta supera la estimulaci´on de la primera se˜ nal. B´asicamente existen dos tipos de enmascaramiento, ver figura 2.6: 1. Enmascaramiento simult´aneo, donde el sonido de prueba y el enmascarador coinciden temporalmente. 2. Enmascaramiento no simult´aneo, contrariamente al caso anterior, el sonido de prueba puede ser anterior, pre-enmascaramiento, o posterior, post-enmascaramiento, al enmascarador.
Figura 2.6: Diagrama esquematico para ilustrar las regiones en donde se presentan los diferentes efectos de enmascaramiento. Una magnitud muy u ´til para medir la magnitud del enmascaramiento, es el umbral de enmascaramiento, definido como “el nivel de presi´on sonora de un sonido de prueba necesario para que ´este sea apenas audible en presencia de una se˜ nal enmascarante”. De esta definici´on es que resulta naturalmente que los umbrales de audibilidad y enmascaramiento deben ser id´enticos en ausencia de se˜ nales enmascarantes. Si graficamos el umbral de enmascaramiento en funci´on de la frecuencia obtenemos el patr´on de enmascaramiento. En las siguientes secciones profundizaremos las diversas caracter´ısticas que tiene los dos tipos de enmascaramiento. Quedando claro en esta introducci´on que el enmascaramiento depende del nivel de presi´on de las se˜ nales “enmascarante” y “enmascarada”, as´ı como de la separaci´on en frecuencia y en tiempo entre las mismas.
2.2.1.
Enmascaramiento simult´ aneo
Este tipo de enmascaramiento se presenta cuando el sonido de prueba y el sonido enmascarnate coinciden temporalmente. Aqu´ı se mostrar´a la dependencia que existen en el enmascaramiento simult´aneo con el con el contenido espectral de la se˜ nal enmascarante y con su nivel de presi´on sonora. Comenzaremos estudiando el caso del enmascaramiento de tonos puros por ruido de banda ancha. De las experiencias realizadas por Zwicker (Zwicker & Fastl, 1999) es que se obtienen las gr´aficas de la figura 2.7, en donde se puede apreciar el patr´on de enmascaramiento de un tono puro enmascarado por ruido blanco de banda ancha8 . La l´ınea punteada representa el umbral de audibilidad. De la figura concluimos que, el patr´on de enmascaramiento del ruido blanco es aproximadamente constante hasta los 500 Hz, a partir de esta frecuencia el patr´on se curva con una pendiente de 10 dB por 8 El ruido blanco tiene una densidad espectral independiente de la frecuencia. Cuando hablamos de ruido blanco de banda ancha nos referiremos al rango que va de los 20 Hz a los 20 kHz. Es importante mencionar que en ocasiones se utiliza ruido rosado, el cual tiene una distribuci´ on pareja de la energ´ıa en cada una de las octavas o m´ as com´ unmente, el ruido de enmascaramiento uniforme que es obtenido al modificar el ruido blanco en funci´ on de la curva de enmascaramiento.
13
Figura 2.7: Patr´on de enmascaramiento para un tono puro enmascarado por ruido blanco de banda ancha.
d´ecada. En cuanto a la dependencia con la frecuencia que tiene el umbral de audibilidad desaparece cuando se enmascara con ruido blanco de banda ancha, y a pesar que la intensidad de la se˜ nal enmascarante se encuentra distribuida uniformemente en frecuencia9 , resulta m´as f´acil enmascarar, con ruido blanco, un tono de alta frecuencia que uno de baja frecuencia. Ya veremos en las siguientes secciones que la inflexi´on en 500 Hz es consecuencia de la no uniformidad de la resoluci´on en frecuencia del sistema auditivo y la dependencia con la frecuencia de las propiedades de la membrana basilar. Otros caracter´ısticas del enmascaramiento se pueden observar cuando enmascaramos tonos puros por ruido de banda angosto, esto es ruido con un ancho de banda igual o menor al ancho de banda cr´ıtico, concepto que veremos m´as adelante. En la figura 2.8 se puede observar el umbral de tonos puros enmascarados por ruidos de banda angosta con frecuencias centrales 250 Hz 1 Hz y 4 kHz, con ruido cuya intensidad es de 60 dB. La forma de las curvas alrededor de la frecuencia central son similares para 1 kHz y 4 kHz, pero no para para el ruido centrado en 250 Hz pero tiene en com´ un pendientes superiores e inferiores de cada banda de ruido de m´as de 200 dB/octava. Otro aspecto importante del patr´on de enmascaramiento anterior es que el efecto de enmascaramiento se extiende por fuera del intervalo de frecuencias en el cual esta confinada la se˜ nal enmascarante, extendi´endose m´as hacia las frecuencias mayores que a las menores. Tambi´en puede observarse que el nivel del umbral disminuye a medida que aumenta la frecuencia: -2 dB para 250 Hz, - 3 dB para 1 kHz y -5 dB para 4 kHz. Una forma de observar como es la dependencia de patr´on de enmascaramiento con el nivel de la se˜ nal es enmascarando un tono con ruido de banda angosto con frecuencia central de 1 kHz y intensidad variable. El resultado de esta experiencia se muestra en la curva de la izquierda de la figura 2.9, en la cual se ve claramente que el valor m´aximo del umbral de enmascaramiento depende de la intensidad de la se˜ nal enmascarante, y siempre esta 3 dB por debajo del nivel del ruido. En cuanto a las pendientes de las curvas estas son muy pronunciadas para frecuencias por debajo de la frecuencia central del ruido, y por el contrario para frecuencias mayores la pendiente se hace menos pronunciada a medida que se aumenta la intensidad del ruido. Este u ´ltimo fen´omeno parese estar relacionado con el mecanismo de realimentaci´on a cargo de las c´elulas ciliares externas, ya que un tono o un ruido de banda estrecha de gran intensidad provoca la saturaci´on de las c´elulas, con el consiguiente descenso de la selectividad en la frecuencia de la membrana basilar, y con esto la excitaci´on neural se distribuye en una zona m´as amplia de la membrana; por le contrario, 9 Ya
que se trata de ruido blanco.
14
Figura 2.8: Curvas umbrales para tonos puros enmascarados por ruidos de banda angosta con frecuencias centrales 250 Hz 1 Hz y 4 kHz
Figura 2.9:
cuando la se˜ nal es de baja intensidad la excitaci´on se concentra en un intervalo m´as peque˜ no. La acci´on pasa bajos que tiene la membrana basilar hace que las pendientes hacia las bajas frecuencias permanecen casi constantes. Esto se debe a que la se˜ nal se aten´ ua r´apidamente una vez que sobrepasa la zona de la membrana en la cual produce la m´axima vibraci´on y se acerca al helicotrema, por lo que el nivel de actividad neural provocado por dicha se˜ nal es bajo y, en consecuencia, el umbral de enmascaramiento es menor, en otras palabras, es m´as dif´ıcil que el ruido pueda enmascarar a un tono de menor frecuencia. Un tipo diferente de patr´on de enmascaramiento se obtiene cuando la se˜ nal enmascarante es un tono puro o un sonido complejo. El primer caso, patr´on de enmascaramiento de un tono enmascarado por otro de 1 kHz para diferentes niveles de intensidad, se observa en la curva situada a la derecha de la figura 2.9. La obtenci´on de este patr´on es una tarea muy complicada ya que se presentan dos grandes problemas; el primero, es que cuando el sonido de prueba y el tono a enmascarar tienen frecuencias cercanas se producen batimientos, con la consecuente percepci´on de fluctuaciones en la amplitud; el segundo es que para algunas frecuencias se hace perceptible el sonido de combinaci´on; al generarse tonos no existentes a partir de la combinaci´on de otros. Al utilizar un sonido arm´onico complejo como enmascarador se obtiene patrones como el que se observa en la figura 2.10, en esta, el complejo consiste en un tono de 200 Hz y 9 parciales, todos con igual amplitud y fases escogidas aleatoriamente10 . 10 Si las fases fueran iguales se producir´ ıa una envolvente din´ amica que podr´ıa tener consecuencias adicionales en la determinaci´ on del patr´ on de enmascaramiento.
15
Figura 2.10:
Como vimos a lo largo de esta secci´on los patrones de enmascaramiento se superponen con el umbral de audibilidad. La relaci´on entre el umbral de audibilidad y el umbral de enmascaramiento es muy estrecha ya que el umbral de audibilidad puede considerarse como un umbral de enmascaramiento.
2.2.2.
Enmascaramiento no simult´ aneo
El enmascaramiento no simult´aneo es aquel que se produce cuando el sonido de prueba no se superpone temporalmente con el sonido enmascarador, ver figura 2.6, distingui´endose entonces dos tipos de enmascaramiento no simult´aneo; Pre-enmascaramiento, donde el sonido de prueba es anterior al sonido enmascarador. Post-enmascaramiento, en donde el sonido de prueba es posterior al sonido enmascarador.
Pre-enmascaramiento El pre-enmascaramiento es un fen´omeno completamente perturbante ya que en una primera instancia implicar´ıa que nuestro sistema auditivo es no causal. En otras palabras sonidos que a´ un no existen pueden enmascarar sonidos ya existentes, algo dif´ıcil de imaginar. Sin embargo, un estudio m´as minucioso permite justificar la existencia del pre-enmascaramiento. Para ello tenemos que recordar que cualquier sensaci´on, y en este caso la sensaci´on sonora no se produce instant´aneamente, sino que se requiere de un cierto tiempo para que se origine11 . Es as´ı que estudios han revelado que las se˜ nales de gran intensidad requieren de un tiempo de formaci´on de la sensaci´on menor que el de las se˜ nales de baja intensidad. Esto u ´ltimo quiere decir que si luego de una se˜ nal de baja intensidad, se presenta una de gran intensidad, la sensaci´on asociada a la primera pude ser enmascarada. El fen´omeno de pre-enmascaramiento depender´ıa de la relaci´on de tiempo entre el sonido de prueba y el sonido emascarante. La comprensi´on que se tiene del pre-enmascaramiento es muy vaga , ya que los resultados experimentales obtenidos s´olo son reproducibles con sujetos altamente entrenados, y en muchos casos no permiten concluir con certeza acerca de sus propiedades. 11 De hecho, un est´ ımulo sonoro debe tener una duraci´ on m´ınima para que se genere impulsos en las terminaciones nerviosas del ´ organo de Corti.
16
No obstante, se sabe que este fen´omeno se extiende hasta unos 20 ms antes de la aparici´on de la se˜ nal enmascarante, independientemente del nivel de ´esta.
Post-enmascaramiento El post-enmascaramiento, por el contrario, es un efecto f´acil de medir aun en sujetos no entrenados. Por regla general, se determina experimentalmente mediante se˜ nales de prueba de corta duraci´on, aplicadas luego de una se˜ nal enmascarante de duraci´on variable. El efecto de post-enmascaramiento existe durante un intervalo m´aximo de unos 200 ms despu´es de la desaparici´on de la se˜ nal enmascarante present´andose tambi´en para sonidos de prueba de unas pocas centenas de ms. En la figura 2.11 se observa el comportamiento del umbral de enmascaramiento en funci´on del retardo entre el instante en que desaparece la se˜ nal enmascarante y el instante en que desaparece la se˜ nal de prueba, y de la intensidad de la se˜ nal enmascarante.
Figura 2.11: Umbral de enmascaramiento en funci´on del retardo entre el instante en que desaparece la se˜ nal enmascarante y el instante en que desaparece la se˜ nal de prueba, y de la intensidad de la se˜ nal enmascarante. En este caso la se˜ nal de prueba es un impulso de presi´on de forma “gaussiana” de 20 ms de duraci´on y la se˜ nal enmascarante es ruido blanco de 500 ms. Se puede observar que durante los primeros 5 ms despu´es de que se apaga el enmascarador pr´acticamente no se produce ninguna diferencia con respecto al enmascaramiento simult´aneo, pero luego de esos 5 ms el umbral de enmascaramiento decrece hasta igualarse con el umbral de audibilidad aproximadamente a los 200 ms. La duraci´on de la se˜ nal enmascaradora influye notoriamente sobre el enmascaramiento, en general el efecto de una se˜ nal enmascarante de corta duraci´on decae m´as r´apidamente que el de una se˜ nal de larga duraci´on. En la figura 2.12 se muestra el post-enmascaramiento producido en funci´on de la duraci´on del sonido enmascarador. Otra dependencia que presenta el post-enmascaramiento es con el contenido especral de las se˜ nales de prueba y enmascaradora, diversos experimentos han permitido concluir que la cantidad de postenmascaramiento es mayor en las bajas frecuencias que en las altas. Una diferencia importante con el enmascaramiento simult´aneo, es que en el post-enmascaramiento el incremento en el nivel de presi´on sonora de la se˜ nal enmascarante no produce un incremento igual en la cantidad de enmascaramiento. Las causas de este enmascaramiento se creen que tiene or´ıgenes fisiol´ogicos distintos. Pueden asociarse a el efecto en duraciones menores a 20 ms, a las propiedades mec´anicas de la membrana basilar que hacen que esta vibre durante un tiempo luego de la desaparici´on del est´ımulo sonoro. Por otro lado para
17
Figura 2.12: Post-enmascaramiento producido en funci´on de la duraci´on del sonido enmascarador. Las curvas representan el enmascaramiento para sonidos enmascaradores de 200 ms y de 5 ms de duraci´on, en tanto que para se˜ nales de m´as de 200 ms no se observa ninguna alteraci´on en la tasa de decaimiento.
duraciones mayores se cree que los causante son los efectos de adaptaci´on12 neural.
2.3.
Bandas cr´ıticas
El concepto de banda cr´ıtica permite explicar por qu´e, dado un tono de una cierta frecuencia, una ruido de ancho de banda angosto centrada en dicha frecuencia produce la misma cantidad de enmascaramiento sobre el tono que un ruido de gran ancho de banda, incluso cuando el nivel de densidad espectral de ambos ruidos sea igual y, por ende, la energ´ıa del ruido de banda estrecha sea menor. En la secci´on 2.2 vimos que el enmascaramiento de tonos puros por parte de ruido de banda angosta hacia referencia a un ancho de banda particular, llamado ancho de banda cr´ıtico. Estas bandas emergen de la regi´on del espectro de un ruido que enmascara efectivamente un sonido compuesto por un tono puro. El ancho de banda cr´ıtico es un concepto desarrollado por Fletcher , que puede interpretarse como una medida de la selectividad en frecuencia de nuestro sistema auditivo. Sin embargo el concepto moderno de banda cr´ıtica fue desarrollado por Zwicker (Zwicker & Fastl, 1999), en el contexto de la suma de sonoridades13 o intensidades subjetivas. Para lograr una primera compresi´on de cual es el significado de las bandas cr´ıticas nos ayudaremos de las gr´aficas de la figura 2.13. En la primera de ellas, a la izquierda, el tono no ser´a enmascarado por el ruido de banda angosta ya que este esta fuera de la banda cr´ıtica, motivo por el cual el umbral de emascaramiento del tono seguir´a siendo el mismo que si el ruido no existiera e independientemente del nivel sonoro del ruido. En la segunda figura, a la derecha, contrariamente a la primera, tenemos al tono enmascarado por el ruido, el cual esta centrado en la frecuencia del tono. En este caso el umbral de enmascaramiento se ver´a afectado y aumentar´a en funci´on del aumento del ancho de banda del ruido, sin embargo existe un punto a partir el cual el aumento del ancho de banda del ruido no cambiar´a el umbral de enmascaramiento del tono, siendo este ancho de banda el ancho de banda cr´ıtico. 12 La adaptaci´ on auditiva tiene que ver con la disminuci´ on de la respuesta del sistema ante un est´ımulo de car´ acter estacionario. Por ejemplo, es un hecho que la sonoridad de un sonido estacionario disminuye a medida que transcurre el tiempo, incluso dej´ andose de percibir el est´ımulo. La adaptaci´ on parece producirse reducidamente para sonidos con niveles de presi´ on altos, entre 50 dBSP L y 90 dBSP L , y aparece m´ as claramente en sonidos de altas frecuencias. No obstante, existen diferencias significativas en los resultados obtenidos en los experimentos con diversos sujetos, como para extraer conclusiones definitivas. 13 Concepto
que se desarrollar´ a m´ as adelante
18
ȱ Ç
ȱ Ç
Figura 2.13:
Mientras que el umbral diferencial representa la capacidad del sistema auditivo de detectar la m´ınima variaci´on en una sola frecuencia, la banda cr´ıtica determina la capacidad de resoluci´on del o´ıdo para dos, o m´as, frecuencias simult´aneas. Es as´ı que se define la banda cr´ıtica como, aquel intervalo de frecuencias que representa la m´axima resoluci´on en frecuencia del sistema auditivo en diferentes experimentos psicoac´ usticos. Tambi´en se suele decir que las bandas cr´ıticas constituyen el intervalo en el cual se “suma” la energ´ıa de las distintas componentes espectrales de la se˜ nal. La comprensi´on detallada del significado de las bandas cr´ıticas se logra luego de estudiar algunos experimentos psicoac´ usticos relacionados con la sonoridad, en los cuales la bandas cr´ıticas se hacen presentes naturalmente. Como se ha mencionado el concepto de ancho de banda cr´ıtico fue desarrollado por Zwicker (Zwicker & Fastl, 1999), en el contexto de la suma de sonoridades. En la figura 2.14 se observa la curva obtenida en uno de los experimento desarrollado por Zwicker que hace presente las bandas cr´ıticas a partir de la medici´ on de la sonoridad. En la curva de la figura se indica la variaci´on de la sonoridad de una banda de ruido centrada en 2 kHz, en funci´on del ancho de dicha banda. La intensidad total de ruido permanece constante en 47 dBSP L , de forma tal que la densidad espectral del ruido var´ıa en forma inversamente proporcional al ancho de banda. Como se puede apreciar, mientras el ancho de banda de la se˜ nal es inferior al valor cr´ıtico, la sonoridad permanece constate y cuando el ancho de banda es mayor que una banda cr´ıtica la sonoridad aumenta.
Figura 2.14:
Otra forma de determinar las bandas cr´ıticas es mediante un experimento que permita determinar el umbral de audibilidad usando un complejos de tonos puros. En la figura 2.15 se observa el resultado de la determinaci´on del umbral de audibilidad en la proximidad de 1 kHz, donde la curva del umbral de 19
audibilidad puede considerarse plana.
Figura 2.15: En este experimento primeramente se determina el umbral con un solo tono de 920 Hz, y el valor obtenido correspondiente al nivel de presi´on sonora del tono de prueba apenas audible. Luego se introduce un segundo tono de 940 Hz de forma que la intensidad total del complejo siga siendo igual que al principio. Para lograr esto u ´ltimo es necesario reducir el nivel de cada tono a la mitad. Es as´ı que se va aumentando el n´ umero de tonos del complejo, separados entre s´ı por 20 Hz, de forma de mantener la intensidad total constate, lo cual se logra reduciendo a la mitad el nivel de cada tono. Cuando el ancho del complejo alcanza el valor cr´ıtico de 160 Hz, aunque se aumente el n´ umero de tonos, para que el complejo sea apenas audible es necesario mantener el nivel individual de cada tono (Zwicker & Fastl, 1999). A partir de este experimento es posible concluir que la banda cr´ıtica corresponde al intervalo de frecuencias en el cual, se suma la intensidad de las componentes confinadas a este intervalo, para producir un umbral de audibilidad dado. Por u ´ltimo, es posible evidenciar las bandas cr´ıticas por medio de un experimento que permite medir el efecto de enmascaramiento. En este experimento se obtiene el nivel de una banda estrecha de ruido apenas perceptible centrada entre dos tonos de mayor intensidad, ver figura 2.16. Como se puede observar en la curva, mientras la separaci´on de los tonos no supere el valor de una banda cr´ıtica, el umbral de enmascaramiento permanece casi constante, una vez superado este valor el umbral decae r´apidamente.
Figura 2.16:
20
2.3.1.
Filtros de bandas cr´ıticas
Es habitual considerar al sistema auditivo perif´erico como un conjunto de filtros pasabanda, con bandas superpuestas. Como hemos visto, una de las maneras m´as directas de determinar el ancho de banda cr´ıtico para los filtros es por medio de la utilizaci´on de un tono puro y una se˜ nal de ruido centrada en la frecuencias del tono, se˜ nal enmascarante. Si consideramos la funci´on de transferencia del filtro como H(f ) y la densidad espectral de potencia del ruido como N0 , la potencia en el filtro es; Z
∞
PN =
N0 (f ) · |H(f )|2 · df
(2.3.1)
0
Cuando la se˜ nal se hace apenas detectable, con potencia PS , se define un factor de eficiencia, K, como K = Ps /PN . Como ya se indic´o en la secci´on 2.3, una de las primeras determinaciones de las bandas cr´ıticas fue ´ considero la aproximaci´on en la cual el filtro auditivo es rectangular. En este realizada por Fletcher. El caso si el ruido que consideramos para determinar el ancho de banda es blanco, N0 , al ser independiente de la frecuencia obtenemos el calculo de la potencia como; Z
∞
PN = N0
|H(f )|2 · df
(2.3.2)
0
Ahora si el filtro es rectangular con altura unitaria y ancho de banda BR , entonces la potencia se reduce a la siguiente relaci´on;
PN = N0 · BR
(2.3.3)
Es as´ı que la potencia de umbral es entonces;
PS = K · N0 · BR
(2.3.4)
En esta u ´ltima ecuaci´on tenemos dos inc´ognitas; K y BR y podemos medir PS . Por tanto Fletcher investigo las consecuencias de asumir que la detecci´on ocurr´ıa cuando la relaci´on se˜ nal ruido era unitaria14 hallando el ancho de banda cr´ıtico a partir de BR = PS /N0 . A esta medida de al ancho de banda cr´ıtico se le denomina critical ratio. Es un hecho que las bandas cr´ıticas no tiene forma rectangular, por lo cual tampoco la tiene los filtros de bandas cr´ıticas. En realidad si consideramos una escala lineal y niveles sonoros moderados estos filtros tienen una forma gausseana, ver figura 2.17, sin embargo cuando los niveles sonoros son altos el lado de las frecuencias bajas del filtro va disminuyendo su pendiente en relaci´on con la de las frecuencias altas. A pesar de esto el concepto de filtros rectangulares es muy u ´til y es com´ unmente utilizado para describir el equivalente del ancho de banda de los filtros de bandas cr´ıticas con respecto a los filtros rectagulares con altura unitaria y ancho de banda BER . De modo que se define el ancho de banda equivalente como; Z BER =
∞
|H(f )|2 · df
(2.3.5)
0 14 P
S /N0
= PS /PN = K = 1
21
siempre y cuando asmumamos que el valor m´aximo de |H(f )| es la unidad.
Figura 2.17: Forma m´as natural para los los filtros de bandas cr´ıticas.
2.3.2.
Escala de bandas cr´ıticas.
La caracter´ıstica m´as importante de las bandas cr´ıticas es el ancho. Durante muchos a˜ nos se ha tratado de determinar estos anchos de banda utilizando una gran variedad de modelos y t´ecnicas experimentales. En 1961 Zwicker public´o los anchos de banda cr´ıticos en la escala Bark o de Munich. Posteriormente en los a˜ nos 80s, los experimentos de enmascaramiento con ruido de ancho de banda estrecho describieron otra serie de bandas cr´ıticas denominadas bandas cr´ıticas de Cambridge. El ancho de las bandas cr´ıticas depende de la frecuencia como se pude observar en la figura 2.18. Esta curva se obtiene por medio de la promediaci´on de los resultados de la medici´on de las bandas cr´ıticas de 50 sujetos y con 5 m´etodos diferentes. Como se puede apreciar en la misma por debajo de 500 Hz, el ancho de banda cr´ıtico es casi constante e igual a 100 Hz, mientras que por encima de esta frecuencia crece a medida que aumenta la frecuencia.
Figura 2.18: Anchos de banda cr´ıticos de acuerdo con las ecuaciones 2.3.6 y 2.3.7 en donde BM hace referencia a las bandas criticas de Munich, Bark, y BC las de Cambridge.
22
Ambos conjunto de bandas cr´ıticas tienen el mismo ancho de banda rectangular equivalente, BER . Por lo general se utilizan aproximaciones para su c´alculo, que para el caso de las bandas cr´ıticas obtenidas por Zwicker, se suele asumir una aproximaci´on del 20 % de la frecuencia central para las bandas cr´ıticas en esta porci´on del espectro auditivo. Esto permite calcular el ancho de banda cr´ıtico ∆fBC en Hz en funci´on de la frecuencia con un error menor al 10 %; £ ¤0,69 ∆fBC = 25 + 75 · 1 + 1, 4 · fc2
(2.3.6)
Por medio de considreaciones similares se llega a la expresi´on para las bandas cr´ıticas de Cambridge;
∆fBC = 24, 7 · (1 + 4, 37 · fc )
(2.3.7)
en donde fc es la frecuencia central en la banda en Hz. Una primera aproximaci´on para el modelado de la selectividad en frecuencia del sistema auditivo podr´ıa ser15 , basados en los valores de la curvas de la figura 2.18, subdividir el rango de frecuencias audibles en intervalos contiguos de bandas cr´ıticas de ancho tal, que no se superponga entre s´ı. Esta subdivisi´on se logra por medio de 25 bandas cr´ıticas16 , valores que se definen en la tabla 2.1 y se grafican el la figura 2.19.
Figura 2.19: 15 Para
el caso de las bandas determinas por Zwicker
16 Generalmente
la banda 25 es omitida porque se considera que las frecuencias mayores a 16 kHz no tiene importancia
en la percepci´ on.
23
N´ umero
Banda cr´ıtica
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
100 100 100 110 120 140 150 160 190 210 240 280 320 380 450 550 700 900 1100 1300 1800 2500 3500
Frecuencias Central 50 150 250 350 450 570 700 840 1000 1170 1370 1600 1850 2150 2500 2900 3400 4000 4800 5800 7000 8500 10500 13500
Inferior 100 200 300 400 510 630 720 920 1080 1270 1480 1720 2000 2320 2700 3150 3700 4400 5300 6400 7700 9500 12000
Superior 100 200 300 400 510 630 770 920 1080 1270 1480 1720 2000 2320 2700 3150 3700 4400 5300 6400 7700 9500 12000 15500
Esta divisi´on esta muy ampliamente difundida para describir la distribuci´on de las bandas criticas en funci´on de la frecuencia, denominando al n´ umero de banda con la unidad Bark. Entonces 1 Bark es un intervalo de una banda cr´ıtica de ancho en cualquier punto del rango de frecuencias audibles. La representaci´ on del n´ umero se realiza por medio de el s´ımbolo z. El cambio en z, debido al cambio en la frecuencia df esta dado por;
dz =
∆z · df ∆f
(2.3.8)
La cantidad ∆z/∆f es el rec´ıproco de el cambio de frecuencia necesario para cambiar z en una unidad, que es justamente la definici´on de ancho de banda cr´ıtico., ∆fBC . Por tanto tenemos que;
dz =
1 ∆fBC (f )
· df
(2.3.9)
Que finalmente integrando obtenemos la siguiente expresi´on para relacionar la escala de las bandas cr´ıticas y el ancho de las misma; Z
∞
z(f ) = 0
1 · df 0 ∆fBC (f 0 )
(2.3.10)
La relaci´on entre la escala de banda cr´ıtica y la frecuencia puede ser expresada por medio de otra ecuaci´on, la cual permite calcular el n´ umero de banda cr´ıtica, en Bark = z en funci´on de la frecuencia, ver figura 2.20, con un error menor a ±0, 2 z;
24
µ z(f ) = 13 · arctan
0, 76 · f 1000
"µ
¶ + 3, 5 · arctan
f 7500
¶2 # (2.3.11)
Numero de banda critico Vs Frecuencia 25 24 23 22 21 20
Numero de banda critica [Bark]
19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0
0
2000
4000
6000
8000
10000
12000
14000
16000
Frecuencia [Hz]
Figura 2.20:
2.3.3.
Banda cr´ıtica y membrana basilar.
Podemos entender la banda cr´ıtica como la m´ınima banda de frecuencias alrededor de una frecuencia determinada que excitan la misma zona de la membrana basilar. Se cree que las bandas cr´ıticas y su escala asociada, est´an relacionadas muy estrechamente. De esta manera se cree que, los intervalos de una banda cr´ıtica corresponden a distancias iguales a lo largo de la membrana basilar, siendo este valor 1, 3 mm, independientemente de la frecuencia central, abarcando unas 150 c´elulas receptoras en el ´organo de Corti, de un total de 3600 c´elulas ciliadas que hay en l´ınea entre el helicotrema y la ventana oval bajo la membrana basilar. Esto se debe porque los receptores est´an distribuidos de manera equidistante a lo largo de la membrana, correspondiendo entonces un n´ umero constante de receptores por banda cr´ıtica. Es por ello que se establece una relaci´on entre la frecuencia sonora de la se˜ nal y su posici´on asociada en la membrana basilar. Esta relaci´on pude ser apreciada en la figura 2.21. Se hace evidente de el gr´afico que la escala de banda cr´ıticas no s´olo est´a asociada con una medida de la selectividad en frecuencia, como lo son las bandas cr´ıticas, sino que adem´as constituye la escala m´as natural y conveniente que la escala de frecuencias para representar gr´aficamente e interpretar fen´omenos perceptuales.
25
Figura 2.21: En esta ilustraci´on se puede apreciar la relacion entre las escalas de longitud de la c´oclea con la unbicaci´on de las frecuencias en la misma y el n´ umero de banda cr´ıtica.
A pesar de las grandes similitudes entre la selectividad de frecuencia medida en la membrana basilar y la medida psicof´ısicamente, creo que tenemos que ser cautelosos en cuanto a la utilizaci´on de filtros auditivos ya que hoy por hoy no existe una explicaci´on fisiol´ogica del mecanismo de las bandas cr´ıticas.
2.4.
Sonoridad o Loudness
La sonoridad es un par´ametro perceptivo fundamental del sonido. La sonoridad es el atributo que nos permite ordenar sonidos en una escala del m´as fuerte al m´as d´ebil. La sonoridad o loudness es un atributo vinculado a la intensidad del sonido, par´ametro f´ısico que describe la energ´ıa transmitida por la onda sonora. La sonoridad no depende s´olo de la intensidad de un sonido, sino tambi´en de su frecuencia, del ancho de banda, del contenido espectral y la duraci´on del sonido, de manera que al igual que con otras magnitudes psicol´ogicas, se debe prestar especial atenci´on a las condiciones en que se la determina o especifica. La intensidad sonora para el caso de ondas planas o aproximadamente planas puede expresarse en t´erminos de la presi´on sonora eficaz de la onda, Pef , como;
I=
2 Pef ρ0 c
(2.4.1)
en donde ρ0 es la densidad del aire y c la velocidad de propagaci´on del sonido en el aire. Como ya hemos mencionado, el rango din´amico que nuestro sistema auditivo es capaz de manejar es enorme, por lo que se suele utilizar una escala logar´ıtmica de modo de comprimir este rango. Para ello se utiliza el nivel de presi´on sonora o dBSP L definido como17 ; µ dBSP L = 20 · log
Pef Pref
¶ (2.4.2)
que en t´erminos de intensidad sonora queda18 ; 17 Recordemos que P ref = 20 muP a 18 Recordemos
tambi´ en que; Iref =
2 Pref ρc
26
µ dBSP L = 10 · log
¶
I
(2.4.3)
Iref
Es interesante remarcar que el principal argumento para adoptar esta escala es la suposici´on del comportamiento logar´ıtmico del sistema auditivo perif´erico, pero como vamos a ver, la percepci´on de sonoridad no cumple con la ley logar´ıtmica de Weber - Fechner, 19 , sino m´as bien con una ley potencial con exponente 3/5. En el caso que supusiermos que la intensidad es una magnitud que cumple con la ley de Weber la diferencia apenas perceptible tendr´ıa que ser proporcional a la presi´on sonora, lo cual implicar´ıa que el nivel de presi´on sonora luego del aumento en una diferencia apenas perceptible, DAP, resultara en; µ 20 · log
P + δP Pref
¶
µ = 20 · log
P +K ·P Pref
¶
µ = 20 · log
P Pref
¶ + 20 · log (1 + K)
(2.4.11)
, lo cual implicar´ıa que la diferencia apenas perceptible expresada como nivel de presi´on sonora tendr´ıa que ser una cantidad constante en decibeles. Esto u ´ltimo contrasta notoriamente con los resultados experimentales, los cuales revelan que la diferencia apenas perceptible se aproxima, para el caso de frecuencia 1 kHz, a la curva de la figura 2.22. 19 Esta ley es una ley experimental, general, relacionada con la percepci´ on sensorial de los seres humanos, que en realidad no se cumple perfectamente sobre todo el rango central de intensidades de los est´ımulos, pero fue el primer indicio del fen´ omeno de compresi´ on que caracteriza a la percepci´ on sensorial. Weber, en el a˜ no 1984, denomina la diferencia apenas perceptible, DAP , al umbral diferencial, y estableci´ o que esta diferencia es proporcional a la intensidad f´ısica del est´ımulo;
DAP = K · E
(2.4.4)
,en donde E es el est´ımulo, Kuna constante de proporcionalidad. Por otro lado Fechner, postul´ o en 1860, que la DAP corresponde subjetivamente a un incremento constante en la sensaci´ on provocada por le est´ımulo, en otras palabras, adopt´ o la DAP como la unidad de sensaci´ on. La ley ed Weber - Fechner surge de aplicar la ley de Weber y el postulado de Fechner de manera que si tenemos el est´ımulo E y la medida de la sensaci´ on S obtengamos la relaci´ on entre estas dos variables S = f (E). Supongamos que tenemos dos est´ımulos E1 y E2 que difieren en una DAP ; DAP = E2 − E1
(2.4.5)
S2 − S1 = f (E2 ) − f (E1 ) = f 0 (E) · DAP
(2.4.6)
, entoces podemos escribir
, en donde
f0
denota la derivada con respecto a la unidad de sensaci´ on DAP . Ahora si consideramos la ley de Weber, S2 − S1 = f 0 (E) · K · E
(2.4.7)
Ahora bien, si adoptamos la unidad de sensaci´ on propuesta por Fechner tenemos que; S2 − S1 = 1
(2.4.8)
, lo que implica que f 0 (E) =
1 K·E
(2.4.9)
expresi´ on la cual integrando se convierte en; E (2.4.10) E0 donde C es el inverso de K y E0 es un valor de referencia que habitualmente se toma como el umbral absoluto. Esta relaci´ on logar´ıtmica es la ley de Weber - Fechner, la cual tiene validez para le rango medio de los est´ımulos. S = f (E) = C · LN
27
Figura 2.22: Diferencia apenas perceptible en intensidad vs intensidad
2.4.1.
Curvas de igual sonoridad
Una forma pr´actica de abordar el problema de la sonoridad es medir el nivel de sonoridad, es decir, determinar cu´ando un sonido es igual de fuerte que otro. En 1933, Fletcher y Munson realizaron la determinaci´on psicoac´ ustica basada en la comparaci´on entre dos tonos puros: un tono de 1 kHz e intensidad fija, utilizado como referencia, y un tono de otra frecuencia e intensidad variable, que el sujeto deb´ıa ajustar hasta que fuera igualmente sonoro que el de 1 kHz. Graficando los resultados en funci´on de la frecuencia, obtuvieron para cada intensidad de referencia una curva de igual sonoridad. Los sonidos senoidales contenidos a lo largo de cada curva tienen la misma sonoridad. Esta dependencia de la frecuencia estar´ıa dada principalmente por las caracter´ısticas de transferencia del o´ıdo externo y el medio. En la figura 2.23 se aprecian las curvas de igual sonoridad, sepraradas cada 10 dB. Seg´ un se puede apreciar para bajas intensidades las curvas son similares a la curva de umbral de audibilidad, sin embargo para intensidades elevadas las curvas se van tornando m´as planas.
Figura 2.23: La utilidad de estas curvas es comparar la intensidad subjetiva de dos tonos puros de diferentes frecuencias e intensidades. As´ı, un tono puro de 100 Hz y 50 dBSP L parece menos sonoro que uno de 2 kHz y tan s´olo 30 dBSP L . Los menores valores de intensidad, dBSP L , requeridos en las proximidades de 3 kHz para
28
evocar una misma sensaci´on de sonoridad se deben a la resonancia del canal auditivo en esa frecuencia20 . Las curvas de igual sonoridad pueden utilizarse para asignar una valoraci´on num´erica a la sonoridad, con este objetivo en mente es que se define el nivel de sonoridad o loudness level , N S, f on o f ono, como el nivel de presi´on sonora del tono de 1 kHz que se encuentra sobre la misma curva. Es as´ı que queda establecida la unidad subjetiva del nivel de sonoridad como f ono. De esta manera es que, por ejemplo, un tono de 200 Hz y 40 dBSP L est´a sobre la curva que contiene al tono de 1 kHz y 20 dBSP L , de modo que su nivel de sonoridad es de 20 f on. Las curvas o contornos de igual sonoridad han sido determinados nuevamente con mayor precisi´on por Robinson y Dadson en 1956, y posteriormente normalizados por la Organizaci´on Internacional de Normalizaci´on como Norma ISO 226. Estas curvas se pueden apreciar en la figura 2.24.
Figura 2.24: Es importante remaracar que las curvas de igual sonoridad o isof´onas son v´alidas para el campo sonoro directo. Dado que, nuestro sistema auditivo no es sensible por igual a sonidos provenientes de diferentes direcciones, estas curvas no ser´an iguales en el campo sonoro directo y en el campo sonoro difuso. Por consiguiente es que se determin´o experimentalmente una curva, ver figura 2.25, de correcci´on para que un sonido senoidal tenga igual sonoridad en el campo sonoro directo y en el difuso, en dependencia de la frecuencia de dicho sonido senoidal.
Figura 2.25:
Poder calcular de manera simple el nivel sonoro de un sonido compuesto a partir de los niveles sonoros de sus componentes, ser´ıa una herramienta muy interesante. Lamentablemente esto no es posible porque no se tiene una escala absoluta, y adem´as entra en juego el enmascaramiento sonoro. Sin embargo el nivel de sonoridad de un sonido cualquiera complejo se determina comparando su sonoridad con la de un sonido senoidal. 20 Es importante recordar que estas curvas reflejan en realidad los promedios de un n´ umero considerable de personas j´ ovenes y audiologicamente normales.
29
2.4.2.
Filtros de ponderaci´ on
Luego de los trabajos de Fletcher y Munson se comprob´o que la percepci´on de la sonoridad era un fen´omeno muy complejo intent´andose crear un instrumento de medici´on capaz de reflejar la sensaci´on de sonoridad producida por un sonido cualquiera. Con ello en mente es que propusieron filtros de ponderaci´on, con respuestas espectrales inversas a las curvas de Fletcher y Munson. Esta idea se topo con grandes dificultades; primero no hay una curva u ´nica, sino, que para cada nivel de sonoridad existe una diferente; segundo, las curvas de igual nivel de sonoridad de Fletcher y Munson s´olo son v´alidas para tonos senoidales, por lo cual el prop´osito original de obtener un valor u ´nico que se correlacionara con la sensaci´on de sonoridad no pudo lograrse. Sin embargo se propusieran tres curvas de ponderaci´on diferentes: la curva A,B y C, que se pueden apreciar en la figura 2.26.
Figura 2.26: A la izquierda de la figura se puede observar que la curva A est´a basada de manera general en la curva de nivel de sonoridad de 30 f on, la curva B en la de 70 f on y la curva C a la de 100 f on. Esto quiere decir que la curva A es v´alida para niveles de sonoridad pr´oximos a los 40 f on, la curva B, v´alida para niveles de sonoridad del orden de 70 f on, y la curva C, destinada a los niveles de sonoridad cercanos a 100 f on. A pesar del fracaso en la utilidad de estos filtros, investigaciones posteriores demostraron que las cifras medidas intercalando la curva de ponderaci´on A estaban muy bien correlacionadas con el da˜ no auditivo experimentado por las personas expuestas a ruidos intensos durante per´ıodos considerables de tiempo. Es por ello que esta curva fue adoptada en numerosas normas y legislaciones. Es posible encontrar implementaciones electr´onicas de estas curvas en diversas normas como la IEC 651/79, en donde incluso de proporcionan las funciones de transferencia para las curvas A y C.
2.4.3.
Escala de sonoridad
El nivel de sonoridad que hemos abordado en la secci´on anterior es una magnitud psicoac´ ustica, permite principalmente, para tonos puros, objetivar las diferencias de percepci´on de intensidad en relaci´on con la frecuencia. Un tono de 60 f ons pruduce la misma percepci´on de intensidad cualquiera sea su frecuencia. 30
En otras palabras; el valor num´erico obtenido se refiere a la magnitud del est´ımulo f´ısico, no a una valoraci´on de la intensidad de la sensaci´on, esto quiere decir que, no es posible comparar los f ons de dos sonidos para determinar cual es su relaci´on real de sonoridad, por ejemplo, un tono de 80 f on no es el doble de sonoro que uno de 40 f on. Los estudios psicof´ısicos21 sobre la sensaci´on de sonoridad consisten el presentar est´ımulos con espectros similares, pero con diferentes intensidades. El oyente le asigna un valor num´erico a la sonoriad percibida de acuerdo a una escala que el mismo elige. Luego de un tiempo se observa que la estimaci´on num´erica se establece en una relaci´on monot´onica con la intensidad del est´ımulo. Estos experimentos mostraron que las estimaciones son proporcionales a una potencia de la intensidad. Estos resultados concordaron con las estimaciones de sonoridad derivadas a partir de la tarea de juzgar un est´ımulo al doble o a la mitad del otro est´ımulo est´andar, (Zwicker & Fastl, 1999) y (Hartmann, 2000). Si simbolizamos la sonoridad como S, la ley exponencial que se mencion´o anteriormente se puede formular de la siguiente forma: S = kI p ,
(2.4.12)
donde I es la intensidad del est´ımulo y k una constante que depende del sujeto del experimento y de las unidades usadas y p una constantes. El an´alisis experimental toma logaritmo de ambos lados de la ecuaci´on 2.4.3:
log S = log k + p log I
(2.4.13)
Esta ecuaci´on nos indica que el logaritmo de la estimaci´on de la sonoridad deber´ıa ser una funci´on lineal del logaritmo de la intensidad del est´ımulo. El ´ındice p, se ha calculado para diferentes tipos de est´ımulos, dando dos rangos de resultados dependiendo si la se˜ nal es de banda ancha o banda limitada (complejos tonales). Para el caso de est´ımulos de Banda Ancha los est´ımulos que se suelen utilizar son de dos clases, ruido aleatorio de banda ancha y “ruido de enmascaramiento uniforme”. Los resultados de la estimaci´on del exponente para diferentes investigadores : 1. Para ruido de banda ancha como est´ımulo: a) 0.22 (Hartmann, 1993). b) 0.22 (Houtsma, Durlach & Braida, 1980). c) 0.25 (Bilsen & Ritsma, 1969 - 1970)). 2. Para “ruido de enmascaramiento uniforme” como est´ımulo: a) 0.23 (Zwicker & Fastl, 1999). Estudios posteriores a estas medida determinaron que el procedimiento de determinaci´on del exponente, llevaba a la sub-estimaci´on del exponente p. Esto es consecuancia de una ley de la psicof´ısica, conocida 21 Los estudios psicof´ ısicos son aquellos que buscan obtener una relaci´ on entre la magnitud de una sensaci´ on, percibida por un humano, y la magnitud de un est´ımulo medido en unidades f´ısicas convencionales. Este tipo de relaci´ on se obtiene, suponiendo que los humanos son capaces de producir estimaciones confiables en una escala num´ erica.
31
como el efecto de regresi´on, que dice que el observador comprime la escala sobre la que tiene control en una forma que se llama “modality matching” (Marks, 1974) y (Hartmann, 2000). Ahora como en la tarea de estimaci´on de la sonoridad, el observador tiene control sobre la escala num´erica, y por lo tanto se presenta el efecto de regresi´on, estas experiencias arrojaban valores del exponente bajos. Para compensar esta sub-estimaci´on, la estimaci´on de la magnitud sonora puede ser reemplazada por una tarea de producci´on de magnitud sonora, en donde el oyente tiene control sobre el volumen de est´ımulo auditivo. En la experiencia de producci´on, la tarea del oyente es ajustar la amplitud del est´ımulo para que se corresponda con los n´ umeros dados por el investigador que lleva a cabo la experiencia. Normalmente, estos n´ umeros son elegidos para que est´en comprendidos dentro del rango de valores que el oyente propuso en una experiencia previa de estimaci´on de la magnitud sonora. Con este procedimiento se logra que el oyente sobre-estime el exponente. Finalmente se toma el exponente como la media entre los ´ındices arrojados de una experiencia de estimaci´on y producci´on de la magnitud sonora. Bajo estas observaciones en 1966, los experimentos de, Stevens y Greenbaum encontraron un exponente de 0.27 para la estimaci´on de magnitud y 0.33 para la experiencia de producci´on de magnitud dando finalmente un promedio de 0.3. Por otro lado para complejos tonales o se˜ nales de ancho de banda limitado, la estimaci´on del exponente p fue desarrollada primero por Fletcher y luego por Zwicker y Fastl quienes luego de realizar diferentes experimentos encontraron exponentes de 1/3 y 0, 3 respectivamente para intensidades de est´ımulo de m´as de 40 dBSP L . Finalmente Stevens en el a˜ no 1995, luego de tomar varias medidas decidi´o establecer el exponente en 0, 3. Entonces para sonoridades derivadas a partir de est´ımulos sonoros de m´as de 40 dBSP L ., la ley exponencial toma este valor como exponente, o lo que es lo mismo, se debe aumentar en 10 dBSP L . al est´ımulo, el tono de 1 KHz., para producir una sensaci´on de sonoridad del doble. Asi finalemente es que se establece como el est´andar para la escala convencional de sonoridad el sone, definido arbitrariamente como la sonoridad de un tono puro de 1 kHz de 40 dBSP L , quedando la ecuaci´on de la siguiente forma; S = kI 0,3
(2.4.14)
Figura 2.27: Como se indico esta relaci´on es v´alida para sonidos con niveles mayores a 40 dBSP L , ya que como se observa en la curva de la figura 2.27, para sonidos con niveles por debajo de los 40 dBSP L la funci´on planteada anteriormente no se cumple, y la sonoridad cambia m´as r´apidamente con la variaci´on de nivel de presi´on sonora , SPL. Si expresamos la sonoridad en son, unidad que corresponde a un nivel de sonoridad de 40 f on, se obtiene la curva de la que se observa en la figura 2.28. A partir de estas se puede obtener la siguiente relaci´on 32
entre f on y son;
S=2
N S − 40 10
(2.4.15)
,relaci´on v´alida para niveles de sonoridad mayores a 40 f on. Ahora bien como este nivel es relativamente bajo, en la pr´actica es aplicable para la mayor´ıa de los sonidos.
Figura 2.28: Hemos establecido la relaci´on entre el nivel de sonoridad y la sonoridad para tonos de 1 kHz, pero esta puede ser aplicada para cualquier frecuencia si utilizamos las curvas de igual sonoridad. En el caso concreto de un tono de 1 kHz, el nivel de sonoridad en f on es igual al nivel de presi´on sonora; µ N S = 20 · log
P Pref
¶ (2.4.16)
por lo cual;
S=
1 16
µ
P Pref
¶0,601 (2.4.17)
Si retomamos aquello que expusimos al comienzo de la secci´on, relacionado con la ley de Weber-Fechner, acabamos de demostrar que la intensidad dista enormemente de cumplir la relaci´on de Weber - Fechner.
33
2.4.4.
Sonoridad para sonidos compuestos
En el mundo real los sonidos no son tonos, por lo cual es necesario extender el concepto de sonoridad. Esta extensi´on no es nada sencilla, ya que los mecanismos de integraci´on de la sensaci´on difieren seg´ un la separaci´on en frecuencias, bandas cr´ıticas, etc. Es as´ı que, si los tonos que componen un sonido compuesto est´an en la misma banda cr´ıtica, la intensidad total se obtiene sumando las intensidades individuales, luego a parir de la intensidad, aplicando las curvas de igual sonoridad y la curva, figura 2.28, de pasaje de nivel de sonoridad a sonoridad podemos obtener la sonoridad correspondiente. Por otro lado si los tonos no est´an comprendidos dentro de la misma banda cr´ıtica, la sonoridad total se obtiene directamente sumando las sonoridades individuales. En la pr´actica el procedimiento de c´alculo consiste en subdividir el espectro del sonido compuesto en bandas cr´ıticas, luego sumar las intensidades dentro de cada banda, convertir la intensidad en nivel de sonoridad y ´este en sonoridad, y finalmente sumar todas las sonoridades de las diversas bandas cr´ıticas y convertir en nivel de sonoridad. Queda suficientemente claro que la estimaci´on de la sonoridad, as´ı como el c´alculo de la relaci´on exponencial entre la intensidad del est´ımulo auditivo y la sonoridad, tiene muchas complicaciones y no resulta del todo fiable. Sin embargo existen unos cuantos registros y estimaciones de esta magnitud, que trata de corresponderse con una sensaci´on, la sonoridad.
2.5.
Efectos temporales
En todos los ejemplos estudiados se utilizaron se˜ nales de prueba con duraciones mayores a 200 ms, por otro lado los umbrales de audibilidad y de enmascaramiento dependen de la duraci´on de la se˜ nal de prueba, y lo hacen como se muestra en la figura 2.29. En esta se muestra la variaci´on del umbral de audibilidad para tonos de 200 Hz, 1 kHz y 4 kHz, as´ı como la variaci´on del umbral de enmascaramiento producido por “ruido de enmascaramiento uniforme”22 , en funci´on de la duraci´on de la se˜ nal de prueba. Para se˜ nales de prueba con duraciones de m´as de 200 ms, el umbral permanece constante, mientras que para duraciones inferiores a 200 ms el umbral aumenta de forma lineal con una pendiente de 10 dB/d´ecada. Esto sugiere que para duraciones inferiores a 200 ms, el sistema auditivo se comporta como un detector de energ´ıa; de modo que para que una se˜ nal sea apenas audible cuando se disminuye su duraci´on se le debe aumentar la potencia, de modo que su energ´ıa permanezca constante. Por otro lado, para duraciones de m´as de 200 ms el umbral es independiente de la duraci´on; lo que quiere decir que el sistema auditivo opera como un detector de energ´ıa dentro de una ventana de tiempo de 200 ms de duraci´on.
2.5.1.
Resoluci´ on temporal
La resoluci´on temporal de nuestro sistema auditivo es de mucha importancia, debido a que todos los sonidos var´ıan con el tiempo y adem´as la informaci´on que percibimos esta contenida en gran parte en estas variaciones temporales. La resoluci´on temporal depende b´asicamente del; an´alisis de patrones temporales que ocurren en diferentes canales de frecuencia y la comparaci´on de estos entre estos canales. Se han estudiado la capacidad de nuestro sistema auditivo para detectar: 22 El
cual se obtiene al modificar el ruido blanco en funci´ on de la curva de enmascaramiento.
34
Figura 2.29:
1. Interrupciones de un sonido. 2. Variaciones de la se˜ nal en el transcurso del tiempo. 3. Variaciones en la duraci´on de los est´ımulos, umbrales diferenciales de duraci´on. La gran dificultad para obtener datos v´alidos es que las variaciones en los patrones temporales tiene como consecuencia variaciones en los patrones espectrales que al parecer son tambi´en utilizadas para discriminar las variaciones.
Interrupciones de un sonido Si restringimos el estudio para tonos puros los resultados se ven muy afectados por las condiciones de fase en las cuales los tonos son interrumpidos y continuados. Estos experimentos se han realizado en tres condiciones de fase, con la condici´on que el tono sea interrumpido en el momento de cruzar el cero en direcci´on positiva: 1. Cuando el tono comienza en fase positiva 2. Cuando el tono comienza en fase negativa. 3. Cuando el tono comienza donde hubiera seguido si no se hubiera detenido. En el u ´ltimo de los tres casos, cuando el tono comienza donde lo hubiera hecho si no se hubiera detenido, el umbral de detecci´on de la interrupci´on aumenta de forma proporcional al incremento de la interrupci´on. Los experimentos han sugerido que este umbral es dependiente de la frecuencia de los tonos. Para los dem´as casos, los resultados no son regulares, por lo cual no se ha podido establecer relaciones. Si ahora tomamos el caso de ruidos de banda angosta, el umbral de detecci´on de la interrupci´on disminuye a medida que aumenta el ancho de banda. Este descenso en el umbral incluso de presenta cuando el ancho de banda del ruido supera el ancho de banda cr´ıtico, lo cual hace pensar que utilizamos informaci´on proveniente de m´as de una banda cr´ıtica para detectar interrupciones en un ruido.
Variaciones de la se˜ nal en el tiempo Para determinar este tipo de variaci´on o detecci´on de modulaci´on se utiliza ruido blanco modulado en amplitud por medio de un tono puro, modulaci´on AM. 35
Los resultados de este tipo de experimentos han arrojado que; para frecuencias inferiores a los 16 Hz la respuesta esta limitada por la resoluci´on de amplitud de nuestro sistema auditivo, m´as que por la resoluci´on temporal, de esta manera se concluye que el umbral es independiente de la frecuencia de modulaci´on. Para frecuencias de modulaci´on entre 16 Hz y 1 kHz el umbral aumenta en funci´on de la frecuencia de modulaci´on. Por u ´ltimo para frecuencias de modulaci´on mayores a 1 kHz la modulaci´on no es detectada.
Umbrales diferenciales de duraci´ on La duraci´on de los sonidos comprende dos tipo; la duraci´on objetiva, que es la duraci´on de los sonidos posible de ser medida f´ısicamente cuya unidad suele ser el segundo; y la duraci´on subjetiva, que es la duraci´on que nosotros percibimos en los sonidos, para este tipo de duraci´on suele usarse la unidad “dura” y se ha definido a 1 dura como la duraci´on subjetiva de un sonido senoidal de 1 kHz, con 60 dBSP L y 1 s de duraci´on objetiva, de manera que duplicando y reduciendo a la mitad podemos determinar la relaci´on existente entre las duraciones objetivas y subjetivas. En la curva de la izquierda de la figura 2.30 se ilustra la relaci´on entre la duraci´on objetiva y la subjetiva. Puede verse que, existe una relaci´on de proporcionalidad que se mantiene para sonidos de duraciones mayores a los 100 ms, pero que para sonidos de duraciones menores a este valor la duraci´on subjetiva aumenta un poco con respecto a la objetiva.
Figura 2.30: Se pueden obtener otros resultados cuando se comparan sonidos con silencios. Parece ser que las duraciones objetivas y subjetivas de sonido y silencio son iguales si ambos tiene duraciones mayores a 1 s, no cumpli´endose para sonidos de menores duraciones. La relaci´on que guardan los dos tipos de duraciones var´ıa con la frecuencia del sonido o su contenido espectral, produci´endose las mayores diferencias para sonidos de 3, 2 kHz, caso en el cual se percibe duraciones de un sonido de 100 ms a la de un silencio de 400 ms duraci´on. A la derecha de la figura 2.30 se pude apreciar este caso entre otros. Los experimentos de discriminaci´on en los cambios de duraci´on de un sonido o un silencio rodeados por sonidos iguales o silencios, han concluido que para duraciones superiores a los 10 ms el umbral de discriminaci´on aumenta con el aumento de la duraci´on del sonido o silencio, y ha revelado una aparente independencia del contenido espectral de los sonidos con el umbral de discriminaci´on. Tambi´en establecieron que este umbral aumenta para niveles bajos de presi´on sonora y tambi´en cuando los sonidos que rodean el silencio tienen diferentes niveles o frecuencias.
36
Bibliograf´ıa ALLEN, Jont B. 1998. Psychophysical models of masking for coding applications. BILSEN, F.; RITSMA, R. 1969 - 1970. Repetition pitch and its implecation for hearing theory. En: Acustica 22: pp. 63 - 73. BRUSCIANELLI, Calogero. 1995. Ac´ ustica, Psicoac´ ustica y Electroac´ ustica. CHAIGNE, Antoine. 1989. Psychoacustique. Telecom Paris. ¨ ¨ Aki. 1999. Temporal masking efects: single incidents. Reporte t´ecnico, FAMbac. HARM A, HARTMANN, W. 1993. Auditory demostrations on compact disc for large N. En: J. Acuost. Soc. Am. 93: pp. 1 - 16. HARTMANN, William. 2000. Signals, sound, sensation.. 4 ed. New York: Springer - Verlag. HOUTSMA, A., et al . 1980. Intensity perception XI. Experimental results on derelation of intensity resolution to loudness maching. En: J. Acoust. Soc. Am. 68: pp. 807 - 813. KANDEL, Eric R., et al . 1996. Neurociencia y conducta. Prentice Hall. MARKS, L. 1974. The new psychophysics. New York. MIYARA, Federico. Introducci´ on a la psicoac´ ustica. Reporte t´ecnico. MOORE, Brian, et al . 1998. Masking patterns for sinusoidal and narrow-band noise maskers. En: J. Acoust. Soc. Am 104: pp. 1023 - 1023 August. MOORE, B. C. J. 1997. An Introduction to Psychology Hearing. San Diego: Academic Press. NIEDER, Andreas; KLUMP, Georg. 1998. Time course of simultaneous masking in the starling’s auditory forebrain. Reporte t´ecnico, Institut f¨ ur Zoologie, Technische Universit¨at M¨ unchen,Lichtenberg Str. 4, D85747 Garching, Germany. PROAKIS, J.; MANOLAKIS, D. 1996. Tratamiento digital de se˜ nales. Prentice Hall. ROBINSON, David; HAWKSFORD, Malcolm. Los angeles, 2000. Psychoacoustic models and non-linear human. Reporte t´ecnico, Centre for Audio Research and Engineering Department of Electronic Systems Engineering The University of Essex Wivenhoe, Park Colchester CO4 3SQ United Kingdom. SMITH, Julius; ABEL, Jonathan. 1999. Bark and ERB Bilinear Transforms. SOLIMAN, S.; SRINATH, M. 1999. Se˜ nales y sistemas continuos y discretos. Prentice Hall. STREMBLER, F. 1998. Introducci´ on a los sistemas de comunicaci´ on. Addison - Esley. WILLSKY, A. Oppenheim A. 1997. Se˜ nales y sistemas. Pearson educaci´on. ZWICKER, E.; FASTL, H. 1999. Psychoacoustics: Facts and Models. Springer Berl´ın ed.
37