La voz del cerebro: áreas del cerebro dedicadas al procesamiento de la voz humana

En el año 2000 los investigadores Pascal Belin, Robert J. Zatorre, Philippe Lafaille, Pierre Ahad y Bruce Pike publicaron un artículo seminal en las cartas a Nature, titulado "área selectiva de voces en la corteza auditiva humana", el cual ha ayudado a dilucidar la organización funcional de la corteza auditiva humana. El procesamiento final de los estímulos auditivos tiene lugar en la corteza cerebral, aunque involucra todo el cerebro. Este artículo se refiere específicamente a la función de un área ubicada en la corteza temporal, cuya caracterización es un paso fundamental para el entendimiento de la función del sistema auditivo humano. 

Introducción
El principal objetivo del estudio fue identificar las áreas de la corteza cerebral  que son sensibles y selectivas a las voces humanas. Para ello, los investigadores realizaron tres experimentos en los cuales presentaron sonidos agrupados en bloques mientras los sujetos fueron escaneados. En cada experimento se utilizó una amplia variedad de estímulos auditivos agrupados en diferentes categorías.

Método

En este estudio participaron catorce sujetos adultos (edad 22-47 años), seis hombres y ocho mujeres, todos diestros y con audición normal. Seis sujetos participaron en los experimentos 1 y 2, otros seis sujetos participaron en el experimento 3 y dos sujetos participaron en los tres experimentos. En todos los experimentos los sujetos fueron instruidos simplemente a cerrar los ojos y escuchar los sonidos presentados. Los estímulos auditivos fueron transmitidos a una intensidad media de 88 a 90 dB nivel de presión de sonido.

Los escaneos fueron realizados en un escáner de 1.5 Tesla. En todos los experimentos los bloques de 20 segundos de estímulos auditivos fueron presentados en orden aleatorio con un intervalo de silencio entre los bloques de 10 segundos; el inicio de cada bloque fue sincronizado con el inicio del escaneo.


Experimento 1

Estímulos
La principal división es entre estímulos vocales -los cuales involucran el aparato fonador humano- y no vocales.

--> Estímulos vocales:
- Habla: palabras, sonidos similares a palabras (no palabras reales; también llamados no-palabras) y lengua extranjera (para los sujetos).
- No-habla: risas, suspiros, onomatopeyas. Nota: los sonidos que no involucran la vibración de las cuerdas vocales tales como silbidos y susurros fueron excluidos del estudio. 

--> Estímulos no vocales:
- Sonidos de la naturaleza: viento y riachuelos.
- Animales: llantos y galopes.
- Ambientes humanos modernos: carros, teléfonos y aviones. 
- Instrumentos musicales: campanas, arpas y orquestas instrumentales.

Procedimiento
Ocho adultos diestros fueron escaneados durante momentos de silencio mientras escuchaban pasivamente los estímulos de las dos categorías (o sea, voces y sonidos no vocales). En este experimento se buscó identificar las regiones cerebrales con mayor actividad neuronal durante la estimulación auditiva con voces, en comparación con la actividad generada por la estimulación con sonidos no vocales. Para la presentación de los sonidos se usó un paradigma de resonancia magnética funcional (RMf) especial [este paradigma era necesario debido al elevado nivel de ruido que generan los distintos componentes del escáner; cuando el escáner o magneto genera y recibe las ondas necesarias para construir las imágenes, sus partes son sometidas a cambios fuertes y rápidos de corriente eléctrica, lo que causa el movimiento de las partes y a su vez un ruido considerable -100 dB aprox.-].

Resultados
En todos los sujetos los sonidos vocales generaron mayor activación que los sonidos no vocales de manera bilateral en varias regiones de la corteza auditiva no primaria. [La corteza auditiva se divide principalmente en primaria, no primaria y asociativa. Los estímulos auditivos arriban a la corteza primaria ubicada en el lóbulo temporal, de donde se transmite la información a las regiones adyacentes -corteza auditiva no primaria y asociativa- donde será analizada y procesada]. 

La mayor activación generada por la voz se localizó en la parte central del banco superior del surco temporal superior (STS) en 7 de los 8 sujetos. En promedio, en el grupo de sujetos la actividad sensitiva a la voz fue mayor en el hemisferio derecho, y estuvo distribuida en tres grupos a lo largo del STS. De manera importante, no hubo activación significativa para los estímulos no vocales en comparación con los vocales en ninguna área de la corteza.

Discusión
Según Belin et al., el Exp. 1, por consiguiente, demuestra que el cerebro contiene varias regiones que son sensibles a las voces, aunque no muestra si estas regiones son activadas selectivamente por voces. Por lo tanto, Belin et al. realizaron un segundo experimento en el mismo grupo de sujetos para ver si encontraban un patrón de activación selectiva al comparar estímulos vocales con sonidos control apareados más cuidadosamente. 

Experimento 2
Procedimiento
En este experimento estímulos vocales (de habla y no habla) fueron contrastados con cuatro clases de estímulos control:
1. Grabaciones de varias campanas --> para evaluar si las mismas regiones eran activadas por la presentación de sonidos de la misma categoría en lugar de voces.
2. Sonidos humanos no vocales (p. ej., chasquidos de dedos, aplausos) --> para examinar la posibilidad de que estas áreas respondieran a cualquier sonido de origen humano.
3. Ruido blanco modulado con la misma amplitud de la envoltura de los sonidos vocales.
4. Voces mezcladas --> las cuales preservan la amplitud de la envoltura de los sonidos vocales, pero no suenan nada parecido a voces. Adicionalmente, Belin et al. separaron el habla de los sonidos tipo no-habla.

Resultados
Regiones con respuesta significativamente mayor a los sonidos vocálicos en comparación con la respuesta generada por los estímulos de control se alinearon a lo largo del la zona central del STS y con las áreas de actividad máxima encontrados en el experimento 1. 

La respuesta a ambos estímulos vocales (tanto habla como no-habla) fue significativamente mayor en comparación con la respuesta generada por el grupo de estímulos control.

Discusión
Los resultados indican que la respuesta sensitiva a las voces no fue completamente debida a la presencia de habla en los estímulos vocales.

El Exp. 2 también mostró que las áreas sensitivas a voces no responden sólo por la presentación de varios tipos de sonidos de una misma categoría -como campanas o sonidos de origen humano- ya que la respuesta generada por las voces fue más fuerte que la respuesta generada por las otras dos categorías ("1." y "2."), particularmente en el hemisferio derecho.

Finalmente, los resultados del Exp. 2 sugieren que la frecuencia estructural (o estructura espectral [distribución de las diferentes frecuencias en función de su amplitud]) juega un papel prominente en la activación sensitiva a las voces en comparación con el papel que juega la amplitud de la envoltura: o sea, tanto los estímulos como el ruido con amplitud modulada y las voces mezcladas -los cuales generaron respuestas significativamente menores que las de las generadas por los estímulos vocales- fueron similares a las voces en la amplitud de su envoltura pero no en su estructura espectral. 

Experimento 3
Estímulos
Se utilizaron los mismos sonidos de los experimento 1 y 2 presentados en su forma original o pasados por filtros de paso de banda con picos a los 200 Hz (ancho de banda de 50 Hz) o 1.600 Hz (ancho de banda de 400 Hz).

Belin et al. realizaron este experimento con dos propósitos: (a) controlar la distribución espectral de los estímulos vocales y no vocales, para verificar si los resultados de los experimentos 1 y 2 eran atribuibles a cualquier diferencia en esta variable y (b) examinar cómo la actividad de las áreas sensitivas a voces -así como el desempeño de los sujetos en las tareas de percepción de voces- podrían ser afectados por la modificación de la estructura espectral de los estímulos.

Procedimiento
Conjuntos de sonidos vocálicos y no vocálicos fueron presentados durante el escaneo, tanto en su forma original como después de la aplicación de un filtro espectral que removió altas y bajas frecuencias, y equiparó la distribución espectral de los estímulos vocales y no vocales. Después del escaneo los sujetos realizaron tareas de clasificación entre estímulos vocales y no vocales y de identificación del género del hablante, las cuales usaron los mismos estímulos filtrados y no filtrados.

Resultados
Las imágenes promedio (del grupo) de RMf, correspondientes a los sonidos vocales y no vocales sin filtrar, fueron muy similares a aquellas de los experimentos 1 y 2, con la actividad sensible a la voz concentrada a lo largo de todo el STS. La actividad promedio de estas regiones fue siempre mayor para los estímulos vocales que para los no vocales y se redujo significativamente con el filtrado, sin existir diferencia entre los hemisferios. La reducción en la activación fue paralela a la reducción en el desempeño de los sujetos en las dos tareas de percepción de voces.

Discusión
Belin et al. concluyen que el experimento 3 replicó los hallazgos de los experimentos 1 y 2 y mostró que las regiones identificadas son claramente sensibles a la voz. Su respuesta a los sonidos vocales fue mayor que a los sonidos no vocales aún después de que la distribución de las frecuencias fuera igualada mediante filtrado. Añaden los investigadores que los resultados del experimento 3 sugieren que las áreas sensibles a la voz pueden responder selectivamente a la combinación tanto de componentes de alta como de baja frecuencia característicos de las voces, ya que al excluir cualquiera de estas frecuencias mediante filtrado, se redujo significativamente la actividad neuronal y la precisión de los sujetos en las tareas de percepción de voz. 

Distintas áreas situadas en el banco superior del STS han sido previamente relacionadas con el análisis de alto nivel de la información acústica, tal como la extracción de pistas relacionadas con el hablante y la transmisión de esta información a otras áreas de integración multimodal y de memoria de largo plazo.

Concluyen Belin et al. que en este estudio las regiones selectivas a la voz fueron encontradas en el STS en los dos hemisferios, pero la selectividad a la voz fue mayor en el hemisferio derecho en los dos primeros experimentos. Sin embargo, no se encontró el mismo patrón en el tercer experimento, lo que sugiere que el sustrato neural de la percepción de la voz puede estar menos lateralizado que en el caso de la percepción del habla.

Conclusión general
Belin et al. concluyen que estos experimentos proveen una fuerte evidencia de que el cerebro contiene regiones que no sólo son sensibles, sino también fuertemente selectivas, a las voces humanas. 

Relevancia de estos hallazgos
Según Belin et al., estos hallazgos delinean un fuerte paralelo con la arquitectura de la corteza visual, donde regiones selectivas de rostros se han observado mediante la utilización de paradigmas similares. Esto reafirma la perspectiva de que las áreas corticales sensoriales pueden compartir principios de organización funcional similares.

En segundo lugar, estos hallazgos podrán permitir nuevas comparaciones entre especies, lo que sugiere que las áreas sensitivas a vocalizaciones de la misma especie podían ser encontradas en regiones homólogas en otros primates. Aunque el lenguaje es probablemente único en humanos -y, por ende, sus posibles precursores evolutivos son difíciles de definir y estudiar en otros animales-, sí compartimos la habilidad de extraer confiablemente las claves afectivas y aquéllas relacionadas con la identidad del sujeto a partir de vocalizaciones específicas de la especie con otras especies, al menos otros primates. 

Finalmente, estos datos extienden el conocimiento actual en la organización de la corteza auditiva humana mediante la identificación de regiones del cerebro implicadas en el análisis de voces humanas, una clase de objetos auditivos de alta ocurrencia e interés ecológico.

Referencia:

Belin P, Zatorre RJ, Lafaille P, Ahad P, Pike B. (2000). Nature, 403 (6767). pp. 309-312.


Comentario
Los hallazgos de Belin y colaboradores permiten, en primer lugar, demarcar un paralelo entre la organización de la corteza auditiva y la de la corteza visual. En segundo lugar, estos hallazgos permiten trazar un paralelo entre algunas características que compartimos con otros primates como la extracción de contenido a partir de las vocalizaciones generadas por miembros de la misma especie, una habilidad sin duda de gran relevancia desde el punto de vista evolutivo.

Bueno, este ha sido mi primer artículo en este blog, el cual creo que tiene un principio muy noble y en realidad está aportando un granito de arena al permitir el acceso a información científica valiosa y confiable al público hispanohablante, una base fundamental para el desarrollo de la sociedad. Por último, espero que así como yo lo hice, otros lectores se animen a participar, comentar y compartir este sitio para que muchas más personas se puedan beneficiar de esta bonita iniciativa. ¡Hasta pronto!


Comentario del comentario
¿Qué les pareció el artículo? Uno sin duda muy influyente al revelarnos la "localización" del procesamiento de la voz humana en el cerebro [parte central del banco superior del surco temporal superior]. Como acabamos de ver, esta entrada no fue realizada por mí, sino por "M.E.A.M.", un miembro del equipo del blog, encargado de la parte de diseño; yo sólo la edité. Así como él lo hizo, otras personas pueden animarse y enviar sus resúmenes o presentaciones, para que otros puedan beneficiarse de ese conocimiento o ideas. M.E.A.M...¡Felicitaciones, gran trabajo!

Finalmente, quisiera contarles que en los últimos días nuestro blog ha experimentado una explosión de visitas de todas partes de Latinoamérica y de muchos otros países alrededor del mundo. Muchas gracias a todos y todas por mantenerse "en sintonía" con esta información. Ah...y, por cierto, hoy estamos cumpliendo 3 meses. Nuevamente, ¡gracias!


¿Más información, preguntas, sugerencias? --> Aquí.

Comentarios