Esta página está en construcción: perdonen los errores y temas inacabados.

This page is being developed: I am sorry for errors and unfinished subjects.

 

VOZ para HABLA y CANTO (incluido en el Libro del Habla de la Poesía y del Teatro )

 

INTRODUCCIÓN

 

Tratamos aquí la voz como instrumento musical. Los aspectos de la voz ligados al habla, la palabra y el canto han sido vistos en otro escrito.

 

ÍNDICE

 

1. Las voces de los animales.

2. Las voces de los seres humanos

3. La voz como Instrumento musical. Tono e Intensidad

4. Las Vocales. Producción

5. Consonantes. Producción

6. El Timbre en la Voz. Espectro y Formantes.

7. Canto

8. Modelo de Producción (Apéndice)

9. Voces Especiales

10. Bibliografía

 

1. Las voces de los animales.

 

La voz es el instrumento primordial del ser humano, como lo es de casi todos los demás animales. Estos se expresan mediante todo tipo de sonidos que conocemos ligados a cada animal: ladrar, barritar, relinchar, rebuznar, mugir, balar, silbar, gruñir, rugir, bramar, aullar, maullar, cacarear, graznar, piar, ulular, arrullar etc.

 

Pero dentro de esos nombres básicos se encuentran una multitud de matices los que, si no llegan a lenguaje, si representa determinadas situaciones del animal: por ejemplo, en un perro pueden distinguirse fácilmente varios niveles de gruñido (impaciencia, irritación, amenaza, ira) , varios tipos de ladrido (airado, de aviso, de petición), de aullido (fúnebre, de miedo), gemidos, toses y bostezos.

 

El canto de los pájaros ha sido una fuente de interés y delicia para los hombres de todas las épocas. Está cercano a la música, al emplear tonos muy puros (por ser agudos, tienen pocos armónicos) que varían rápida o lentamente; por otra parte está articulado como si emitiera consonantes junto con las vocales, dando lugar a patrones característicos. Cada especie tiene el suyo, y dentro de la cada especie, hay cantos de desafío, de amor, de celos, de peligro; es decir signos de expresión y de comunicación.

 

Es decir, el repertorio de sonidos biológicos cubre desde ruidos muy disonantes a sonidos muy consonantes: este es el repertorio sonoro biológico, sin contar sonidos producidos por otras partes del cuerpo ( rozar élitros y patas, golpear maderas, andar, galopar, volar, nadar (por superficie y submarino), arrastrarse, sonarse, escupir, defecar, ventosear, orinar...).

 

2. Las voces de los seres humanos

 

Los humanos tenemos también casi esos sonidos más algunos específicos: el humano llora, ríe, gime, grita, aúlla, gruñe, tose, carraspea, estornuda, sopla, bosteza, eructa, resopla, silba, cuchichea, susurra, chasca, chista, abuchea, suspira, respira, jadea, boquea, ronca, se suena, ... y habla. El habla puede a su vez realizarse de diversas maneras: habla normal, gritando, en voz baja, susurro o cuchicheo, y otras que se verán después, en 9. Del silbido hay varios tipos: sin dedos, a su vez bilabial, labiodental o dental; y con dedos, colocados de diversas maneras.

 

Además puede hacer ruidos imitativos de los demás animales (guau, miaou, be‑e‑e,...), e imitar diferentes ruidos: galope de caballo, golpe, rascado; imitar instrumentos musicales; la voz es un instrumento de enorme versatilidad.

 

Puede además hacer otros ruidos no vocales como los que se citan para los animales. Entre ellos algunos pueden tener utilidad musical.

 

Otros sonidos, voluntarios, se realizan con otras partes del cuerpo, que se asimila a un instrumento musical: palmadas (varios tipos, aguda (con dedos)s y grave (hueco), frotar palmas, castañetas, dedos contra hueco, palmadas en las rodillas, pasos, zapateado; pueden combinarse con los sonidos vocales. Canto con palmadas, con castañetas, etc.

 

La práctica voluntaria de estos sonidos puede hacer notar al comediante su enorme variedad, al tiempo que le enseña a distinguir timbre, variados y expresivos.

 

3. La voz como Instrumento musical. Tono, Intensidad y Timbre

 

El aparato de producción de la voz es un excelente instrumento musical, ya que puede producir sonidos musicales en su más amplios sentido.

 

En la figura adjunta se esquematiza el dispositivo anatómico de la fonación o producción del habla y canto.

 

Se trata esencialmente de un tubo excitado en un extremo, como un clarinete; pero este clarinete tienen unas características que lo hacen mucho más complicado y versátil. Se distinguen .varias partes principales: los Pulmones que adquieren aire durante la Inhalación y lo expulsan en la Exhalación, presionados por el músculo llamado Diafragma.

 
  5 / / / / / / / / / / / / / / / / / / / / / / / / / / / /
  :444444444444444444444444444444444444444444444444447 / / / / /
  5                                                  5 / / / / /
 <‑‑‑‑    c a v i d a d   n a s a l     <‑‑‑ aire     5 / / / / /
 aire                                                5 / / / / /
  :4444444444444444444444444444444444444444447       5 / / / / /
  5 / / / / / p a l a d a r   / / / / / / / /5       5 / / / / /
  5 / / / / / / / / / / / / / / / / / / / / /5       5 / / / / /
  5 labio   /   d,t         l,ll,r,rr    g,j 5 cerr. 5 velo del
  5     644447 6444444444444444444444444444448)))))) 5 paladar /
  * b p *    5 5 cavidad   y  tracto vocal   *       5 / / / / /
  .)))))-    5 5        +))))))))))))),      *abier. 5 / / / / /
             5 5        * d,t l,ll g,j*    m,n,ñ     5 / / / / /
  <‑‑‑‑     948 s      *s            *              9444447 / /
 aire        z          *z   lengua   *                    5 / /
           f 647        * / / / / / / *              647   5 / /
  +))))),    5 5        * / / / / / / *   faringe    5 5   5 / /
  *b,p f*    5 5        * / / / / / / *              5 5   5 / / 
  5 / / 944448 5        5 / / / / / / 9444447        5 / al
  5 labio / /  9444444448 / / / / / / / / / 5 cuerdas5 / esófago
  5 / / /   diente/ / / / / / / / / / / / / :))) ))))< / / / /
  5 / / / / / / / / / / / / / / /   laringe :))) ))))< / / / /
  5 / / / / / / / / / / / / / / / / / / / / 5 vocales5 / / / /
  5 / / / / / / / / / / / / / / 6444444444448   /^\  944444447 /
  5 / / / / / / / / / / / / / / *                *           5 /
/ 5 / / / / / / / / / / / / / / *               aire         5 / /
  5 / / / / / / / / / / / / / / *                            5 / /
  5 / / / / / / / / / / / / / / *        p u l m o n e s     5 / /
  5 / / / / / / / / / / / / / / *                            5 / /
  5 / / / / / / / / / / / / / / 94)))))))))))))))))))))))))448 / /
  5 / / / / / / / / / / / / / / / /   d i a f r a g m a   / / /
 
                                    ESQUEMA del APARATO de la FONACIÓN

 

El aire así expulsado sube por la Faringe, tubo donde se encuentra a medio camino con las Cuerdas Vocales. Estas pueden estar relajadas, con lo que el aire pasa entre ellas sin más, o tensas, en cuyo caso vibrarán: y lo harán con una frecuencia o tono tanto más agudo cuanto más tensas estén. La vibración  consiste en un juntarse y separarse alternativo, que deja o no pasar el aire: este pasa pues a impulsos, periódicamente.

 

Esta primera situación de las cuerdas vocales da pues lugar a uno de los rasgos más importantes a del habla y el canto: el Tono, que ya vemos que puede o no estar presente. Hablaremos pues de sonidos con tono, Sonoros, o  sin tono, Sordos. Pero en realidad, como ahora veremos, la mayoría de los alófonos (realización de los fonemas) de la voz contienen una combinación de ambos sonidos.

 

El tono pues se varía relajando o tensando las cuerdas vocales; existen límites para este efecto, y así la tesitura o rango del tono en la voz hablada no suele pasar mucho de una octava (relación 2:1), alrededor de un Tono Medio, que varía con la persona, edad y sexo. Para hombres este tono medio está alrededor de 130 hz. Para mujeres y niños, una octava más arriba (300 hz. son sólo cifras aproximadas, para fijar ideas).

 

En el canto se amplía artificialmente ese ámbito de una a dos octavas, en casos raros o profesionales más. En general cualquier varón adulto es capaz de cantar la octava Do2‑Do3,  en clave de fa, y cualquier mujer o niño‑niña, la octava central Do3‑Do4,  en clave de Sol.

 

Dentro de cada sexo y edad, hay diferencias naturales que como sabemos dan lugar a las diferentes Voces o Tesituras, del grave al agudo, Bajo, Barítono, Tenor, Contralto, Mezzo soprano, Soprano.

 

Para hacer cantar a una persona hay que determinar su tesitura normal, natural, que será aquella en la que se encuentra confortable. Una manera es medir su tono medio de voz, ampliándolo a ambos  lados una cuarta o quinta.

 

El canto en grupo precisará encontrar una tesitura común a todos, si es posible. Si no, unos saltarán a la octava (monofonía) o se repartirán en voces (polifonía).

 

En cuanto a la Intensidad de la voz, depende del flujo del aire pulmonar, que hace oscilar más o menos las cuerdas (aunque sea a una misma frecuencia), y las cantidades de aire discontinuo que pasa son mayores. asimismo varía entre sonidos con tono y sin tono. Es decir, dentro del habla normal hay grandes diferencias de intensidad, más de 50 db. En el canto, donde además de esa variación de introducen variaciones adicionales como matices ( de ppp a fff), el rango total es mucho mayor, quizá de 100 dB (por eso, sólo modernamente se puede grabar la música y canto en su rango real, con la grabación digital (CD, DAT, etc) que ha llegado a esas cifras de relación dinámica en las últimas décadas).

 

Hay límites entre esta variación adicional de intensidad, que no deben forzarse pues se corre peligro de estropear la voz. Sobre todo en los niños de tono medio cambiante y voz en formación. Creemos que no debe intentarse formar a los niños de primaria como cantantes profesionales: sería una afectación y una predeterminación de su canto espontáneo.

 

Por otra parte, hay que recordar que al aumentar la intensidad aumenta también el espectro de excitación del tracto vocal, es decir, las frecuencias que se envían a ese tracto, mayor componente de agudos (voz más penetrante, estridente, incluso chillona) cuanto más fuerte.

 

Es decir, al variar la intensidad, también variamos el Timbre, al igual que al variar el Tono, pues varían también esas frecuencias enviadas (múltiplos del fundamental). Así que aunque bien diferenciados en concepto, en la práctica hay una dependencia mutua entre los tres rasgos, Tono, Intensidad y Timbre.

 

4. Las Vocales. Producción

 

Las Vocales son los sonidos y alófonos en los que el aire no encuentra obstáculos importantes para salir al exterior por la boca. Son pues los alófonos Sonoros por excelencia, primordiales en el Canto. Si  se produce una vocal, pero abriendo el Paladar Blando que deja pasar el aire también a al Cavidad Nasal, el sonido y alófono es una Vocal Nasalizada.

 

La distinción de las vocales entre sí se debe a la diferente disposición que el resto de la boca y nariz toma para producirla.

 

El primer y más grande elemento móvil en la producción de vocales es la Mandíbula, es decir, su abertura, que da lugar al correspondiente tamaño de la cavidad Cavidad Vocal. Si está abierta, se producen las vocales Abiertas, como la [a]. En castellano sólo de dispone del fonema abierto [a], pero en el habla los alófonos de la [a] y de otras vocales tienen diferente grado de apertura. En francés se escribe la e abierta [è].

 

Cerrando más la boca, se encuentran gradualmente la [e] y [o], en posición media, y la [i] y [u], en posición cerrada.

 

La distinción adicional entre [o] y [e], por un lado, y entre [i] y [u], por el otro, viene dada por la posición de los Labios, que pueden  cerrarse en un redondel, para [o] y [u] o abrirse, para [e] y [i]. Tenemos pues que Mandíbulas y Labios pueden producir las Vocales del Castellano y otras lenguas románicas.

 

              cerrada    mandíbula   abierta  

      Hz. +))))))))))))))))))))))))))))),

          /                               *

    2500  /    i                          * delantera

    2000  /              e                *

          /                               *

 formante /           neutra              *

 2  1200  /                       a       * lengua

          /                               *

          /                               *

     600  /              o                *

     500  /    u                          * trasera

          /                               *

          .22222222222222222222222222222

              300     400       800   Hz 

                      formante 1

 

TRIANGULO VOCÁLICO. Los Alófonos Vocales del Castellano.

 

Si representamos en dos dimensiones ambos efectos,  nos encontramos con el triángulo vocálico, que tienen la virtud de presentar el grupo de  vocales de acuerdo con su producción, de su contenido frecuencial (timbre) y de su percepción por el oído. Es un mapa de alto contenido expresivo y educativo. Veámoslo.

 

Hemos representado además un alófono que se realiza muchas veces en la producción: es el sonido Neutro, representado en ingles mediante una 'e' invertida. Se produce hacia el medio de las demás vocales, dejando la boca un relajada, sin pronunciar ninguna vocal concreta.

 

5. Consonantes.  Producción

 

Las consonantes son un grupo de alófonos más complejos en su producción que las vocales. Mientras que estas son sonidos estacionarios, es decir, que permanecen sensiblemente igual durante su emisión,. las consonantes en general contienen elementos, tramos transitorios, producidos mediante movimientos complicados. Veámoslas, partiendo de las simples y yendo a las complicadas.

 

 Las Fricativas son también estacionarias, pero no sonoras, sino sordas: se produce un ruido al pasar el aire a gran velocidad por una pequeña constricción: ésta puede producirse colocando la lengua en algún punto especial:

 

Si se coloca sobre los dientes cerrados, se obtiene la [s]. Si se saca entre los dientes, algo separados la 'z' española, escrita en fonética como [ q ]. Si es el labio inferior el que pasa entre los dientes, como si fuera a ser mordido, la [ f ].

 

Si se añade una cierta sonoridad (como sabemos vibrando las cuerdas vocales) pueden sonorizarse estos alófonos: se producen así la [s] sonorizada (producida en castellano al decir [las gotas], por ejemplo), que representamos aquí por [$]. La [f] sonorizada es la 'v', como en francés 'vache'; este sonido ha desaparecido del castellano (su pronunciación es una afectación y un anacronismo), pero no de otras lenguas nacionales. La [z] sonorizada da lugar al alófono [ d [, que aparece al realizar el fonema [d]  entre vocales, como [cedo] (ver más abajo).

 

Si la lengua se coloca tocando el paladar tan atrás como sea posible, se produce el sonido sordo 'j' española, escrita en fonética como [x].  Si se sonoriza, el alófono [g]  de la 'g' escrita, como en [pego].

 

Las Nasales se producen abriendo el velo del paladar para que el aire pase al la cavidad nasal, y cerrando al tiempo la boca: el sonido pues es exclusivamente nasal (pruébese a cerrar la nariz con los dedos durante una [m]: el sonido se extingue al momento, con cierta sorpresa del hablante poco avezado en fonética.

 

Las Líquidas son la [l] y la [l], aunque la segunda está desapareciendo del castellano, y sólo se conserva en Castilla la Vieja. Se pronuncia la [l] colocando la lengua en el centro del paladar, pasando el aire por los lados. La [ll] es parecida, pero hay una oclusión, un golpe, debido a una oclusión, un momentáneo contacto total, con cierre, de la lengua en el paladar.

 

Las Vibrantes son un caso especialmente interesante; podemos considerarlas como una vocal a la que se superpone una vibración lenta (unas 10 o 15 veces por segundo) de la lengua; es una oclusión alternativa no llega a ser oída como tono (aunque es vibración) debido a esa baja frecuencia. En la [r] simple hay una sola brevísima oclusión. En la doble, dos o más, el nombre alude a la producción, por lo tanto. La oclusión de realiza en un lugar cercano al de la [l]: y en algunas lenguas (como el chino) ambos sonidos son considerados el mismo; de ahí la indiferencia a su pronunciación en las personas de ese origen: eligen la forma más sencilla de ambos [g]  la 'g' escrita, como en [pego], que veíamos antes.

 

Sólo nos quedan algunos sonidos compuestos (o más compuestos aín), como los sonidos de las letras 'x', la 'ch' y la 'y' consonante. En realidad la primera es una combinación de dos sonidos ya vistos,  [ks]. La 'ch' es una oclusiva compleja en la que la lengua toma contacto con casi todo el  paladar, no con una parte. La 'y' en 'ya' es un sonido intermedio entre 'ch' y 'll', habiéndole sustituido en el castellano corriente ( en Madrid se dice 'Seviya' y no 'Sevilla').

 

He aquí un cuadro con los principales alófonos‑sonidos del castellano.

 

Así en las oclusivas hay varios tramos sucesivos en el tiempo: 1. la Oclusión, que cierra el paso del aire. 2. el silencio momentáneo. 3. la Explosión, ruidosa como todas ellas.

 

Esta explosión consta de una subida y una bajada sucesivas del ruido (el rebote) tras lo cual enlaza con el alófono siguiente, una vocal habitualmente.  En las oclusivas sonoras una parte del silencio que es sonoro, como decíamos, y que si la oclusiva es corta, puede llenar todo el silencio de sonoridad. Ya vimos que también en las nasales hay  oclusión de la boca, pero pasa desapercibida la abrir al tiempo la cavidad nasal.

 

En cuanto a su estacionareidad o transitoriedad, podemos agrupar los alófonos en:

 

1. Sonoros estables

              a, e, i,  o,  u,  â,  ê,  î,  ô,  û,  m,  n,  ñ,  l, 

2. Sordos estables.

              f,  q,  s,  $,  ‑(silencio)

              b d g 

 3.  Inestables:

              j,  c,  r,  R, l   

              p,  b,  t,  d,  g,  k

 

                  

                  +))))))))))))))))))),

TIPO               *                     *

                   *                     *

Vocales normales   *   a e i o u  Ne     *

       nasalizadas *   â ê î ô û         *

Nasales            *   m n ñ             *

Liquidas vibrantes *   l ll r R          *

Oclusivas   sordas *   p t k c j         *

            sonoras*   b d g             *

Fricativas  sonoras*   b   d   g  $        *

            Sordas *   q f x  s          *

                   .))))))))))))))))))))-

 

LISTA DE ALÓFONOS CASTELLANOS

 

Además de las cuerdas vocales, el elemento móvil más importante es la Lengua, como acabamos de ver: participa en casi todas las consonantes y también en las vocales; en estas no ocluyendo, pero sí creando cavidades específicas según su posición en el tracto o cavidad vocal. Al hablar del timbre y los formantes se comprenderá  mejor su función.

 

Una manera excelente de tomar contacto y comprender y aprender todo lo anterior es practicar la pronunciación de todos esos alófonos, escuchando y sintiendo concentradamente, mientras que se pronuncia. El hablante habitual no es consciente de todos estos matices de la pronunciación (ni falta que le hace para hablar). Pero el cultivo específico de la voz como instrumento obliga a volver conscientes estos sutiles mecanismos de producción del habla.

 

Hay que decir que las diferencias de pronunciación entre las variedades regionales del castellano (Andalucía, Extremadura, Aragón), hacen estas categorías algo difusas. Por ejemplo, el andaluz puede pronunciar la 'z' con sonido [s]. Y no digamos las pronunciaciones del español sudamericano, con variedades extensísimas según el área. La [r] argentina, por ejemplo, está cerca de la 'y' nuestra. Y así mil matices más. El español es ahora una lengua muy extensa, universal, y admite grandes familias en su seno.

 

6. El Timbre en la Voz. Espectro y Formantes.

 

La característica más acusada del instrumento Voz Humana es su carácter politímbrico. Mientras que un piano es siempre un piano, la voz tiene situaciones tímbricas variadísimas. Precisamente la larga exposición (podría serlo mucho más) que antecede sobre la pronunciación de los diversos alófonos, es un catálogo de timbres disponibles en ese instrumento. La cadena hablada en una sucesión de timbres variadísimos, unos sonoros, otros sordos, unos predominantes otros raros.

 

Pero en donde reside el carácter distintivo de cada alófono. El de las consonantes sordas son ruidos, con su importancia tímbrica es o ha sido hasta ahora considerado menos importante (ver tema A.18  para matizar esto); son como divisiones o fronteras entre partes sonoras, es decir, primordialmente las vocales. La consonantes más bien Articulan, Organizan y Conectan entre sí las Vocales.

 

El timbre vocálico, es decir su causa física, reside como decíamos en la diferente configuración de los tractos vocal y nasal, conseguida al mover labios, mandíbula, lengua, velo del paladar, lo que llamamos Parámetros Articulatorios. El tracto vocal es esencialmente un tubo con ensanchamientos, no cilíndrico. Y los ensanchamientos producen unas resonancias especiales en zonas de frecuencia fija; o sea, las frecuencias que llegan procedentes de la vibración de las cuerdas vocales son atenuadas o potenciadas según estén situadas en estas zonas o no. Estas zonas son llamadas Formantes.

 

Si contemplamos el espectro de una vocal, veremos unos picos en los Formantes. Los numeramos a partir de la frecuencia 0, y tran análisis de percepción de ha comprobado que los más importantes, los decisivos para diferenciar vocales entre sí son los dos primeros.

 

 El Primer formante está ligado como, veíamos más arriba, a la abertura de la mandíbula, abierta para [a], media para [e, o], cerrada para [i, u] Las zonas de frecuencia varían correlativamente desde 800 hz ([a]) a 300 hz. ([i , u]).

 

El segundo formante está ligado a la posición de la lengua, trasera en [u] y [o], media en  [a], y delantera en [i] y [e].  Las frecuencias del formante va desde 500 a 2500 hz.

 

En el triángulo vocálico está representados también estas frecuencias, en relación con los parámetros articulatorios. El sonido Neutro tiene unos formantes situados hacia 500 y 1500 hz, que corresponden más o menos a un tubo cilíndrico

 

La Nasalización de las vocales, debida como veíamos a la apertura del velo del paladar, produce además un Formante adicional ancho y bajo, en las cercanías de 1000 hz.

 

Véanse en las figuras adjuntas el espectro y los armónicos de una vocal [e] sintetizada artificialmente, para dos tonos diferentes. Los armónicos 'llenan' el espectro como múltiplos del fundamental, correspondiendo al pico del formante unos u otros armónicos segun el tono. Véase también esta situación en una evolución del espectro de una vocal natural.

 

7. Canto

 

El canto significa un forzar el tono natural de la palabra para cubrir más tesitura o extensión del tono.

 

Desde el punto de vista tímbrico, esto supone adecuar también, forzar la posición de los formantes para que no queden por debajo de la frecuencia del tono: si el fundamental es 400 hz, la [u], cuyo primer formante está por debajo ( 300 hz.), no podrá ser cantado de igual manera. Pruébese a cantar una [u] en tono grave, y, dejando la boca inmóvil, súbase el tono al agudo: el timbre queda velado, y para conseguir la [u], hay que predisponer la boca. El tracto vocal, pues, se adapta al tono.

 

Esta adaptación es más severa en mujeres y niños, de tono natural alto (300 o 400 hz).

 

Existe además en el cantante culto profesional varón, un formante adicional intenso producido hacia los 2800 hz, llamado el formante del Canto. Su finalidad es destacar esa zona de frecuencias sobre el espectro de la orquesta, no intenso en esa zona. Se destaca así la voz, pudiendo competir un sólo cantante con una gran orquesta. La cantante, mujer, y el niño o niña no precisan tanto ese formante. Y desde luego, en la música popular e infantil, con pocos o ningún instrumento, esa adaptación tan tecnificada no es necesaria.

 

Los timbres de las músicas folklóricas son muy ricos, y variados: el rajao del flamenco, el sonido metálico y perlado de la voz femenina rusa, el nasal de la música india. En canciones más primitivas, africanas, de los indios americanos, de los aborígenes australianos, hay multitud de matices que hay que oir con cuidado. La audición es muy importante, no caben partituras.

 

8. Modelo Técnico de Producción de la Voz.

 

Espectro-peine de una vocal, mostrando armónicos (líneas de frecuencia)  y formantes (picos de la envolvente)

 

Veamos algo más técnicamente la producción de sonidos del habla, utilizando terminología y conceptos de Tratamiento de Señales, en Ingeniería Eléctrica.

 

Como es bien conocido, toda señal periódica puede ser considerada como una suma, finita o infinita,  de funciones sinusoidales (armónicos) con frecuencias múltiples del inverso del período de la señal en cuestión ( Serie de Fourier). El espectro constituye una serie de rayas equidistantes (espectro peine) (tema A.13.)

 

Las señales de las vocales y otros fonemas sonoros son cuasí-periódicas en un cierto intervalo de tiempo ( como 80 ms.) , y  admiten a su vez un análisis basado en el anterior, la Integral a  Corto Plazo de Fourier (Short‑Time Fourier Integral, cuyo cálculo rápido es llamado FFT, fast Fourier Transform) que  proporciona un espectro similar al anterior pero con "púas" más  gruesas, debido a la indeterminación inherente a la limitación temporal del análisis; no obstante es costumbre llamar también armónicos a estas componentes, costumbre que seguiremos. Puede admitirse a priori que el oído humano no es demasiado ( pero sí algo) sensible a diferencias de fases, así que nuestra preocupación está limitada a las amplitudes relativas de las componentes sinusoidales.

 

El interés de este Espectro a corto plazo reside en que el oído realiza un análisis similar, a tramos: selecciona plazo, analiza, percibe, y así sucesivamente.

 

Como decíamos, se atribuye ese timbre vocálico a la presencia preponderante de energía en algunas bandas de frecuencia, llamadas formantes, específicas para cada vocal. Estas preponderancias son producidas por segmentos anchos en el conducto o tracto vocal, de modo que el modelo de formantes es a la vez productivo y perceptivo.

 

Multiplicando el espectro peine citado por una función de transferencia con tales formantes, una especie de curva suave, con picos, tenemos un modelo apropiado del espectro del alófono de un fonema sonoro. Véase la figura donde aparece el espectro con sus formantes y el peine que es modelado por él.

 

La señal de voz es generada en el tiempo como una suma de armónicos de un fundamental, cambiante a su vez, aunque lentamente frente a la variación instantánea de la señal. Este fundamental corresponde a la tensión de las cuerdas vocales, traducido perceptivamente como el tono (pitch) de la vocal. Aunque no se trata por lo tanto de armónicos estrictos, el modelo queda validado por la percepción, que atribuye carácter sonoro (con tono) a este tipo de señal, tanto en las vocales naturales como en las artificiales (figuras).

 

Las amplitudes de estos armónicos corresponden a su vez a un espectro suavizado (envolvente) que refleja a su vez las zonas frecuenciales que la forma del tracto vocal potencia o atenúa. Este espectro será considerado constante en nuestro modelo, por lo que los armónicos, cuya frecuencia es variable con la del tono (múltiplos), adquieren una amplitud variable en el tiempo, por corresponder a diferentes puntos de este espectro constante (fig vvvv ). Esta constancia del espectro viene sugerida por la teoría tímbrica general de percepción ligada a bandas fijas (formantes), pero se sabe que hay una cierta interdependencia de los formantes y el tono.

 

Este modelo simplifica un modelo más preciso de la producción, al fundir en el espectro envolvente tanto el correspondiente al tracto vocal como el de la excitación de las cuerdas vocales, que es a su vez cambiante, al cambiar la forma de onda según la frecuencia y la intensidad; en particular con esta última, intensidad suave utiliza forma de onda parecida a la sinusoidal, pobre en armónicos superiores, mientras que intensidad fuerte implica forma de cuasí diente de sierra, rica en esos armónicos. Además, la independencia aproximada de la forma de onda excitadora respecto al tono, representa una compresión o extensión (homotecia) en frecuencia al variar éste; la envolvente es así diferente y nuevamente se niega la constancia de la envolvente debido a la fusión excitación‑tracto antes aludida.

 

Por otra parte este modelo cuasí-estacionario falla en todas las transiciones muy rápidas, como principios y finales de vocal, que dan lugar a transitorios cuya percepción es en principio diferente, ligada quizá a la envolvente temporal.

 

9. Voces Especiales

 

La voz humana, dentro del canto admite varios estilos o modalidades especiales, junto a las habituales.

 

Primeramente recordaremos todos los matices de canto que conocemos: ópera, lied, rock, balada, blues negro, salsa, bolero, flamenco, copla, cosaco, etc. Cada una utiliza recursos diferentes con resultados expresivos diferentes.

 

Una curioso canto es el Canto Armónico: mediante una escucha analítica cuidadosa, pueden percibirse los armónicos de la voz por separado; potenciando uno de ellos a la melodía usial, ligada la fundamental, se suma otra, la que forman los armónicos sucesivos de esos fundamentales: como el número de armónico puede cambiar, tenemos una doble melodía perfectamente audible. Incluso pueden conseguirse más voces.

 

Relacionado con lo anterior está el pequeño instrumento llamado Arpa Judía: al colocarlo contra los dientes la vibración de la lengüeta es trasmitida al tracto vocal: al modificarse este, se potencia uno u otro de los armónicos, con lo que se consigue una melodía se armónicos de un mismo fundamental; también puede describirse como un timbre vocal cambiante, fuertemente rítmico, en el que la vibración excitadora no la hacen las cuerdas vocales sino la lengüeta del instrumento.

 

El ventrílocuo, consigue, como su nombre indica, las resonancias formánticas en el vientre, con lo que no necesita mover la boca para conseguir una cierta habla inteligible. asimismo el operado de garganta, sin laringe, puede hablar con voz que sale de un orificio bajo el cuello sin vibración de cuerdas vocales extirpadas.

 

El Susurro consiste en colocar normalmente los tractos vocal y nasal, pero no vibrar las cuerdas vocales: en ese caso, todos los alófonos son sordos: pero los tractos 'colorean' suficientemente esos susurros, de modo que se reconocen perfectamente a cuales sonoros pertenecen. Los que ya eran sordos, claro, no experimentan variación.

 

10. Bibliografía

 

FANT, G. Vowels, Production and Perception, Royal Institute Tech. Stokholm,1975.

FLANAGAN, J.L. Speech Analysis Synthesis and Perception, Springer‑Verlag, Munich,1972.

FLETCHER, H. Speech and Hearing in Communication. Van Nostrand, NewYork,1953

FERNÁNDEZ, S. Gramática Española. V2: Los sonidos Arco, Madrid 1986.

QUILIS & FERNÁNDEZ Curso de Fonética y Fonología españolas, C.S.I.C., Madrid, 1972

SÁNCHEZ, F.J. Tratamiento... estimación rasgos prosódicos. Tesis doctoral, ETSII Madrid, 1979.

 

 


Vuelta al Principio    Última actualización: Thursday, 21 de February de 2013    Visitantes: contador de visitas