Modelo de recitación humana y ma

INTRODUCCIÓN.

La prosodia constituye un aspecto esencial del habla, parcialmente reflejada por la puntuación en la escritura. Dentro de la prosodia, la entonación muestra, enseña, hace la sintaxis, los acentos, la modalidad de frase, la pragmática y por tanto los finos matices del significado. Un modelo útil del habla, especialmente el que implementa un sistema automático de síntesis, debe comprender e incluir las complejas reglas que gobiernan la prosodia, especialmente la entonación. En un nuevo giro de tuerca, la métrica añade una nueva componente, artística en este caso, asimismo sólo parcialmente comprendida, lo que hace aún más difícil el modelo, y su aplicación en la síntesis automática.

Nos hemos acercado a estos problemas comparando dos métricas diferentes: una acentual, del tipo de las lenguas modernas occidentales (inglés, italiano, español, etc); la otra del estilo de algunas de las más venerables de las antiguas (sánscrito, griego, latín arcáico) y otras no menos importantes de las modernas como el árabe y el persa. Hemos centrado el estudio en el español (castellano) y persa (farsi), como representantes de cada una de esas métricas. Para ambas hemos buscado un modelo, en parte común, que permita generar habla poética, es decir, habla con métrica artística, a partir de los textos escritos. Todos los rasgos prosódicos del habla, tono (altura), timbre (valor fonético), intensidad (volumen), cantidad (duración de los tramos fonéticos) deben ser considerados para producir una elocución fiel de una hipotética habla poética ideal, en un delicado balance y compromiso. Además, las reglas que gobiernan estos rasgos tienen diferente cobertura temporal (de frase, de sintagma, de alófono, etc).

El estudio mostrará el acercamiento al problema, la metodología empleada para resolverlo y el estado actual de nuestro empeño. Mostraremos sucesivamente, una descomposición analítica del habla, su reconstrucción para recitado, ejemplos en ambas lenguas y los algoritmos y métodos de análisis y síntesis empleados.

NOMENCLATURA

En lo que sigue emplearemos los símbolos siguientes:

larga corta

Vocales: acentuada â á

no acentuada â a

Alófonos: largo o | corto

Sílaba versal: larga - 7 corta

marcada BAN ban no

separadores │ (SP, espacio)

Entonación: subida / \ bajada

Limitadores: texto: " " sonidos: [ ]

pies métricos: / / general: SP

Consideramos sílabas versales a las formadas en el verso, tanto debidas a las ligaduras habituales en todo habla, como debidas a imposiciones métricas, que reorganizan específicamente la cadena silábica (p.e. "Mira la onda" / [mi ra laon da]).

En cuanto a la transliteración del persa, empleamos un acercamiento a su pronunciación generalmente aceptado, afín a la lengua inglesa: vocales con su valor habitual, si bien largas o breves (ver arriba), consonantes comunes a inglés y español, [ b, f, k, l, m, n, p, s, t, r ], (la r es doble pero suave), sonidos similares en castellano [ j, kh, gh ], los sonidos th=[θ], gh=[γ], bh=[β ], dh=[δ ], ch= [t! ], y otros presentes en otras lenguas nacionales [z, sh, v, h ] . Aparece además @, vocal neutra (schwa) con papel métrico de relleno de sílaba corta y "'", oclusión glotal vocálica. Empleamos también ocasionalmente el Alfabeto Fonético Internacional (IPA) para transliteración española algo más fina.

PROSODIA. MODELO DE MÉTRICA ACENTUAL

Cuando hablamos, ocurren muchas cosas, pero desde el punto de vista acústico podemos decir que se producen cambios en aspectos acústicos perceptivos que llamamos "rasgos"; rasgos que presentan una relativa independencia, puesto que podemos cambiar uno, manteniendo fijos los demás. Estos rasgos son: tono o altura, intensidad o fuerza, timbre o color. Si mantenemos unos instantes constantes esos rasgos o al menos alguno de ellos, cambiando, pues, bruscamente en los extremos de ese rato, tenemos un suceso sonoro, o unidad, de la que puede medirse la duración. A esa duración la llamamos cantidad, lo cual constituye otro rasgo, pudiendo entonces considerar el transcurrir sonoro como una cadena de unidades fónicas, dotados de esos cuatro rasgos.

A partir de estos cuatro rasgos que afectan a esas unidades, podemos crear oposiciones entre unidades vecinas, siendo entonces la cadena fónica una sucesión de unidades sonoras que contrastan entre sí en uno o varios de estos rasgos. Por ejemplo, en la palabra "domingo" podemos considerar la cadena de sonidos (alófonos): [ d o m i n g o ] y, simultánea con ella, la cadena de tonos: _ - _ , la cadena de duraciones alofónicas: | o | o | | o y la cadena de duraciones silábicas: / 7 - 7 /.

En general, toda recitación debe dar cuenta de los niveles lingüísticos habituales de toda habla, y además de algunos específicos del habla poética. Empezando por los gramaticales, los más elevados, debe 'decir' las frases que incluye y sus relaciones sintácticas (coordinaciones, subordinaciones, epítetos, paréntesis, anáforas, catáforas, deícticos; y modalidades, como preguntas, afirmaciones, invectivas, etc.) (Sánchez, 1989).

Ambientando esta producción, por decirlo así, se encuentran todas aquellas modulaciones no bien establecidas, que expresan actitudes y sentimientos: duda, temor, deseo, angustia, ironía, amor, júbilo, etc., las cuales, una vez formalizadas, pueden incluso dar lugar a géneros poéticos diferentes (elegía, ditirambo, epigrama, himeneo).

Descendiendo a las unidades dentro de la frase, encontramos el sintagma simple o palabra sintagmática (PS), la cual, además de su valor organizativo, presenta un punto (ocasionalmente dos) culminante, que constituye el acento sintagmático. Por cada PS hay un acento: ‒yó sóy ése‒, ‒el niño nació‒. Como es sabido, este acento sintagmático coincide con el léxico, en general, pero es menos numeroso, al absorber el principal vocablo de la PS los acentos de los demás ‒[entre núbes]‒ (Véase G. Calvo, 1979).

Estos acentos suelen atribuirse a una vocal situada a su vez en la llamada sílaba, grupo fónico con valor de suceso o golpe discreto, separado de los sucesos vecinos, con los que forma una cadena, la cadena silábica. El acento, pues, marca unas sílabas respecto a otras, creando una oposición, fonológicamente relevante a veces, como en español, o no, como persa (en realidad, esa relevancia se da también en esta lengua, aunque con mucha menos frecuencia que en español. Como ejemplo: [delavarí] = heroísmo, [delavári] = un héroe ) .

Esta cadena de sílabas contrastantes, marcadas y no marcadas, forma, como es sabido, la materia prima del ritmo, hecho, como se ve, ligado a las marcas sintácticas (acentos), pero constituyendo también un fenómeno percibido en sí mismo, con profundo efecto psíquico: el ritmo "encanta", tanto en el sentido de placer, como en el de captación mágica de la psique humana (e incluso la animal).

La independencia rítmica se da, también, formalmente, porque aunque el acento es el creador de la marca rítmica, hay una tendencia espontánea a alternar marcas cada dos o tres sílabas, lo que hace que en ocasiones, sílabas acentuadas queden sin marcar e inversamente marquemos algunas no acentuadas. Por ejemplo, en el heptasílabo. "Luz es, luz inocente", tenemos acentos sintagmáticos en │lúz│és│lúz│i│no│cén│te│. Pero no pudiéndose marcar sílabas contiguas (excepto creando moras intermedias), pues la marca se basa en el contraste de énfasís con el entorno, deberemos sacrificar unos acentos frente a otros; el criterio para ese sacrificio vendrá dado, bien por versos anteriores: │hu│ MÁ│ noes│ TÁE│ se│ FUÉ │ go│, bien por la citada alternancia del dos o tres (García Calvo, en prensa), bien, posiblemente, por una evaluación no consciente de la importancia jerárquica de los acentos en conflicto. En todo caso, la elección mayoritaria parece ser: │luz│ ES│luz│I│no│CEN│te│, aunque la sílaba marcada │I│ parece percibirse como marca secundaria respecto a a las de │ES│ y│CEN│; incluso podemos atrevernos a ordenar jerárquicamente las marcas como 2 3 1.

MODELO DE MÉTRICA CUANTITATIVA

Si pasamos ahora a la métrica propiamente dicha, aquella en la que las sílabas marcadas lo son mediante un incremento del rasgo cantidad (largas vs cortas), la independencia es aún mayor. En efecto, lenguas como el griego y latín antiguos (Crusius,1951) y el árabe y persa actuales (Batmanglij,1988, Steingass,s.a, Shamissa, 1987), emplean, como es sabido, metros compuestos de pies, que a su vez están compuestos de agrupaciones de sílabas breves y largas. Aquí el hecho sintáctico no interviene mayormente, es decir, el hecho síntáctico, con su entonación correspondiente, no intefiere en una métrica que no emplea ya ese rasgo, el tono del acento, para marcar sílabas.

Por lo anterior, queda clara, creemos, la relativa independencia del hecho rítmico frente al sintáctico y gramatical en general.

REALIZACIÓN LINGÜÍSTICA Y MÉTRICA MEDIANTE LOS RASGOS DEL HABLA

Como decíamos, desde el punto de vista acústico-fonético, el habla, incluido el verso, es una variación en el tiempo de los rasgos perceptivos timbre, tono, intensidad y, una vez segmentado en tramos ese continuum acústico mediante variaciones de estos tres rasgos, cantidad (duración). Consideramos pues, el habla como una cadena de eslabones dotados de cuatro rasgos. Estas unidades corresponden, aproximadamente, a las realizaciones sonoras de los fonemas, es decir, los alófonos, que llevarán, entonces, añadidos al timbre, los otros tres rasgos.

A su vez, las oposiciones tímbricas entre alófonos contiguos producen unidades de orden superior: las sílabas, típicamente producidas por una pareja de alófonos, el primero más corto, más sordo y ruidoso que el segundo: el par CV (consonante - vocal).. La sílaba es pues una especie de pie tímbrico, tomando prestado el término métrico. Estas sílabas adquirirán de sus componentes alofónicos los rasgos tono, intensidad y duración, centrados éstos en la vocal, núcleo silábico. Como ya se vio, estas sílabas son organizadas entre sí, marcando unas frente a otras, y dando así lugar a metros y ritmos, sobre todo en el habla poética.

Pero siguiendo con la reconstrucción sintética del habla, encontramos una nueva unidad, marcada mediante variaciones de los rasgos, la PS, unidad sintáctica. Ésta está formada por un núcleo dado por una palabra léxica con significado, como sustantivos, adjetivos, verbos, adverbios, acompañada por índices sin significado propio, como el artículo, las preposiciones, conjunciones, posesivos, etc. (ej. "de los bosques, "a mi vera", "buen amigo", etc.). La peculiaridad de estas PS reside en venir marcadas por un sólo acento (excepcionalmente acompañado de otro, secundario o dominado), acento éste sintagmático que coincide con el acento léxico de la palabra con significado. Esta característica uniacentual de las palabras sintagmáticas parece darse de forma general; por ejemplo:

ESP:     "de los bosques"          [de los bóskes]

FR:       " du bois"                     [dü buá]

ING:     "from the forest"          [from the fórest]

PER:    " G'k[ ch "                     [az jangál ]

De modo que la estructura sintáctica de la frase vendrá marcada por la concatenación de varias palabras sintagmáticas que presentan cimas acentuales y se unen entre sí por sus valles: "vengo de los bosques", [/bén\go|δeloz/βós\kes]. Y en persa, .LdHDl G'k[ ch de igual significado, se pronuncia [az jangál mîâyám], dos acentos también. La frase aseverativa: nkh,oDl Inkv. (el pájaro canta) se pronuncia [parandé m│î khânad], de modo que el metro natural es /v - v - - -/ mientras que la acentuación es [ - - ' -' -], no coinciden. Si la frase es interrogativa: ?nkh,oDl Inkv. ()Canta el pájaro?), se pronuncia: [parandé m│îkhanad? ]: con dos acentos no ambos coincidentes con las largas. La frase 0?nkh,oDl ch,H Inkv. ()Canta canciones el pájaro?) se pronuncia: [parandé âv│âz m│îkhanad? ]: el metro es /v - v - - - - -/ mientras que la acentuación es [ - - ' - ' - ' - ]: largas y breves quedan acentuadas, indistintamente.

Parece pues que en la métrica persa el acento tiene una función sólo sintáctica y por lo tanto no interfiere con la métrica de cantidades: el acento no tiene que ver con la métrica. Más adelante veremos que sí tiene que ver, sin embargo, con la rítmica.

RECITACIÓN de ACENTOS y MARCAS

Según muestran un oído analítico (es decir, desconectado de la lengua) y el análisis automático, la naturaleza acústica del acento reside principalmente (a diferencia de algunas ideas generalizadas) en las elevaciones de tono, y concomitante, pero secundariamente, en énfasís de los restantes rasgos, incluido el timbre (más claro y marcado, es decir alejado de la "schwa" [@] o vocal neutra).

Si a estas entonaciones superponemos aquellas, bien codificadas, propias de la modalidad (afirmación, interrogación, mandato), operativas sobre todo al final de la frase, tenemos así construido un modelo acústico de una frase hablada.

A este modelo que podemos llamar neutro, es decir, desprovisto de intención y actitud por parte del hablante, habría que añadirle las entonaciones correspondientes a las diversas emociones, origen social, regional y nacional, los subentendidos, la intencionalidad, la pragmática, en suma, de que todo habla concreta está siempre dotada; pero, naturalmente, estas sutilezas no pueden entrar en un modelo automático desprovisto de comprensión semántica del texto, si bien pueden ser añadidas (manualmente). Hasta aquí, el tratamiento de tono.

Entremos, ahora, en el dominio temporal. Puesto que concebimos el continuo sonoro como una cadena de elementos discretos, habrá que dotar a esos elementos de una duración o cantidad que ocupe parte del habla: la duración de la locución se repartirá entre las unidades de la cadena.

Considerando las unidades más pequeñas, los tramos alofónicos, dotaremos a las consonantes con cantidades más pequeñas, en general, que las vocales, en proporciones dadas por análisis previos

Pasando a los tramos silábicos, deberemos considerar diferentemente los casos de métrica acentual o cuantitativa. Para la primera dotamos, en general, a las sílabas acentuadas, de más duración, ya que vimos que la cantidad era un rasgo concomitante del acento, en español y lenguas afines.

No obstante, para aquellas sílabas marcadas rítmicamente, pero no acentuadas, disociamos tono y cantidad, manteniendo el tono ligado al acento, y reservando la cantidad para la marca rítmica, único modo de ser simultáneamente fieles, a la prosodia por un lado, y a la métrica por otro. Escribiendo los acentos y sólo las marcas no coincidentes:

│ when lóf ty trées i sée bá RREN of léaves│                  (Shakespeare. Soneto xii.l.5)

│ múSIC to hÉAr, why héars't thou músic sádly?│           (Shakespeare. Soneto xii.l.1)

│ vérDE ruBÓR hoy BÓga│                                       (Aleixandre. "La Tierra")

RECITACIÓN de MÉTRICA CUANTITATIVA

En el caso de la métrica cuantitativa, como la persa, es la cantidad propiamente, la creadora (marcada versus no marcada) de la métrica. Las cantidades de las sílabas vienen aquí ligadas a la propia lengua, donde la cantidad es fonológicamente relevante (acompañada esta cantidad de cierto cambio fonético, es verdad), mientras que el acento tiene carácter únicamente (ver más arriba) prosódico; justamente al revés que en español, donde acento es fonológico y cantidad no.

El criterio para decidir sílaba larga o breve depende tanto del número de alófonos que incluye como del tipo de vocal, larga o breve, que incluye; en general, la regla es: son breves las sílabas abiertas del tipo CV, siendo la V breve (la llamada moción), como [ke]. Son largas todas las demás, como [kî], [kie], [ken], [kîn], es decir si incluyen vocal larga, diptongo o si son trabadas. Las del tipo CVCC pueden incluso actuar en poesía como larga + corta, dotando a la última consonante de una cuasívocal neutra que representamos como @ (Batmanglij,1988).

En estos metros compuestos de pies o agrupaciones de largas y breves, realizaremos las sílabas de acuerdo con sus cantidades relativas, que, en la recitación, resultan estar en la proporción aproximada: 1 - = 3 7 . En el verso persa (Rumi, s.XIII):

[ta ráb AN DÁR ta ráb AST Û]

se disocian dos rasgos, tono y cantidad (concomitantes en el acento español) porque se acentúan las sílabas [rab] y [dar], corta y larga respectivamente, con lo que [an] (de "andar") es átona pero larga, lo cual somete al oído español a un conflicto que tarda en resolver: no sabe cuál sílaba se acentúa, [rab] o [an].

Aquí [an] (de "andar") cobra cierto protagonismo al lado de los actores principales ([rab] y [dar]) por ser larga aunque no acentuada. )Y al oído persa? Parece que [an] no funciona como crusis pero tampoco un anacrusis. La cantidad, siendo inherente al habla persa, no puede funcionar propiamente como marca, sobre todo al observar que se presentan a menudo varias largas juntas (ver más abajo). Esto nos lleva a concluir que la marca reside en el acento en este tipo de métrica.

Nos encontramos entonces con la aparente paradoja de que en la métrica acentual la marca reside en la cantidad, mientras que en la cuantitativa, reside en el acento. En realidad la situación es lógica: se marcan las cosas con elementos fuera del contexto, se destacan figuras con colores ajenos al fondo, diferente éste en cada caso. Todo esto en caso de conflicto; si no, ambos, tono y cantidad, marcan redundantemente.

SINCRONICIDAD DE MARCAS RÍTMICAS

En la recitación poética, no sólo tienen lugar contrastes de énfasís, marcas, entre sílabas vecinas, sucesión que compete como hemos visto a la métrica. También se dan, relacionados con ella, pero no independientemente, regularidades de esas marcas en el tiempo; no solo se producen patrones métricos, pies, sino que su producción se sitúa de tal modo, que las marcas tienden a ocurrir periódicamente.

Esta periodicidad rítmica nos lleva cerca, muy cerca de la música, al introducir números en la producción, lo que tanto le compete a ella. Entramos en dominios que nos llevan al compás, intervalos temporales donde ocurren cosas, notas, golpes, pero donde se está seguro de las recurrencias, del retorno a tiempo, es decir, se sabe y espera cuándo ocurrirá el principio del próximo compás.

Los esquemas métricos llenan ahora el compás, de modo que la suma de duraciones sea igual a la duración del período rítmico. Así, una sucesión de pies como:

/ - - 7 - / 7 - 7 7 / - - 7 - / 7 - /

puede ser organizada de modo que, asignando duraciones fijas y proporcionales a largas y breves, encontremos compases regulares: Por ejemplo si ─ equivale a 2 tiempos, y 7 a 1, comenzamos nuestra cuenta con la 20 sílaba, y contamos cada 4, nos encontramos con el esquema regular:

2 │ 2 1 2 1 │ 2 1 1 2 │ 2 1 2 1 │ 2

que admite una periodicidad de 6 tiempos, la cual, incluso trasciende los límites del verso: también el comienzo del primer compás del siguiente ocurrirá "a tiempo". La pausa de fin de verso adquiere entonces el carácter de silencio que llena el vacío hasta el próximo compás. Nos encontramos con un compás de 6 partes que regirá durante todo el poema, con oscilaciones de tempo, pausas, calderones, como su hermana musical, pero sin romper esa coherencia numérica que llamamos ritmo.

q l q-e-q-e l q‒ee‒q l q-e-q-e l q . -. q l q-e-q

| primer verso . . . . . . . . . ..............| segundo

EJEMPLO DE MÉTRICA ESPAÑOLA

Sea el poema de once versos heptasílabos:

Todo el fuego suspende

la pasíón. (Luz es sola!

Mirad cuan puro se alza

hasta lamer los cielos,

mientras las aves todas

por él vuelan (No abrasa!

)Y el hombre?. Nunca. Libre

todavía de tí,

humano, está ese fuego.

Luz es, luz inocente.

( Humano, nunca nazcas !

(V.Aleixandre,"el Fuego").

Organicemos el texto en forma silábica, eligiendo (forzando?) las sinalefas, hiatos, diéresis y elisiones que consiguen igualar en siete el número de sílabas versales, número sugerido por el predominio de versos con siete sílabas gramaticales.

Un examen previo muestra entonces un predominio de acentuación sintáctica en las sílabas pares sobre las impares (24 contra 8), lo que resuelve la elección de marca rítmiva si consideramos la acentuación: en cuanto a marcar cada tres, si partimos de la penúltima, siempre acentuada, encontramos contando hacia atrás, que la tercera cuenta con 6 acentos contra 6 en segunda mas 7 en cuarta: el poema parece proponer las marcas rítmicas en las sílabas pares, contrariando el acento donde no coincida en la manera antes indicada; todo esto descartando, claro, una marca libre, que la rígida versificación (heptasílabos) parece descartar. He aquí pues, cómo una simple estadística, percibida de un vistazo (o su equivalente auditivo) por el recitador y oyente acostumbrados, propone una determinada interpretación métrica. Nótese en ella los silencios finales que completan a 8 el número de sílabas del ciclo versal. El poema consta así de yambos acentuales ininterrumpidos.

1          2          3          4          5          6          7    8

tó         DHOEL fué      GHO    sus       PÉN     de   -

la         PA       sión,     (LÚ      th-es     SÓ       la! -

mi        RÁTH kuán     PÚ       ro         SE-ÁL tha -

as         TA       la         MÉRR los        THIÉ   los, -

mien     TRAS   la         S-Á      bhes     TÓ       dhas -

po        R-ÉL    bhué     LAN     (no-a     BHRÁ sa! -

) i-el     ÓM      bre ?     NÚN    ka.       LÍ        bhre -

to         DHA    bhée     A         dhe       TÉE,    -     -

u          MÁ      no-es    TÁ-E   se         FUÉ     gho. -

lú         TH-ÉS, lóo       TH-EE no        THÉN te. -

(u         MÁ      no,       NÓON ka        NÁTH kas! -

EJEMPLO DE MÉTRICA PERSA.

Jalâleddin Rûmî (Moûlânâ). Elegimos un poema perteneciente a su Dîwân Al-Kabîr dedicado a su amigo-maestro Shams-e-Tabrîzî. Los poemas clásicos de un Dîwân (colección) no tienen puntuación, con lo que el verso mismo adquiere una función sintáctica: cada dístico puede incluir una o varias oraciones, coordinadas o al menos relacionadas en su sentido; en todo caso el fin de verso corresponde a un limitador sintáctico (, ; : .) y el fin de estrofa, el dístico (bayt), al punto (.) necesariamente. Tomando los 4 primeros:

Muestra el rostro, que anhelo jardines y campos floridos;

abre los labios, que anhelo azúcar en abundancia.

Oh, tú, sol de hermosura, sal un momento entre las nubes,

que anhelo aquel rostro radiante y luminoso.

Dijiste con gracia pícara "No me molestes más, (vete !"

Aquel decir "No me molestes más" es lo que anhelo.

Aquel rechazo tuyo: "Vete, no está el Señor en casa".

Aquella gracia, y hasta la rudeza en el umbral, anhelo.

(Trad. M. Puyâ)

Ízgfò âœ£¥±¾™ z p£… ä˜ bf }£¿À…

Ízgfò âœZzZ®• ¬À– ä˜ Ìš }£²½

®``…Zg ç`›d ò xz®``… ã±`Š [£¥``•ò }Z

Ízgfò âœ£`…£† Ú²`·`²› y®``ÁŒ x£˜

los cuales, una vez escuchados, resultan corresponder al metro Muzare' Musamman Ajrab Makfuf Mahzuf, frecuente también en poeta Hâfez. Consta el dístico de dos hemistiquios de 14 sílabas versales (16 completando con dos silencios de breve al final del hemistiquio), agrupadas en pies que son, según la nomenclatura métrica basada en la raiz fa'l, y la usual, de largas y breves:

/mus taf 'i lun / mu fâ 'i lu / mus taf 'i lun / fa 'al/

/ - - 7 - / 7 - 7 7 / - - 7 - / 7 - /

1          2          3          4          5          6          7     8

9          10        11        12        13        14

-          -          7          -         7          -          7 7

ben       MÂ      i          rokh     ke        BÂGH o go

les        TÂN    a          mâ       re         ZÛST

bog       SHÂ     i          lab        ke        GHAN de fa

râ         VÂN    a          mâ       re         ZÛST

'ei         'ÂF      @         tâ         be        HOSN @ bo

rû          NÂ       da        mî        ze        'ABR

kan        CHEH re         yê        mo       SHA'    sha 'e

tâ        BÂN    a          mâ       re         ZÛST

gof        TÎ        ze        nâz       @         BÎSH    @ ma

ran        JÂN     ma       râ         bo        RÔ

'ân        GOF     ta         nat       ke        BÎSH    @ ma

ran        JÂN    a         mâ       re         ZÛST

vân       DAF     'e         gof       ta         NAT    ke bo

rô         SHAH be       khân     e          NÎST

vân       NÂZ    o          bâz       @       TON    di e

dar       BÂN    a           mâ       re        ZÛST

Se percibe, como en el verso español, una organización yámbica; pero aquí, se ve enriquecida por una sutil alternancia de seudoyambos acentuales - -, 7 - , 7 7. Este esquema pone de manifiesto la ordenación métrica y acentual que orienta y subyace en el poema, y hasta cierto punto, guía su realización, su recitación práctica; no obstante subsisten divergencias, debidas a complicaciones léxicas, sintácticas o expresivas (p.ej. puede acentuarse [gof ti ze NÂZ] (l.5) para enfatizar [NAZ] "gracia pícara"; o bien [ton DI e dar ban] (l.8), donde se pronuncia [tonDI], "rudeza", por ser un sustantivo). Encontramos en estas divergencias la vieja distinción entre esquema abstracto y realización (recitación) concreta, entre ritmo y ritmopea, entre melodía y melopea.

ANÁLISIS DE LOS RASGOS

Los rasgos prosódicos han de ser medidas con fiabilidad y consistencia, preferiblemente con medios automáticos; de ahí surge un primer modelo de recitación. Pero su validación sólo puede alcanzarse si se le hace funcionar: es decir, se genera automáticamente habla mediante una implementación de dicho modelo: un hablante artificial que lo pone en juego, evaluándose luego la respuesta de la audiencia. Los resultados de la encuesta sugerirán probablemente modificaciones al modelo, que volverá a ser ensayado hasta un comportamiento satisfactorio, en un ciclo recurrente Análisis‑ Síntesis.

Llamaremos Rasgo a la cualidad percibida, como el tono (pitch), Parámetro a su correlato físico, medible, como frecuencia fundamental, F0, y Variable a una medida sobre el comportamiento colectivo de un parámetro, sea acumulado como histograma (ej. la media), sea desarrollado en el tiempo (ej. pendiente de la caída de F0).

Estas distinciones deben ser consideradas al desarrollar las correspondientes herramientas, que deberán analizar, no sólo las variables de los parámetros, sino las variables de los rasgos: es decir, al medir por ejemplo, las desviaciones típicas a derecha e izquierda en el histograma de tono, se tendrá en cuenta el carácter aproximadamente logarítmico de la percepción tonal empleando una escala de ese tipo, medida en semitonos, por ejemplo. Así que mediremos parámetros, pero acercándonos en lo posible al correspondiente rasgo perceptivo. Veamos pues las variables concretas para cada rasgo‑parámetro.

1. Timbre‑espectro.(fig.1) Constitutivo del valor fonético y base del contraste fonológico, no será visto aquí, donde nos interesa únicamente la prosodia. Recordemos no obstante que la rima es una similaridad o igualdad de motivos tímbricos ((y melódicos!) en fines de verso; el timbre compete por tanto a la poética; lo mismo ocurre en las aliteraciones.

2. Tono‑frecuencia fundamental. Estimaremos el Tono de las elocuciones mediante el algoritmo de nuestra invención ADA1, Autodisimilitad Adaptativa [9,10,13], cercano a algoritmos del tipo Autocorrelación y Filtro Peine (Comb Filter). El algoritmo ADA1, de gran precisión y rapidez, opera en el dominio temporal, comparando formas de onda y encontrando el desplazamiento (período) que optimiza el parecido (autodisimilitud), entre segmentos de señal de tamaño (ventana temporal) del orden del período buscado. Analíticamente, el período P (pitch) es el valor no nulo del retardo τ para el que la expresión:

        2 f (t+τ) - f(t) 2

ADS(f) =   ───────────────

                                                    2 f (t+τ) 2 - 2 f(t) 2

es un mínimo, por debajo de un umbral; y donde la norma 2f(t)2 de la señal f es la "energía" sobre una ventana temporal w(t), cuyo soporte es proporcional (igual en nuestro caso, constante 1) al retardo τ. Para señales digitales (muestreadas) tomamos esa energía como:

2 f (t) 2 = 3 * f_i * tomando la suma de las muestras f_i desde i=t+τ/2 a t+τ/2.

La función ADS (autodisimilitud) varía desde 0 (perfecta periodicidad) a 1 (exacta oposición), y vale .5 para señales ruidosas (valores aleatorios). De esta manera, ADS es una medida de la periodicidad local de la señal; tomamos el umbral de .3 para una medida práctica del tono (p.e., análisis secuencial de elocuciones musicales o habladas con ruido ambiente). Conocido el período local medido en muestras, conocemos enseguida el período en unidades temporales (milisegundos), y por tanto la frecuencia o tono en hertzios (Sánchez,1977,1979).

Se imponen condiciones de continuidad (el tono no puede variar bruscamente), y se representa en escala logarítmica, cercana a la escala subjetiva de Tono, eligiendo como unidad el semitono, aproximadamente un 6% de variación, o el tono, un 12%, similar por cierto en tamaño a la unidad de intervalo de intensidad, el dB. Ver figuras 2 y 3.

3. Sonoridad‑Intensidad. Calcularemos la Intensidad Local (instantánea) como el Valor Medio Absoluto o como el Valor Cuadrático medio, de segmentos de señal del orden de uno o dos periodos (10‑30 ms.); o bien ese intervalo es constante, o bien se toma un valor medio que hace comparables medidas para diferentes períodos de tiempo. Así, por ejemplo:

                          n

               IL = ( Σ │ fi │ ) / n

                          i

Hay que citar además que la intensidad del habla influye en el Timbre, tanto en su producción, ya que el esforzar o levantar la voz hace el timbre más áspero (onda de excitación del tracto vocal se hace más picuda, más armónicos agudos), como en audición, ya que la curva de umbral de intensidad sube en bajas y altas frecuencias: consecuentemente, a bajo nivel de intensidad desaparecen graves (calidez. sonoridad, calor) como agudos (brillantez, aspereza, riqueza).

4. Cantidad‑Duración. La duración subjetiva (cantidad) de segmento de habla, sea un alófono, sea una pausa, es un parámetro a medir: lo cual no tiene solución óptima, porque los límites temporales del segmento, principio y fin, no están bien delimitados: el habla evoluciona de un segmento a otro variando sus características continuamente de una transición a otra transición. Eligiendo no obstante como límite o frontera de un tramo, el máximo de la derivada de un parámetro, la intensidad local IL en este caso, disponemos de marcas entre las que mediremos la duracion:

D = t1 ‑ t2, t1= max ( d(IL) / dt), t2 = max ( d(IL) / dt)

-t1 -t2

siendo D, duración, y los instantes t1,t2, los referidos en los que es máxima esa derivada, en los correspondientes tramos -t1, -t2 ( si no se conocen los tramos de búsqueda a priori, hay que proporcionar un umbral de cambio, tras normalizar la derivada, dividiendo por la propia IL).

Para la estimación de cantidades de otros sucesos de límites bruscos, como los silencios, habrán de adoptarse otros parámetros para medir su variación que la intensidad: por ejemplo hay transiciones fonémicas (como [ao] que sólo suponen una pequeña variación de intensidad; el cambio es primordialmente tímbrico.

El correspondiente rasgo subjetivo, cantidad, varía también como los demás logarítmicamente (siguiendo aproximadamente la ley de Fechner), por lo que las unidades serán también logarítmicas.

Estas medidas locales se acumularán a su vez en un histograma, que ha de plasmar las desviaciones respecto al valor medio en una curva que asimilaremos a su vez a la normal. La velocidad media silábica es en este caso muy fácil de determinar: por tratarse de una elocución conocida, bastará hallar el cociente entre el número de sílabas y el tiempo total de su elocución.

En este dominio temporal, se producen complejos patrones rítmicos que a no dudarlo, influyen decisivamente en el efecto expresivo: teatro, poesía, retórica, hacen uso sutil y artístico de esos ritmos con efectos evidentes: desgraciadamente su medida en laboratorio es difícil, porque no están suficientemente estudiados en su realización, diferente siempre de los esquemas abstractos de la métrica tradicional, como decíamos más arriba.

SÍNTESIS. MODELO DE PRODUCCIÓN DE VOZ

La realización acústica de un texto puntuado, sobre todo poético, es decir, la síntesis automática del habla mediante reglas, es de una gran complejidad, debido a los múltiples niveles, lingüísticos y no, que concurren en toda frase, por simple que sea. A partir únicamente del texto, hay que reconocer todo lo implicado en letras y signos, y proporcionar reglas de realización acústica, sonora, para esos elementos y rasgos suprasegmentales reconocidos: hay que separar las distintas informaciones con relevancia acústica, y formar así diferentes cadenas para cada tipo de información, a saber:

0. Cadena Ortográfica: que engloba las letras escritas, las cifras y los signos de puntuación. Por ejemplo la cadena correspondiente a: ")Has venido hoy?" será: ")has_venido_hoy?" 16 unidades.

1. Cadena Léxica: palabras que forman la frase. El espacio es relevante, incluso fonéticamente. {has,venido,hoy} 3 unidades.

2. Cadena Fonética: sucesión de símbolos que representan los alófonos, los cuales realizan (hacen sonar) los fonemas involucrados en el texto escrito. Las reglas son más complicadas de lo que parecería, ya que el alófono a incluir en la cadena depende no sólo del carácter o letra correspondiente, sino en muchos casos a los caracteres vecinos (anterior y posterior). Por ejemplo, el carácter "a" corresponde al fonema /a/ que se realiza como alófono [a]; pero "h" no se realiza (pasa al sonido 'vacío') excepto tras "c" en que pasa a [t! ]. Y así para todos los demás.

[azßeniδoi] 9 unidades.

-3. Cadena Silábica Gramatical. cadena de sílabas, con vistas a la acentuación, principalmente. Las sílabas acentuadas deberán ser destacadas mediante el rasgo melódico (acento tónico) principalmente, y, en menor medida, con énfasís concomitantes de intensidad y cantidad.

│az│ße│ni│δo│oi│ 5 unidades.

4.5. Cadena Frásica‑Modal: segmentar el texto en frases u oraciones, acudiendo a la puntuación: puntos (.), interrogaciones ()?), admiraciones ((!) son segmentadores obvios. Los signos nos proporcionan la modalidad, que, a su vez, determina la entonación suprasegmental correspondiente.

│)has_venido_hoy?│ 1 unidad. Interrogativa.

6. Cadena Sintagmática: la estructura sintáctica, sugerida en parte por la puntuación, influye también en la acentuación, ya que algunas palabras ceden su acento frente a otro más importante: "cuánto más" deviene: [kuantomás] 1 unidad.

7. Cadena Acentual: se trata naturalmente de los acentos en el habla, que coinciden sólo en parte con los escritos, o acentos ortográficos.

│ás│ße│'i│δo|ói│ 5 unidades.

8. Cadena Melódica. 9. Cadena Intensiva. 10. Cadena Cuantitativa: realizan en los rasgos tono, intensidad, cantidad, los aportes frásicos, sintácticos y acentuales. │/âs│\ße│^\ni│\δoô/i│ 4 unidades.

11. Cadena Rítmica: hay un ritmo, no sólo en la poesía, sino también en el habla corriente, que enfatiza una sílaba de cada dos o de cada tres: debe asimismo serle aplicado al texto mediante tono y cantidad en la forma desarrollada en este artículo.

De esta manera, combinando informaciones varias procedentes exclusivamente de letras y puntuación, se hace sonar, hablar, un texto escrito.

BIBLIOGRAFÍA.

ALEIXANDRE,V. (Ed. Leopoldo de Luis) Sombra del Paraíso. Castalia. Madrid, 1990.

BATMANGLIJ,M&N.(Ed) Hâfez, Dance of Life. Mage. Washington, 1988. BOOTH,S. Shakespeare's Sonnets. Yale U.Press. London, 1977.

CRUSIUS,F. Iniciación en la Métrica Latina. Bosch. Barcelona,1951.

GARCÍA CALVO, A. Tratado de Métrica y Prosodia y de Métrica y Versificación. Bib. Fac.Filol. UCM. (En publicación).

GARCÍA CALVO, A. Del Lenguaje. Lucina. Madrid, 1979.

PUYÂ, M. "'Naz' or Tormenting Coquetry: Female Torturers and Masochistic Love in the Works of the Persian Poet Hâfez". Actas III Jornadas Internacionales de la Mujer. U.C.M.. Madrid, 1994.

RÛMÎ,J.M. Diwân-e Shams-e-Tabrîzî. Negâh. Tehran, 1371 HS.-1992 AD.

SÁNCHEZ,F.J. "Application of Dissimilarity and Aperiodicity Functions to Pitch Extraction and Voiced‑Unvoiced Decision". 9. Int. Cong. Acoust., Madrid, 1977.

Sánchez,F.J. Tratamiento Señales Pseudoperiódicas. Ph.D. Thesis. E.T.S.I.Ind. U.P.M, 1979.

Sánchez,F.J. "Interválica musical subyacente en la prosodia". Symp.Ling.Log. Madrid, 1989.

SHAMISSA, C. Ashnaî Bâ 'Arûz Va Ghâfie. (Introduction to Prosody). Tehran, 1987.

STEINGASS,E,. "On the Prose-Rhyme and the Poetry of the Nights". Terminal Essay of R.Burton's trasl. "The Thousand nights and One Night". Private print. Burton Club. USA (sin año). pp.233-258.

Apéndice (Traducción del resumen):

El recitador de poesía y su compañero maquinal comparten los mismos problemas: dónde (es decir, cuando) colocar los puntos de énfasis, cómo situar temporalmente la producción del habla; aplicando un conjunto de reglas que el humano puede adquirir inconscientemente por audición e imitación, pero que deben ser explícitamente definidas en el caso de la máquina, lo que obliga a cubrir minuciosamente todos los aspectos de la síntesis. Ese conjunto de reglas es, en definitiva, un modelo de recitación, y debe ser un modelo productivo, en el sentido de que produce realmente habla poética. Veamos ese modelo aplicado a dos métricas principales, acentual y cuantitativa, en dos lenguas vivas, español (castellano) y persa (fârsi), respectivamente. Se re-unen aquí actividades habitualmente separadas, como el esquema métrico abstracto del filólogo con su recitación sintetizada o la entonación prosódica con su medida automática, lo cual, al restablecer una unidad esencial entre ciencias y letras que nunca debió perderse, no carece, quizá, de un cierto interés.