Inici

Publicacions






UNED


Benvinguts al projecte ‘GLISSANDO, un corpus de parla anotat per a estudis prosòdics en català i espanyol’

 

Descripció del projecte

El corpus Glissando ha sigut desenvolupat dins el marc dels projectes coordinats 'Glissando, un corpus de habla anotado para estudios prosódicos en catalán y español' i 'Modelización de los fenómenos prosódicos del español y catalán a partir del corpus GLISSANDO'. En aquests projectes, finançats pel Plà Nacional d'I+D del Govern espanyol, han participat investigadors de tres universitats:

  • Universitat Pompeu Fabra
  • Universitat Autònoma de Barcelona
  • Universidad de Valladolid

L'objectiu principal d'aquests projectes és el disseny i gravació d'un corpus de parla per a estudis prosòdics en aquestes dues llengües. El corpus (que comprèn dues parts, una de lectura de notícies, considerada representativa d'un estil de parla més neutra o formal, i una altra de diàlegs, formals e informals) ha sigut enregistrat i transcrit ortogràficament en la seva totalitat, i l'anotació conté informació fonètica i fonològica que pot ser rellevant per estudis prosòdics:

  • transcripció fonètica alineada amb el senyal de veu;
  • segmentació en unitats prosòdiques (síl·labes, grups entonatius, etc.);
  • corba de F0 (obtinguda mitjançant un algoritme d'estimació de F0, i en alguns casos, també mitjançant laringògraf);
  • corba estilitzada i anotació fonètica en termes de pics i valls;
  • representació fonològica tonal (ToBI).

 

El corpus ha sigut dissenyat perquè serveixi de material d'anàlisi en estudis relacionats amb la prosòdia des de diferents perspectives i interessos, tant teòriques (descripció fonètica i fonològica dels fenòmens suprasegmentals en espanyol i català, anàlisi prosòdica de la parla d'informatius, entre d'altres) com aplicades (tecnologies de la parla, per exemple):

  • la seva grandària permet realitzar estudis estadístics amb garanties, i ho fa també apte per determinades aplicacions tecnològiques;
  • el seu grau de qualitat acústica assegura un bon funcionament de les eines d'anàlisi existents (algoritmes de segmentació fonètica automàtica, o d'estimació de la freqüència fonamental, per exemple);
  • degut a que comprèn dades de diferents locutors, permet la realització d'estudis interlocutor;
  • l'anotació de les dades tant a nivell fonètic com fonològic amplia les possibilitats d'anàlisi, i ofereix la possibilitat d'estudis comparatius entre models i nivells;
  • l'anotació del corpus recollit en termes d'unitats prosòdiques permet, a més de l'anàlisi de la prosòdia a diferents nivells, abordar l'estudi de la seva natura fonològica, de la seva identificació fonètica i dels factors lingüístics que determinen la organització dels enunciats en unitats prosòdiques;
  • permet els estudis prosòdics en diferents estils de parla (notícies i diàlegs amb diferents graus de formalitat), i, fins i tot, la realització d'estudis comparatius;
  • degut a que conté dades comparables en més d'una llengua, permet també estudis interlingüístics o per aplicacions tecnològiques multilingües.

 

Els principals interessos de recerca del grupo de la Universitat Autònoma de Barcelona en col·laboració amb el grup de la Universitat de Valladolid són:

  • Comprovació d'hipòtesi del model de fonologia entonativa, dins el marc mètric-autosegmental. La investigació en prosòdia de les llengües romàniques s'ha configurat com una línia d'investigació sòlida en l'àmbit de la fonologia de laboratori. Es persegueix la descripció completa i coherent de la fonologia entonativa de cada llengua, amb la finalitat de conèixer millor els complexos mecanismes prosòdics que intervenen en la producció de la parla. L'interès per aplicar el model mètric-autosegmental a les llengües romàniques i desenvolupar un sistema d'anotació prosòdica ha anat augmentant en els últims anys. El corpus GLISSANDO permet avançar en l'estudi de l'entonació de l'espanyol des d'aquesta perspectiva, aprofitant la segmentació en unitats prosòdiques del corpus i l'anotació ToBI.
  • Anotació prosòdica amb etiquetes ToBI : aportació de noves dades empíriques al sistema Sp_ToBI. L'objectiu és avançar en el coneixement de la prosòdia de l'espanyol a partir dels materials anotats del subcorpus de notícies de Glissando i debatre les diferents possibilitats d'anotació, amb l'objectiu d'avançar en la definició d'un model Sp_ToBI i explorar noves qüestions teòriques encara per resoldre en una anàlisi de l'entonació de l'espanyol des del model AM.
  • Proposta d'eines d'anotació semiautomàtica. Disposem d'una eina d'anotació semiautomàtica basada en la lògica difusa (amb el concepte clau d'“incertesa”), que permet agilitzar el procés d'anotació sense ignorar el coneixement fonològic de l'anotador humà.