2.3 Compilación de corpus orales

Preguntas (Tareas)

2.3.1 Corpus orales y corpus de lengua hablada

2.3.2 Diseño de corpus orales

2.3.2.1 Características de los hablantes (procedencia, sexo, edad, nivel sociocultural)

2.3.2.2 Selección de materiales

2.3.2.3 Frecuencia de fonemas

2.3.3 Grabación en laboratorio

2.3.4 Aplicaciones de los corpus orales

2.3.4.1 Análisis fonético

2.3.4.2 Tecnologías del habla

            2.3.4.2.1 Síntesis de voz

            2.3.4.2.2 Reconocimiento de voz

            2.3.4.2.3 Reconocimiento de hablante

 

Presentación

Corpus orales

Ejemplos

Corpus DIME

Reconocimiento de voz

Programa

CSLU Speech Toolkit

 

Libros

Alarcos Llorach, E. (1950/1981). Fonología española, Madrid: Gredos.

International Phonetic Association. (1999). Handbook of the International Phonetic Association. A guide to the use of the International Phonetic Alphabet, Cambridge: Cambridge University Press.

Lander, T. (1997). The CSLU labeling guide, Oregon: Oregon Graduate Institute of Science and Technology.

Prieto, P. (Coord.). (2003). Teorías de la entonación, Barcelona: Ariel.

Pullum, G.K. & W.A. Ladusaw. (1986). Phonetic symbol guide, Chicago: The University of Chicago Press.

Quilis, A. (1981/1988). Fonética acústica de la lengua española, Madrid: Gredos.

——————. (1993/1999). Tratado de fonología y fonética españolas, Madrid: Gredos.

 

Artículos

Acero, A. (1995). “The role of phoneticians in speech technology”, en European studies in phonetics and speech communication, G. Bloothooft, V. Hazan, D. Huber & J. Llisterri (Eds.), Essex: OTS Publications.

Aguilar, L, J. Llisterri & M.J. Machuca. (1994). “Some phonetic data on speech produced in different experimental situations”, ponencia presentada en ESPRIT BRA VOX Workshop, Orsay: LIMSI.

Aguilar, L., J.M. Garrido & J. Llisterri. (1994). “Incorporación de conocimientos fonéticos a las tecnologías del habla”, ponencia presentada en I Congrés de Lingüística General, Valencia: Universitat de València.

Bacchiani, M., J. Hirschberg, A. Rosenberg, S. Whittaker, D. Hindle, P. Isenhour, M. Jones, L. Stark & G, Zamchick. (2001). “SCANMail: Audio navigation in the voicemail domain”, Nueva Jersey.

Battaner, E., J. Gil, V. Marrero, J. Llisterri, C. Carbó, M.J. Mahuca, C. de la Mota & A. Ríos. (2003). “VILE: Estudio acústico de la variación inter e intralocutor en español”, en Actas del Congreso de la Sociedad Española de Acústica Forense, Barcelona: Sociedad Española de Acústica Forense, pp. 59-70.

Bonafonte, A., P. Aibar, N. Castell, E. Lleida, J.B. Mariño, E. Sanchis & M.I. Torres. (1998). “Desarrollo de un sistema de diálogo oral en dominios restringidos”, ponencia presentada en I Meeting on Language Engineering, Sevilla.

Carré, R. (1991). “Los bancos de sonidos”, en Las industrias de la lengua, Vidal Beneyto, J. (Dir.), Salamanca, Madrid: Fundación Sánchez Ruipérez, Pirámide, pp. 108-118.

Dahlbäck, N., A. Jönsson & L. Ahrenberg. (1993). “Wizard of Oz studies – Why and how”, en Intelligent users interfaces, Linköping: Laboratorio de Procesamiento de Lenguaje Natural, pp. 193-200.

Estruch, M., J.M. Garrido, J. Llisterri, M. Riera. (1999). “Técnicas y procedimientos para la representación de las curvas melódicas”, Barcelona: Departament de Filologia Espanyola, Universitat Autònoma de Barcelona.

——————. (1996-1997). “Una aproximación fonética al estudio de la entonación” , Barcelona: Departament de Filologia Espanyola, Universitat Autònoma de Barcelona.

Hieronymus, J.L. (1994). “ASCII phonetic symbols for the world's languages: Worldbet”, Nueva Jersey.

——————. (1997). “Worldbet phonetic symbols for multilanguage speech recognition and synthesis”, Nueva Jersey.

International Phonetic Association. (1993). “IPA Chart, revised to 1993”, en Journal of the International Phonetic Association 23,1.

Llisterri, J. (1997). “Transcripción, etiquetado y codificación de corpus orales”, en Etiquetación y extracción de información de grandes corpus textuales, curso impartido en Seminario de Industrias de la Lengua, Soria.

——————. (1999). “Transcripción, etiquetado y codificación de corpus orales”, en Panorama de la investigación en lingüística informática, J. Gómez, A. Lorenzo, J. Pérez & A. Álvarez (Eds.), Revista Española de Lingüística Aplicada, volumen monográfico, pp. 53-82.

——————. (2001). “La representación fonética segmental de corpus orales".  Barcelona: Universitat Autònoma de Barcelona.

——————. (2002). “Las tecnologías del habla: entre la ingeniería y la lingüística”, en Congreso Internacional La Ciencia ante el Público. Cultura humanística y desarrollo científico y tecnológico, Salamanca: Universidad de Salamanca, pp. 51-74.

——————. (2003). “Lingüística y tecnologías del lenguaje”, Lynx. Panorámica de Estudios Lingüísticos, 2, pp. 9-71.

Llisterri, J., C. Carbó, M.J. Machuca, C. de la Mota, M. Riera & Antonio Ríos. (2003). “El papel de la lingüística en el desarrollo de las tecnologías del habla”, en Séptimas Jornadas de Lingüística, Cádiz: Servicio de Publicaciones de la Universidad de Cádiz.

Llisterri, J. & J. B. Mariño. (1993). “Spanish adaptation of SAMPA and automatic phonetic transcription”, Barcelona.

Llisterri, J., L. Aguilar, J.M. Garrido, M.J. Machuca, R. Marín, C. de la Mota & A. Ríos. (1999). “Fonética y tecnologías del habla”, en Filología e informática. Nuevas tecnologías en los estudios filológicos, J.M. Blecua, G. Clavería, C. Sánchez & J. Torruella (Eds.), Barcelona: Milenio, pp. 449-479.

Llisterri, J. & M.A. Marti. (2002). “Las tecnologías lingüísticas en la sociedad de la información”, en Tratamiento del lenguaje natural, M.A. Marti & J. Llisterri (Eds.), Barcelona: Fundación Duques de Soria y Edicions Universitat de Barcelona, pp. 13-28.

Machuca, M, M. Riera & A. Ríos Mestre. (1999). “Criteris de segmentació i etiquetatge del corpus prosòdic del CREL per a l’estudi de la durada segmental”. Barcelona, Seminari de Filologia i Informàtica, Universitat Autònoma de Barcelona.

Moreno, A. & J.B. Mariño. (1998). “Spanish dialects: Phonetic transcription”, en Proceedigs of ICSLP'98. The 5th International Conference on Spoken Language Processsing, Sydney.

Mota, C. de la & A. Ríos. (1995). “Problemas en torno a la transcripción fonética del español: los alfabetos fonéticos propuestos por IPA y RFE y su aplicación a un sistema automático”, en Acta Universitatis Wratislaviensis, Wroclaw: Universidad de Wroclaw, pp. 97-109.

Ortega-García, J., J. González-Rodríguez, V. Marrero-Aguilar, J.J. Díaz-Gómez, R. García-Jiménez, J. Lucena-Molina & J.A.G. Sánchez-Molero. (1998). “AHUMADA: A large speech corpus in Spanish for speaker identification and verification”, en Proceedings of ICAPSSP-98, Madrid. 

Pierrehumbert, J., M.E. Beckman & D.R. Ladd. (En prensa). “Conceptual foundations of phonology as a laboratory science”, en Phonological knowledge: Its nature and status, N. Burton-Roberts, P. Carr & G. Docherty (Eds.), Cambridge: Cambridge University Press.

Revista de Filología Hispánica. (1915). “Alfabeto fonético”, Revista de Filología Hispánica, Madrid, 2, pp. 374-376.

Tlatoa. (2000). “How to hand label a speech corpus”, México: Universidad de las Américas.

Torruella, J. & J. Llisterri. (1999). “Diseño de corpus textuales y orales”, en Filología e informática. Nuevas tecnologías en los estudios filológicos. J.M. Blecua, G. Clavería, C. Sánchez & J. Torruella (Eds.), Barcelona: Milenio, pp. 45-77.

Villaseñor, L., A. Massé & L.A. Pineda. (2001). “The DIME Corpus”, en Tercer Encuentro Internacional de Ciencias de la Computación ENC-01, Aguascalientes: SMCC-INEGI, pp. 591-600.

Villaseñor, L., M. Montes-y-Gómez, D. Vaufreydaz & J.-F. Serignat. (En prensa). “Elaboración de un Corpus Balanceado para el Cálculo de Modelos Acústicos usando la Web”, Tonantzintla, Instituto Nacional de Astrofísica, Óptica y Electrónica.

Wells, J.C. (2003). “SAMPA Computer Readable Phonetic Alphabet”, Londres, Department of Phonetics and Linguistics, University College London.

 

 

Páginas

Grupos de tecnologías del habla

Group de Fonetica (UAB)

Group de Recerca en Lingüística Computacional

Grupo de Ingeniería Lingüística (UNAM)

Natural Language Processing Group at Edimbugh

DIME (IIMAS-UNAM)

Acoustical Society of America

Asociación Fonética Internacional

Síntesis de voz

ATLAS (Applied Technologies on Language and Speech)

Loquendo

Bell Labs

OGI-Festival