Lingüística computacional

Presentación del curso: contenido, objetivos y evaluación (PPTX, PDF)

Contenido del curso

1. Lingüística computacional
1.1. Definición y alcance (PPTX), (PDF)
1.2. Retos (PPTX), (PDF)
1.3. Aspectos estadísticos (PPTX), (PDF) TF-IDF (XLSX), (PDF)
2. Morfología
2.1. Aprendizaje no supervisado de morfología (PPTX), (PDF)
2.2. Autómatas de estados finitos (expresiones regulares) (PPTX), (PPSX), (PDF)
2.3. Morfotáctica de estados finitos (PPTX), (PDF)
2.4. Algoritmo de Porter (PPTX), (PDF)
3. Morfosintaxis
3.1. Etiquetado de partes de la oración (PPTX), (PDF)
3.2. Modelo de n-gramas
3.3. Autómatas probabilísticos
4. Sintaxis
4.1. Tipos de gramáticas (PPTX), (PDF)
4.2. Análisis sintáctico
4.3. Análisis de dependencias
5. Semántica léxica
5.1. Modelo de bolsa de palabras
5.2. Modelo de espacio vectorial
5.3. Modelo de semántica distribucional

Recursos

  1. Narraciones Mayas (TXT)
  2. Narraciones Español (TXT)
  3. Lista de palabras corpus maya orden alfabético (TXT)
  4. Lista de palabras corpus maya orden inverso alfabético (TXT)

Programas y software

  1. SSH Secure Shell Client (ZIP)
  2. Simple Concordance Program (Sitio web)

Bibliografía

  1. Baroni, Marco. (2013). Dr. Strangestats or: How I Learned Stop Worrying Love Distributional Semantics. (PDF)
  2. Hammarström, H., & Borin, L. (2011). Unsupervised learning of morphology. Computational Linguistics, 37(2), 309-350. (PDF)
  3. Jurafsky, D. y Martin, J. H. (2007). Speech and Language Processing: an Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Upper Saddle River, N.J.: Pearson Prentice Hall. (PDF)
  4. Manning, C. D. y Schütze, H. (1999). Foundations of Statistical Natural Language Processing. Cambridge, Mass.: The MIT Press. (PDF)
  5. Porter, M. F. (1980). An algorithm for suffix stripping. Program, 14(3), 130-137. (PDF), (PDF)