3.4 Anotación sintáctica
Una vez que se realizó la identificación de las partes de la oración en el corpus, es posible
ir a la siguiente etapa, que consiste en encontrar las relaciones sintácticas entre estas partes, lo
que constituye el análisis de la oración o parsing.
3.4.1 Parsing parcial (chunking)
- El parsing parcial es un análisis de los constituyentes únicamente, sin intentar llegar al análisis
completo. Chinking se puede entender como romper en pedazos y se puede considerar como el paso
intermedio al parsing total.
- Se llega al nivel de los sintagmas (nominales, verbales, preposicionales, adverbiales).
- Se hace uso de patrones de etiquetas para construir reglas; por ejemplo:
SN = (Art) (Adj) Sust
- El análisis parcial es altamente preciso, normalmente ignora el contenido léxico y solo requiere
de haber identificado las partes de la oración.
- El parsing parcial es suficiente para muchas de las aplicaciones de PLN.
Características de los chunks:
- Los chunks son regiones del texto que no se intersectan
En [un lugar] de [la Mancha] de [cuyo nombre] no quiero acordarme
- Los chunks son no recursivos, esto es, un chunk no puede contener otro chunk. Por el contrario,
los constituyentes son recursivos ([un lugar de [la Mancha]])
- Los chunk no son exhaustivos, es decir, no todas las palabras están incluidas en los chunks.
Mayor información en Steven Abney (1991) "Parsing By Chunks". En Robert Berwick et al (Eds.) Principle- Based
Parsing, Kluwer Academic P.
3.4.2 Parsing total
El objetivo del parsing total es obtener un análisis completo de los constituyentes de la oración
y sus relaciones sintácticas, siguiendo las reglas de una gramática.
- Como resultado se puede tener un árbol sintáctico o su representación mediante
paréntesis categorizados.
[O [SN El_Art hombre_Sust SN] [SV vio_Vb [SP a_Prep [SN la_Art nena_Sust SN] SP]
[SP en_Prep [SN el_Art parque_Sust SN] SP] [SP con_Prep [SN el_Art telescopio_Sust SN] SP] SV] O]
- Una desventaja del parsing total es que es poco preciso (ambiguo), adaptable a un dominio específico
y lento en realizarse.
- El parsing total llega a ser muy costoso y de poco beneficio para PLN.
- Para el análisis total se puede hacer uso de diferentes gramáticas (independiente del contexto,
de dependencia o funcional).
- Mayor información en: Horacio Rodríguez Hontoria,
Técnicas de análisis sintáctico. Universitat Politècnica de Catalunya.