El RST Spanish Treebank es un corpus en línea de textos especializados en español anotado con las relaciones discursivas de la Rhetorical Structure Theory (RST) de Mann y Thompson (1988).

El usuario puede consultar el corpus y/o emplear tres herramientas de búsqueda sobre el corpus completo o sobre un subcorpus con textos de su interés:

  • RST_stats_EDUs: ofrece estadísticas sobre Unidades Discursivas Mínimas (EDUs).
  • RST_stats_rel: ofrece estadísticas sobre relaciones discursivas.
  • RST_extract: extrae fragmentos textuales que se corresponden con elementos discursivos.

El RST Spanish Treebank es un corpus en constante evolución, ya que el número de textos y de ámbitos irá aumentando, dado que cualquier usuario puede subir sus propios árboles discursivos a la web. Para ello, es necesario leer este Manual RST (para cumplir los criterios de anotación necesarios) y enviar en el formato adecuado los árboles anotados desde la sección de Contacto.

Noticias

  • Mayo 2012. ¡Ya está disponible el sitio web del RST Spanish Treebank en tres lenguas: español, inglés y francés! Si no se visualizan correctamente estos cambios, debe actualizarse la página o borrar el historial.