2. Compilación de corpus
2.2 Compilación de corpus textuales
Temario
Tipo de corpus
Propósitos
Límites del corpus
Selección de textos
Selección de documentos
Selección de las partes del texto
Obtención de los textos
Búsqueda de documentos
Derechos de autor
Registro de documentos
Definición del equipo de trabajo
Digitalización de documentos
Textos a formato electrónico:
Textos previamente en formato electrónico = f (formato)
Tecleado = f (capturista)
Lectura óptica automática = f (software, hardware, operador, papel)
Tipos de escáneres: de sobremesa o planos (de gran tamaño), de mano (portátiles) y de rodillo (para hojas sueltas).
Reconocedores de textos
Procedimiento de digitalización
manual para la digitalización de documentos con el OmniPage se tiene aquí.
Problemas en la digitalización de textos
Lecturas obligatorias
Lecturas sugeridas
Ejercicio de la clase