4.2 Concordancias
Mayor información en:
- Capítulo 4, "Studing the environment: using concordances", del libro de Geoff
Barnbrook, Language and Computers.
4.2.1
Las concordancias son también listas de palabras que aparecen en un corpus, pero en lugar
de estar las palabras aisladas, lo cual ya tiene su importancia, estas se encuentran en el
contexto en el que se hayan en en corpus.
- Una concordancia también se le conoce como Key Word In Context, que se abrevia como
KWIC.
- Para análisis literarios de obras cortas, se pueden traer las concordancias
en forma de lista ordenada alfabéticamente, y por cada
palabra se presenta el contexto en el que aparece. Por ejemplo, en la siguiente tabla se
ilustran las concordancias para la palabra acerque, extraídas por Hans Flasche y
Gerd Hofmann (1980) de los Autos Sacramentales de Calderón.
LM |
1576 |
2 |
15 |
QUE A SUS ENTRADAS ME |
ACERQUE |
, |
CI |
1760 |
2 |
24 |
YO AHORA AL REBAN'O ME |
ACERQUE |
|
AM |
1615 |
2 |
25 |
AL APETITO SE |
ACERQUE |
, |
LC |
1813 |
1 |
6 |
YO DISFRAZADO ME |
ACERQUE |
|
LC |
1810 |
1 |
2 |
O QUE SE ME |
ACERQUE |
EL DEMONIO |
CA |
576 |
1 |
10 |
PIDE QUE SE |
ACERQUE |
EL DI'A |
DM |
1028 |
1 |
41 |
QUE SE |
ACERQUE |
EL TIEMPO EN QUE |
MM |
305 |
1 |
14 |
SE |
ACERQUE |
LA EXPLICACI'ON. |
DM |
1028 |
1 |
16 |
SE |
ACERQUE |
LA GRACIA DE OI'R LO |
DP |
1260 |
1 |
24 |
?QUE' SERA'? |
ACE'RQUE |
ME A OI'R LO. |
- Para corpus grandes o para análisis específicos se traen las concordancias únicamente de
las palabras que interesan. Para ello, se hace uso de un programa en donde se introduce
la palabra o el patrón del que quiera traerse la concordancia.
- En algunos programas, las concordancias son un paso posterior a la lista de palabras, pues de
esta se selecciona la palabra a traerse en concordancia.
- Las concordancias pueden traer el contexto sin modificaciones, esto es, con mayúsculas y
minúsculas y con los signos de puntuación (a menos que se quiera lo contrario).
- Por facilidad de análisis, la palabra que se analiza viene en una columna centrada, y del lado
izquierdo la parte del texto que le antecede, y del lado derecho el texto que le precede.
- En las concordancias sólo se trae el texto y no las etiquetas de marcaje. Por ello,
no se distinguen en una concordancia la tipografía del texto (fines de párrafo o tipos
de letra, por ejemplo), pero podría diseñarse un programa para que trajeta las etiquetas y así
identificar la tipografía.
El tamaño de la ventana
- La ventana se define como la cantidad de texto que puede traerse acompañando a la
palabra que se analiza en una concordancia.
- Una ventana puede ser de tamaño variable, ajustándose a una oración o frase,
como el caso de las concordancias de Los Autos Sacramentales de Calderón, o incluso a un
párrafo.
- Una ventana puede ser de tamaño más fijo y sujetarse a un número de palabras o caracteres
tanto a la izquierda como a la derecha de la palabra a analizarse. Cuando se trata de número
de caracteres, la ventana es de tamaño fijo, pero las palabras pueden cortarse. En caso de número
de palabras, éstas no se cortan, pero el tamaño de la ventana es más variable.
Una concordancia puede además traer datos sobre la fuente, tales como:
- El código identificador del documento que se trate.
- Datos bibliográficos de la fuente.
- Además de los datos de la fuente puede incluirse el tipo de fuente según su
clasificación (como el CREA).
- La ubicación de la concordancia en el texto (página, número de línea, etc.).
- En el caso de un corpus de definiciones, la fuente puede ser la palabra a definir.
La base para traer una concordancia es una palabra, pero también:
- Un conjunto de palabras.
- Lemas.
- Todas las palabras que tengan una categoría gramatical.
- Combinaciones de las anteriores (Bwana Net del IULA).
Métodos para búsquedas complejas
- Operadores Booleanos AND, OR, NOT.
- Expresiones regulares.
- Comodines asterisco e interrogación.
Orden en que pueden presentarse las concordancias
- Por orden de aparición.
- Por orden alfabético de la palabra.
- Por orden alfabético de una palabra del contexto.