Gari-Coter: Creación e integración multilingüe de recursos lingüísticos en gallego para RI mediante estrategias de control terminológico y discursivo en ámbitos comunicativos especializados (2004-2008).
Descripción de la entrada y la salida
Formato de entrada
Un fichero con texto bruto, en formato plano (plain text), codificado en ISO-8859-1.
Formato de salida
Texto en formato plano codificado en ISO-8859-1. Cada línea contiene tres columnas: (1) el término multi-palabra extraído, (2) el patrón de etiquetas morfosintácticas y (3) el grado de asociación entre las palabras que constituyen el término multi-palabra.
Ejemplo:
(1) |
(2) |
(3) |
---|---|---|
tasa de crecimiento |
N-P-N |
0.023 |
tasa interanual |
N-A |
0.056 |