Gari-Coter: Creación e integración multilingüe de recursos lingüísticos en galego para RI mediante estratexias de control terminolóxico e discursivo en ámbitos comunicativos especializados (2004-2008).
Descrición da entrada e a saída
Formato de entrada
Un ficheiro con texto bruto, en formato plano (plain text), codificado en ISO-8859-1.
Formato de saída
Texto en formato plano codificado en ISO-8859-1. Cada liña contén tres columnas: (1) o termo multipalabra extraído, (2) o patrón de etiquetas morfosintácticas e (3) o grao de asociación entre as palabras que constitúen o termo multipalabra.
Exemplo:
(1) |
(2) |
(3) |
---|---|---|
tasa de crecimiento |
N-P-N |
0.023 |
tasa interanual |
N-A |
0.056 |