Gari-Coter: Multilingual creation and integration of Galician linguistic resources for RI through terminological and discoursive control strategies in specialised communicative fields (2004-2008).
Corpus especializado de economía
Un corpus textual de economía especializado. Constituído por trinta e dous artigos especializados tomados da Revista Galega de economía (vol. 9, nº 1 e vol. 10, nº 2), que suman 204.800 formas (tokens) palabras. Codificados estruturalmente en XML. Hai dispoñible máis material textual: aproximadamente 600.000 palabras, recollidas en ensaios sobre diversos temas de economía, con diferentes niveis de especialización, tamén codificados en XML e clasificados de acordo coas subáreas anteriormente referidas. Non se integraron no corpus de consulta en liña, nin se procesaron, porque o volume e carácter dos textos acordouse, por razóns de homoxeneidade, cos responsables dos corpus do vasco, do catalán e do español.
Todos os textos do corpus especializado están clasificados en subáreas de acordo con dúas clasificacións distintas: a mesma utilizada pola Universidade Pompeu Fabra, IULA, para o Corpus Técnic, e a utilizada polo Servizo de Normalización Lingüística da Universidade de Santiago de Compostela na base de datos terminolóxica á que puidemos acceder, estas clasificacións non se asociaron polo de agora, dado o tamaño do corpus, á ferramenta de busca desenvolvida. Codificados estruturalmente en XML. Etiquetados, lematizados e desambiguados.
De novo queremos expresar aquí o noso agradecemento ao Centro Ramón Piñeiro para a Investigación en Humanidades que, mediante un convenio de colaboración, cedeu os textos que constitúen este corpus, así como permitiu a utilización das ferramentas para o seu procesamento lingüístico.
Vocabulario do corpus