Grupo de Gramática do Español

Liñas de traballo fundamentais

Estruturas sintácticas do español.

Comprende tanto o estudo dos esquemas sintácticos e elementos funcionais que os integran como das características dos verbos que desempeñan a función de predicado da cláusula. Este estudo parte en boa medida da explotación dos recursos xerados tras os primeiros estudos teóricos, a Base de datos sintácticos do español actual (BDS), na que se pode consultar o resultado por verbos, esquemas ou subesquemas sintácticos da análise de case cento sesenta mil cláusulas do español actual, procedentes dun corpus de millón e medio de palabras.

Sintaxe histórica da cláusula e da oración.

Sintaxe histórica da cláusula.

Ocúpase do estudo diacrónico das transformacións funcionais producidas no ámbito da cláusula. Analízanse así os cambios de réxime verbal no paso do latín ao romance como factor desencadeante de mutación de funcións sintácticas e reorganización de esquemas clausais; as alternancias entre as funcións sintácticas residuais e as de cuño romance, e os seus respectivos procesos de extinción e gramaticalización. Así mesmo, estúdanse os cambios derivados da desaparición da pasiva sintética, a formación dos tempos compostos con ser para a expresión da voz media e a alternancia entre estes e os seus correlatos simples (con ou sen incremento reflexivo), así como o proceso de extinción das formas perifrásticas.

Sintaxe histórica da oración.

Estudo diacrónico da oración e os seus subtipos, con especial atención ás concesivas e condicionais. Xa que tanto a estrutura da oración latina como a semántica relacional dos seus subtipos se mantiveron inalterables en español, trátase de analizar os cambios diacrónicos que afectan, fundamentalmente, á práctica desaparición dos relatores conxuntivos latinos, aos distintos e sucesivos procesos de gramaticalización das conxuncións romances, ás transformacións do sistema verbal latino, e á diacronía dos esquemas condicionais e concesivos romances.

Elaboración e desenvolvemento de corpus e recursos lingüísticos.

Elaboración de corpus textuais orais e escritos para estudos lingüísticos, así como recursos lingüísticos electrónicos de diversa índole, útiles para o propio desenvolvemento dos corpus e para a súa explotación, ademais de para ser integrados noutro tipo de aplicacións. Tras a construción da Base de datos sintácticos (BDS) a partir do corpus ARTHUS, os últimos corpus desenvolvidos polo grupo foron o Corpus de aprendices de español (CAES), o Corpus sintacticamente analizado (CSA) e o Corpus para o estudo do español oral (ESLORA), que inclúen o desenvolvemento de etiquetadores estatísticos e aplicacións de consulta en liña. Neste ámbito sitúase tamén a participación do grupo no desenvolvemento do Corpus do Español do Século XXI (CORPES XXI) e do Corpus de referencia do galego actual (CORGA).

Morfoloxía derivativa do español.

Estudo de como funcionan os mecanismos da derivación en español e cal é a súa produtividade, tanto na lingua actual como nas épocas anteriores, con especial atención á estrutura dos procesos e as súas características morfolóxicas. Os traballos máis recentes están relacionados co deseño e realización dunha aplicación en liña destinada a facer visibles en español as relacións de parentesco entre as palabras dunha mesma familia léxica. A aplicación MORFOGEN contén dous módulos: a) unha base de datos de morfoloxía do español e b) unha ferramenta de visualización que permite obter unha imaxe global da familia léxica de cada palabra consultada. A familia agrupa todas aquelas palabras que directa ou indirectamente remiten a unha mesma raíz, sexan estas variantes cultas, populares ou préstamos, á marxe do maior ou menor grao de transparencia formal e semántica que plasmen en canto á relación derivativa.

Relacións entre léxico e gramática.

Estudo de unidades léxicas de diferentes clases e subclases, con foco nos seus trazos semánticos e nas súas propiedades formais. A investigación céntrase en como deslindar as distintas subclases: nomes de evento e de resultado, adxectivos relacionais e cualificativos, nomes encapsuladores simples e complexos, adxectivos con significado modal etc.

Lingüística computacional e tecnoloxías da lingua.

Liña centrada no procesamento da linguaxe natural, tanto na análise (part-of-speech tagging, parsing sintáctico), como na extracción de información (extracción de relacións semánticas, terminoloxía, multipalabras, entidades mencionadas), como no desenvolvemento de aplicacións para a procura de respostas, resumidores, correctores gramaticales, analizadores de sentimento, etc. Este traballo, realizado polo equipo ProLNat@GE, céntrase no desenvolvemento de módulos lingüísticos para o galego, español, portugués e inglés, e deu lugar a un proxecto de software libre, Linguakit. Máis información en http://gramatica.usc.es/pln/

O español falado en Galicia.

Estudos que afondan no coñecemento do español oral mediante o desenvolvemento de novos instrumentos para o seu estudo e a análise dos seus aspectos constitutivos e a súa función social. Os traballos desenvólvense a partir do Corpus para o estudo do español oral (ESLORA) que integra entrevistas semidirixidas realizadas en Santiago de Compostela no marco do proxecto panhispánico PRESEEA e conversas coloquiais espontáneas. Unha parte da investigación céntrase na anotación morfosintáctica dos textos e no desenvolvemento da aplicación de consulta. Os datos obtidos permiten estudar a dinámica e a constitución das interaccións orais desde unha perspectiva multidimensional: léxico-gramatical, discursiva, pragmática, sociolingüística, ideolóxica. Ademais, examínanse criticamente as técnicas de obtención de rexistros orais así como outros recursos complementarios empregados na elaboración do corpus e analízanse as posibilidades de aplicación de corpus orais ao ámbito da ensinanza-aprendizaxe do español como segunda lingua.

Dispoñibilidade léxica.

A investigación en torno á dispoñibilidade léxica ten a súa orixe na lingüística francesa dos anos 50 e 60 do século pasado, e o seu obxectivo radica na recollida e posterior análise do léxico dispoñible dunha determinada comunidade de fala. Na tradición hispana a dispoñibilidade léxica tivo como traballo pioneiro o levado a cabo por López Morales (1973), pero non foi até a década dos noventa cando as contribucións neste ámbito experimentaron un extraordinario desenvolvemento grazas ao proxecto panhispánico. Este proxecto aglutina varios grupos de investigación de ambos os lados do Atlántico que traballan baixo os mesmos presupostos metodolóxicos, coa fin de coñecer o léxico dispoñible de estudantes de nivel preuniversitario e elaborar dicionarios de dispoñibilidade léxica para as diversas zonas do mundo hispánico.

Historiografía da lingüística.

Análise historiográfica da tradición lingüística española e galega, con especial énfase na historia da gramática. Varios membros do grupo publicaron traballos sobre a situación actual da historiografía lingüística española, a historia da gramaticografía española, a historia da teoría ortográfica do español e a historia da lingüística galega. Actualmente tamén se investiga a presenza de ideoloxías lingüísticas no desenvolvemento da lingüística española e analízanse e avalíanse materiais relacionados co ensino do español como primeira, segunda ou lingua estranxeira, tanto desde una perspectiva historiográfica como no que se refere ás aplicacións tecnolóxicas actuais.

Deseño e construción de bases de datos bibliográficas.

Desenvolvemento de bases de datos destinadas a albergar información bibliográfica actualizada sobre traballos de contido lingüístico e/ou filolóxico-lingüístico referidos ao español e ao galego. No deseño destes recursos téñense en conta os retos que formulan as novas tecnoloxías da información:

  1. A difusión a través de Internet, que require transformar e enriquecer os parámetros ata agora utilizados nas obras impresas do mesmo tipo para facilitar unha recuperación de información axustada ás necesidades de cada usuario.

  2. A creación de recursos abertos a constantes ampliacións.

  3. A incorporación das edicións dixitais como novas formas de divulgación dos resultados da investigación científica.

Estudos contrastivos léxico-sintácticos.

Con implicacións teóricas e aplicadas, trátase dun conxunto de estudos de carácter contrastivo cuxos principais obxectivos son: a) o establecemento do potencial combinatorio de lexemas semanticamente próximos do alemán, o español e o portugués, con atención ao contraste inter- e intralingüístico; b) a aplicación dos resultados, especialmente relevantes no ámbito de aprendizaxe de segundas linguas e linguas estranxeiras e, máis en concreto, en situacións de produción e tradución. O interese teórico céntrase na interrelación entre o significado léxico e as características combinatorias.

Ensino do español como lingua estranxeira.

Esta liña de investigación céntrase en cuestións como as seguintes:

  1. Estudo de distintos aspectos relacionados co ensino de idiomas: factores e estratexias de aprendizaxe, orientacións metodolóxicas, compoñentes da competencia comunicativa, desenvolvemento das destrezas lingüísticas etc.

  2. Análise e elaboración de materiais de ensinanza-aprendizaxe.

  3. Uso e explotación de corpus lingüísticos e de aprendices (orais e escritos), como fonte para a descrición do funcionamento da lingua e da interlingua de falantes non nativos e para a elaboración de materiais de ensinanza-aprendizaxe.

  4. Análises destinadas á avaliación de diversos aspectos no ámbito do ensino de ELE: a) a atención que se outorga á diversidade intralingüística nos materiais didácticos; b) as estratexias de aprendizaxe e o fomento do traballo autónomo a través das TIC; c) a mobilidade estudantil e a aprendizaxe de linguas.

Convén resaltar a experiencia dalgúns membros do equipo de investigación no desenvolvemento de corpus de aprendentes de español, concretamente do Corpus de aprendices de español (CAES), proxecto promovido e financiado polo Instituto Cervantes.

Fraseoloxía.

A investigación fraseolóxica que desenvolvemos está centrada nos esquemas sintácticos fraseolóxicos, padróns construcionais recorrentes que se compoñen de certos constituíntes fixos (normalmente palabras gramaticais) e outros que, aínda que poden considerarse slots libres, están sometidos a certas restricións semántico-combinatorias dentro do propio esquema. Desde un punto de vista semántico, estas construcións non teñen un significado totalmente composicional, xa que adoitan presentar un compoñente pragmático adicional non deducible da suma dos significados parciais dos seus constituíntes.