Grupo de Gramática del Español

Líneas de trabajo fundamentales

Estructuras sintácticas del español.

Comprende tanto el estudio de los esquemas sintácticos y elementos funcionales que los integran como de las características de los verbos que desempeñan la función de predicado de la cláusula. Este estudio parte en buena medida de la explotación de los recursos generados tras los primeros estudios teóricos, la Base de datos sintácticos del español actual (BDS), en la que se puede consultar el resultado por verbos, esquemas o subesquemas sintácticos del análisis de casi ciento sesenta mil cláusulas del español actual, procedentes de un corpus de millón y medio de palabras.

Sintaxis histórica de la cláusula y de la oración.

Sintaxis histórica de la cláusula.

Se ocupa del estudio diacrónico de las transformaciones funcionales producidas en el ámbito de la cláusula. Se analizan así los cambios de régimen verbal en el paso del latín al romance como factor desencadenante de mutación de funciones sintácticas y reorganización de esquemas clausales; las alternancias entre las funciones sintácticas residuales y las de cuño romance, y sus respectivos procesos de extinción y gramaticalización. Asimismo, se estudian los cambios derivados de la desaparición de la pasiva sintética, la formación de los tiempos compuestos con ser para la expresión de la voz media y la alternancia entre estos y sus correlatos simples (con o sin incrementación reflexiva), así como el proceso de extinción de las formas perifrásticas.

Sintaxis histórica de la oración.

Estudio diacrónico de la oración y sus subtipos, con especial atención a las concesivas y condicionales. Ya que tanto la estructura de la oración latina como la semántica relacional de sus subtipos se mantuvieron inalterables en español, se trata de analizar los cambios diacrónicos que afectan, fundamentalmente, a la práctica desaparición de los relatores conjuntivos latinos, a los distintos y sucesivos procesos de gramaticalización de las conjunciones romances, a las transformaciones del sistema verbal latino, y a la diacronía de los esquemas condicionales y concesivos romances.

Elaboración y desarrollo de corpus y recursos lingüísticos.

Elaboración de corpus textuales orales y escritos para estudios lingüísticos, así como recursos lingüísticos electrónicos de diversa índole, útiles para el propio desarrollo de los corpus y para su explotación, además de para ser integrados en otro tipo de aplicaciones. Tras la construcción de la Base de datos sintácticos (BDS) a partir del corpus ARTHUS, los últimos corpus desarrollados por el grupo han sido el Corpus de aprendices de español (CAES), el Corpus sintácticamente analizado (CSA) y el Corpus para el estudio del español oral (ESLORA), que incluyen el desarrollo de etiquetadores estadísticos y aplicaciones de consulta en línea. En este ámbito se sitúa también la participación del grupo en el desarrollo del Corpus del Español del Siglo XXI (CORPES XXI) y del Corpus de referencia do galego actual (CORGA).

Morfología derivativa del español.

Estudio de cómo funcionan los mecanismos de la derivación en español y cuál es su productividad, tanto en la lengua actual como en las épocas anteriores, con especial atención a la estructura de los procesos y a sus características morfológicas. Los trabajos más recientes están relacionados con el diseño y realización de una aplicación en línea destinada a hacer visibles en español las relaciones de parentesco entre las palabras de una misma familia léxica. La aplicación MORFOGEN contiene dos módulos: a) una base de datos de morfología del español y b) una herramienta de visualización que permite obtener una imagen global de la familia léxica de cada palabra consultada. La familia agrupa todas aquellas palabras que directa o indirectamente remiten a una misma raíz, sean estas variantes cultas, populares o préstamos, al margen del mayor o menor grado de transparencia formal y semántica que plasmen en cuanto a la relación derivativa.

Relaciones entre léxico y gramática.

Estudio de unidades léxicas de diferentes clases y subclases, con foco en sus rasgos semánticos y en sus propiedades formales. La investigación se centra en cómo deslindar las distintas subclases: nombres de evento y de resultado, adjetivos relacionales y calificativos, nombres encapsuladores simples y complejos, adjetivos con significado modal, etc.

Lingüística computacional y tecnologías de la lengua.

Línea centrada en el procesamiento del lenguaje natural, tanto en el análisis (part-of-speech tagging, parsing sintáctico), como en la extracción de información (extracción de relaciones semánticas, terminología, multipalabras, entidades mencionadas), como en el desarrollo de aplicaciones para la búsqueda de respuestas, resumidores, correctores gramaticales, analizadores de sentimiento, etc. Este trabajo, realizado por el equipo ProLNat@GE, se centra en el desarrollo de módulos lingüísticos para el gallego, español, portugués e inglés, y ha dado lugar a un proyecto de software libre, Linguakit. Más información en http://gramatica.usc.es/pln/

El español hablado en Galicia.

Estudios que profundizan en el conocimiento del español oral mediante el desarrollo de nuevos instrumentos para su estudio y el análisis de sus aspectos constitutivos y su función social. Los trabajos se desarrollan a partir del Corpus para el estudio del español oral (ESLORA) que integra entrevistas semidirigidas realizadas en Santiago de Compostela en el marco del proyecto panhispánico PRESEEA y conversaciones coloquiales espontáneas. Una parte de la investigación se centra en la anotación morfosintáctica de los textos y en el desarrollo de la aplicación de consulta. Los datos obtenidos permiten estudiar la dinámica y la constitución de las interacciones orales desde una perspectiva multidimensional: léxico-gramatical, discursiva, pragmática, sociolingüística, ideológica. Además, se examinan críticamente las técnicas de obtención de registros orales así como otros recursos complementarios empleados en la elaboración del corpus y se analizan las posibilidades de aplicación de corpus orales al ámbito de la enseñanza-aprendizaje del español como segunda lengua.

Disponibilidad léxica.

La investigación en torno a la disponibilidad léxica tiene su origen en la lingüística francesa de los años 50 y 60 del siglo pasado, y su objetivo radica en la recogida y el posterior análisis del léxico disponible de una determinada comunidad de habla. En la tradición hispana la disponibilidad léxica tuvo como trabajo pionero el llevado a cabo por López Morales (1973), pero no fue hasta la década de los noventa cuando las contribuciones en este ámbito experimentaron un extraordinario desarrollo gracias al proyecto panhispánico. Este proyecto aglutina varios grupos de investigación de ambos lados del Atlántico que trabajan bajo los mismos presupuestos metodológicos, con el fin de conocer el léxico disponible de estudiantes de nivel preuniversitario y elaborar diccionarios de disponibilidad léxica para las diversas zonas del mundo hispánico.

Historiografía de la lingüística.

Análisis historiográfico de la tradición lingüística española y gallega, con especial énfasis en la historia de la gramática. Varios miembros del grupo han publicado trabajos sobre la situación actual de la historiografía lingüística española, la historia de la gramaticografía española, la historia de la teoría ortográfica del español y la historia de la lingüística gallega. Actualmente también se investiga la presencia de ideologías lingüísticas en el desarrollo de la lingüística española y se analizan y evalúan materiales relacionados con la enseñanza del español como primera, segunda o lengua extranjera, tanto desde una perspectiva historiográfica como en lo que se refiere a las aplicaciones tecnológicas actuales.

Diseño y construcción de bases de datos bibliográficas.

Desarrollo de bases de datos destinadas a albergar información bibliográfica actualizada sobre trabajos de contenido lingüístico y/o filológico-lingüístico referidos al español y al gallego. En el diseño de estos recursos se tienen en cuenta los retos que plantean las nuevas tecnologías de la información:

  1. La difusión a través de Internet, que requiere transformar y enriquecer los parámetros hasta ahora utilizados en las obras impresas del mismo tipo para facilitar una recuperación de información ajustada a las necesidades de cada usuario.

  2. La creación de recursos abiertos a constantes ampliaciones.

  3. La incorporación de las ediciones digitales como nuevas formas de divulgación de los resultados de la investigación científica.

Estudios contrastivos léxico-sintácticos.

Con implicaciones teóricas y aplicadas, se trata de un conjunto de estudios de carácter contrastivo cuyos principales objetivos son: a) el establecimiento del potencial combinatorio de lexemas semánticamente próximos del alemán, el español y el portugués, con atención al contraste inter- e intralingüístico; b) la aplicación de los resultados, especialmente relevantes en el ámbito de aprendizaje de segundas lenguas y lenguas extranjeras y, más en concreto, en situaciones de producción y traducción. El interés teórico se centra en la interrelación entre el significado léxico y las características combinatorias.

Enseñanza del español como lengua extranjera.

Esta línea de investigación se centra en cuestiones como las siguientes:

  1. Estudio de distintos aspectos relacionados con la enseñanza de idiomas: factores y estrategias de aprendizaje, orientaciones metodológicas, componentes de la competencia comunicativa, desarrollo de las destrezas lingüísticas, etc.

  2. Análisis y elaboración de materiales de enseñanza-aprendizaje.

  3. Uso y explotación de corpus lingüísticos y de aprendices (orales y escritos), como fuente para la descripción del funcionamiento de la lengua y de la interlengua de hablantes no nativos y para la elaboración de materiales de enseñanza-aprendizaje.

  4. Análisis destinados a la evaluación de diversos aspectos en el ámbito de la enseñanza de ELE: a) la atención que se otorga a la diversidad intralingüística en los materiales didácticos; b) las estrategias de aprendizaje y el fomento del trabajo autónomo a través de las TIC; c) la movilidad estudiantil y el aprendizaje de lenguas.

Conviene resaltar la experiencia de algunos miembros del equipo de investigación en el desarrollo de corpus de aprendientes de español, concretamente del Corpus de aprendices de español (CAES), proyecto promovido y financiado por el Instituto Cervantes.

Fraseología.

La investigación fraseológica que desarrollamos está centrada en los esquemas sintácticos fraseológicos, patrones construccionales recurrentes que se componen de ciertos constituyentes fijos (normalmente palabras gramaticales) y otros que, aunque pueden considerarse slots libres, están sometidos a ciertas restricciones semántico-combinatorias dentro del propio esquema. Desde un punto de vista semántico, estas construcciones no tienen un significado totalmente composicional, ya que suelen presentar un componente pragmático adicional no deducible de la suma de los significados parciales de sus constituyentes.