Organización

La Base de Datos Sintácticos del español actual (BDS) contiene el resultado de analizar manualmente las aproximadamente 160.000 cláusulas de que consta la parte contemporánea del Archivo de Textos Hispánicos de la Universidad de Santiago (ARTHUS). Cada registro del fichero central consta de 63 campos organizados en cuatro grandes bloques (más algunos campos dedicados a procesos internos y útiles para búsquedas):

  • Datos referentes ao verbo que actúa como predicado e a súa localización (texto, páxina e liña).
  • Datos referentes a la cláusula como conjunto (tipo de cláusula, función que desempeña, voz, polaridad, modalidad, forma verbal empleada, forma verbal de la que depende (si el dato es pertinente), orden de los elementos, etc).
  • Datos referentes a cada una de las funciones sintácticas que pueden existir en la cláusula (sujeto, complemento directo, complemento preposicional, etc.). Para cada una se indica el tipo de unidad que la realiza y otros factores de interés.
  • Observacións.

En la BDS se ha intentado dejar constancia de todos los rasgos que pueden ser importantes en cada elemento, pero manteniendo siempre la posibilidad de integrar la información en el nivel de profundidad conveniente en cada caso. Así, a la hora de indicar la clase de la cadena que realiza una determinada función en la cláusula, la persona que hace la ficha tiene cincuenta y cuatro posibilidades distintas. Esa es la información primaria que contiene la BDS. Ello significa que el investigador puede obtener las referencias y todos los datos de las cláusulas en las que, por ejemplo, la función de sujeto (o de complemento directo, etc.) es realizada por un demostrativo, el relativo quien, el pronombre , una cláusula de infinitivo cuyo sujeto es recuperable del sujeto de la cláusula dominante, una cláusula de relativo, etc. Tomando en cuenta datos de varios tipos y conociendo la estructura de la BDS, un investigador puede obtener de ella, por ejemplo, todos los casos contenidos en el corpus en los que existe un sujeto explícito constituido por el pronombre yo, un complemento directo en forma de cláusula de que + indicativo, la forma le con referente femenino como complemento indirecto y donde, además, el sujeto esté pospuesto al predicado.

Naturalmente, tal detalle na información só é pertinente para o estudo de certos fenómenos. Cando se trata de coñecer as posibilidades construcionais do verbo carece de sentido diferenzar os casos nos que o suxeito é unha cadea de tipo las directoras, los que llegaron tarde, ellos, Juan, etc. Por esa razón, o programa ADI_ESQ, que é o que atribúe esquema e subesquema sintacticos a cada exemplo, agrupa todos estes casos baixo a etiqueta xenérica frase nominal, complementada logo coa información, situada noutro campo, que se refire ao seu carácter animado ou inanimado.