Syntactic database of contemporary Spanish (1988-2001).
La Base de Datos Sintácticos del español actual (BDS) contiene el resultado de analizar manualmente las aproximadamente 160.000 cláusulas de que consta la parte contemporánea del Archivo de Textos Hispánicos de la Universidad de Santiago (ARTHUS). Cada registro del fichero central consta de 63 campos organizados en cuatro grandes bloques (más algunos campos dedicados a procesos internos y útiles para búsquedas):
Datos referentes al verbo que actúa como predicado y su localización (texto, página y línea).
Datos referentes a la cláusula como conjunto (tipo de cláusula, función que desempeña, voz, polaridad, modalidad, forma verbal empleada, forma verbal de la que depende (si el dato es pertinente), orden de los elementos, etc).
Datos referentes a cada una de las funciones sintácticas que pueden existir en la cláusula (sujeto, complemento directo, complemento preposicional, etc.). Para cada una se indica el tipo de unidad que la realiza y otros factores de interés.
Observaciones.
En la BDS se ha intentado dejar constancia de todos los rasgos que pueden ser importantes en cada elemento, pero manteniendo siempre la posibilidad de integrar la información en el nivel de profundidad conveniente en cada caso. Así, a la hora de indicar la clase de la cadena que realiza una determinada función en la cláusula, la persona que hace la ficha tiene cincuenta y cuatro posibilidades distintas. Esa es la información primaria que contiene la BDS. Ello significa que el investigador puede obtener las referencias y todos los datos de las cláusulas en las que, por ejemplo, la función de sujeto (o de complemento directo, etc.) es realizada por un demostrativo, el relativo quien, el pronombre tú, una cláusula de infinitivo cuyo sujeto es recuperable del sujeto de la cláusula dominante, una cláusula de relativo, etc. Tomando en cuenta datos de varios tipos y conociendo la estructura de la BDS, un investigador puede obtener de ella, por ejemplo, todos los casos contenidos en el corpus en los que existe un sujeto explícito constituido por el pronombre yo, un complemento directo en forma de cláusula de que + indicativo, la forma le con referente femenino como complemento indirecto y donde, además, el sujeto esté pospuesto al predicado.
Naturalmente, tal detalle en la información sólo es pertinente para el estudio de ciertos fenómenos. Cuando se trata de conocer las posibilidades construccionales del verbo carece de sentido diferenciar los casos en los que el sujeto es una cadena del tipo las directoras, los que llegaron tarde, ellos, Juan, etc. Por esa razón, el programa ADI_ESQ, que es el que atribuye esquema y subesquema sintácticos a cada ejemplo, agrupa todos estos casos bajo la etiqueta genérica frase nominal, complementada luego con la información, situada en otro campo, que se refiere a su carácter animado o inanimado.