Proyecto para el estudio sociolingüístico del español de Galicia (PRESEGAL)

El objetivo del proyecto es contribuir al estudio del habla urbana actual de Galicia mediante la elaboración de un corpus del español oral de Santiago de Compostela. Los materiales se integran en el Proyecto para el estudio sociolingüístico del español de España y de América (PRESEEA), lo que determina la configuración de la muestra, el método de obtención de los registros sonoros y su transcripción y etiquetado. El corpus de Santiago de Compostela está constituido por 54 entrevistas semidirigidas grabadas entre 2007 y 2010 y distribuidas en cuotas fijas según edad, sexo (M/H) y nivel educativo:

Nivel de estudios
Edad Primarios Secundarios Superiores Total
20-34 6 (3 M + 3 H) 6 (3 M + 3 H) 6 (3 M + 3 H) 18
35-54 6 (3 M + 3 H) 6 (3 M + 3 H) 6 (3 M + 3 H) 18
≥55 6 (3 M + 3 H) 6 (3 M + 3 H) 6 (3 M + 3 H) 18
54

Las entrevistas se acompañan de un cuestionario sobre rasgos sociológicos y actitudes sociolingüísticas del informante. Se incluye la firma un formulario en el que el hablante da su consentimiento para el uso de los datos con finalidad investigadora y recibe la garantía de que su anonimato será preservado.

Los archivos sonoros se transcriben con el programa Transcriber 1.5, que alinea voz y texto y permite la exportación de la transcripción en diferentes formatos, lo que facilita cualquier tratamiento posterior. Para la transcripción y la etiquetación se siguen las convenciones comunes a todos los corpus integrados en PRESEEA, recogidas en el documento Marcas y etiquetas mínimas obligatorias.