CORPUS LINGÜÍSTICOS DEL INSTITUTO CARO Y CUERVO CLICC

A lo largo de varias décadas de investigación, el Instituto Caro y Cuervo (ICC) ha recopilado un acervo de datos sobre el español y otras lenguas de Colombia. Estos materiales fueron almacenados en varios formatos y organizados de acuerdo con diversos criterios y metodologías, por lo cual en muchos casos el acceso, uso y salvaguarda de estos archivos es una tarea compleja. En este sentido, la Lingüística de Corpus (LC) se presenta como la metodología adecuada para manejar estos datos pues permite la recolección, almacenamiento, sistematización, divulgación y explotación de muestras reales de lengua. El proyecto tiene por objetivo el desarrollo de un Sistema Gestor de Contenidos (SGC) para los corpus del ICC que se encuentran en diversas fuentes y registro (audio, texto, imágenes y video). Para lograr este objetivo se deben tener en cuenta dos campos de tratamiento: por un lado, la parte técnica relacionada con el desarrollo del SGC; y, por otro lado, la parte de planteamiento metodológico que se vincula con el diseño de protocolos y estrategias para que la información que se encuentra en diversos formatos y metodologías tenga las características de un corpus y pueda ser ingresada a la plataforma.

El desarrollo del SGC se realizará por fases que estarán ligadas a los componentes principales que lo constituyen.

Fase 1: Levantar requisitos para el SGC. Levantar, modelar y desarrollar la base de datos.
Fase 2: Modelar y desarrollar la interfaz administrativa, que a su vez está compuesta por seis módulos relacionados con las tareas y los componentes que debe manejar el sistema: sistemas, usuarios, menús, contenidos, componentes y extensiones.
Fase 3: Diseño y desarrollo de la interfaz del usuario. Implementación, pruebas y documentación.

La parte metodológica se organiza a través de las siguientes fases:

Fases 1: Asesoramiento constante para el desarrollo del SGC, teniendo en cuenta las necesidades y requerimientos para la investigación lingüística y manejo de datos lingüísticos. Revisión teórica y de materiales para la construcción de un protocolo para el paso de materiales a corpus.
Fase 2: Asesoría y trabajo con los grupos investigación para el paso de las muestras de sus investigaciones a la bases de datos y posterior trabajo con el SGC.