Análisis de datos para migración del Currículum Nacional
Currículum Nacional es uno de los sitios más vistos del Mineduc. Por distintos motivos, era necesario cambiar la tecnología de la plataforma y mejorar la forma en que los datos eran ingresados por parte de los editores y vistos por parte de los usuarios finales.
El proveedor inicial entregó como parte de un requerimiento específico, una serie de archivos correspondientes a los datos de los documentos dentro del sitio de Currículum Nacional.
La entrega inicial consistió en más de 138.000 documentos de formato xml sin un documento que describiera cada uno de los tipos de nodos y atributos del formato de esos documentos.
La tarea inicial fue comprender cuáles eran los atributos de esos archivos, y poder tener una noción de la forma que tenía el CMS inicial. Como el CMS Engine es el producto de una empresa particular, la documentación era prácticamente inexistente y por lo tanto el trabajo de análisis tenía mucho de ingeniería reversa.
Una vez que esos más de cien mil archivos pudieron ser volcados sobre una base de datos relacional, comenzó el trabajo de documentación de las relaciones y atributos de las entidades que componían la plataforma inicial.
Logramos tener una base de documentación de entidades y una base de datos relacional que representaba al sistema inicial.
Estos insumos eran suficientes como para habilitar la migración del sistema en el corto o mediano plazo.
Determinamos cuáles eran los datos faltantes en la entrega inicial, para que el Mineduc pudiera gestionar la entrega de información con el proveedor original.