API REST para automatizar procesos de DataRefiner
Hoy os traemos un vídeo explicativo sobre una nueva herramienta que hemos implementado en esta release 2.3.0; el DataRefiner, cuya finalidad es la de incorporar nuevas capacidades de Data Governance a la Plataforma.
Este módulo permite cargar datos en diferentes formatos (Excel, CSV, XML, JSON, etc.) desde el local, internet o la propia Plataforma (a través de una consulta SQL), y trabajar con ellos para hacer una limpieza, mejora, reestructuración o conciliación de estos antes de cargarlos en la Plataforma como Ontología o exportarlos como fichero.
Nuestra herramienta de DataRefiner se basa en el software open source de OpenRefine (licencia BSD-3), programado en Java con un interfaz web al estilo Microsoft Excel, al que se le hemos añadido un conjunto de extensiones para trabajar con la Plataforma.
El vídeo se estructura en tres partes:
Parte 1
Creamos un proyecto desde un fichero, llevando a cabo una transformación básica y, como resultado, crear una ontología y exportar los datos a la Plataforma en un sólo paso.
Seguidamente vamos a importar un archivo de tabla en formato xlsx, generaremos un proyecto, y transformaremos los elementos de la primera columnas a mayúsculas.
Por último, exportaremos la tabla a la Plataforma creando una nueva ontología con los datos formateados, haciendo uso del plugin de exportación.
Parte 2
Vamos a importar los datos desde la Plataforma, y crear un proyecto para refinar los datos.
Parte 3
Mostraremos el API de DataRefiner.
Esperamos que os haya parecido interesante, y os recordamos que en el Portal del Desarrollador podemos encontrar mas información sobre los ejemplos y la utilización.
YouTube | Release 2.3.0 Feature – DataRefiner