Analítica avanzada en Oracle Autonomous Database

En un post anterior os hablábamos de que Oracle ha anunciado versiones gratuitas de su base de datos Autónoma. En este artículo nos centraremos en mostrar la funcionalidad de notebooks que ofrece Oracle Autonomous Database. Esta funcionalidad, y en general todos los notebooks, estaba hasta ahora muy centrada en el mundo académico. Con la llegada de las funcionalidades de analítica avanzada y machine learning al mundo empresarial, estos aplicativos comienzan a cobrar importancia, ya que las empresas quieren explotar sus datos: generar analítica predictiva, no sólo reactiva.

 

Los notebooks en Autonomous Database están basados en Apache Zeppelin, con la particularidad de que Oracle ya nos ofrece todo el entorno configurado e integrado con la base de datos, aparte de que el código correrá dentro del motor, mejorando así el rendimiento y ahorrando grandes “trasiegos” de información.

 

 

 

Los notebooks son entornos en los que los programadores y/o científicos de datos pueden desarrollar sus algoritmos, compartir trabajo, generar ejecuciones programadas y presentar su trabajo de manera documentada y visual.

 

Las posibilidades de estos notebooks dentro del mundo empresarial son infinitas. Vamos a ver un pequeño ejemplo de cómo podemos manipular un “dataset” con esta herramienta y las facilidades que ofrece.

 

Lo primero que vamos a hacer es crear una tabla en base de datos. Para esto nos hemos basado en una fuente open data. Para esta prueba cualquier base de datos nos valdría. En concreto cargamos la tabla “SALES”, que almacenará las ventas de los últimos años de una cadena de material de oficina. Lo importante de esta tabla es que debe tener, al menos, dos campos: un campo fecha y un campo numérico que representa una cantidad vendida.

 

Una vez creado nuestro notebook, el primer paso es hacer una selección de todos los datos en formato tabla. Esto servirá para mostrar visualmente los datos con los que vamos a trabajar:

 

 

Vamos a desarrollar un algoritmo de forecasting que nos diga a futuro cómo irán las ventas durante los próximos cuatrimestres. Para ello vamos a crear un modelo predictivo apoyándonos en las funcionales analíticas que nuestra base de datos autónoma nos proporciona. En el siguiente código borraremos los modelos, crearemos una vista con los valores de tiempo y de ventas que queremos usar en nuestro modelo y crearemos una tabla para guardar las características que aplicaremos a nuestro algoritmo. Una vez terminada la configuración generaremos el modelo.

 

 

En los siguientes pasos revisaremos la configuración del modelo. Estos pasos son meramente descriptivos y no son necesarios. Los hemos realizado para que nos ayuden a entender cómo funcionan los paquetes analíticos de Oracle.

 

Para comprender bien todos los atributos y posibles funcionalidades recomendamos acudir a la documentación de Oracle debido al gran número de funciones, configuraciones y complejidad de las mismas. Vamos a revisar cómo ha trabajado nuestro modelo y qué resultados hemos obtenido. Tal y como lo hemos configurado nos ha agrupado las ventas por cuatrimestre y, por tanto, la proyección la realizará de la misma manera:

 

 

El modelo nos genera tres valores: el valor forecast y los límites superiores e inferiores o márgenes de confianza. Finalmente, mostramos en un gráfico los valores obtenidos:

 

 

Como hemos podido ver, los notebooks de Oracle Autonomous Database nos ofrecen una grandísima potencia para que programadores o científicos de datos puedan realizar diferentes modelos, cálculos y uso, en general, de los paquetes analíticos que esta base de datos ofrece. El resultado de la ejecución del modelo está persistido. Ahora podríamos usar toda esta información para explotarla desde herramientas de análisis, como puede ser Oracle Analytics Cloud o cualquier otra herramienta de reporting de terceros. Por otra parte, estos modelos generados con nuestros notebooks pueden programarse y ejecutarse de manera periódica para tener siempre los datos “frescos” para los posibles reports o análisis que queramos generar más tarde.

Twitter
LinkedIn
Evolución, innovación y transformación
42 especializaciones avaladas por Oracle
Oportunidades ilimitadas
Posts 100% Oracle
Sigue nuestro día a día