Oracle lanza Big Data Service

Estamos de enhorabuena: Oracle acaba de anunciar la salida al mercado de su nuevo servicio Cloud: Oracle Big Data Service. Con este servicio Oracle redondea su oferta de Big Data y Data Management en la nube, ofreciendo uno de los portfolios más completos en estas áreas del mercado. Big Data Service acompaña a servicios como Oracle Analytics Cloud, Oracle Data Catalog, Oracle Data Flow, Oracle Cloud Data Science, Oracle SQL Cloud, etc.

 

Oracle Big Data Service es un servicio PaaS que nos da la capacidad de crear una plataforma Big Data basada en Cloudera de manera rápida, abstrayéndonos de todos los problemas de instalación y configuración, y sin los costes que implica la adquisición de todo el hardware necesario. Esto es algo muy interesante, ya que hasta ahora muchas compañías eran reticentes a crear un DataLake y gestionarlo con un sistema de Big Data por la complejidad y el coste que ello implicaba: costes de hardware y costes de licencias.

 

Veamos un poco en detalle cómo podemos crear un clúster de Big Data Service.

 

 

Oracle no nos pedirá mucha más información que la que podéis ver en la pantalla para crearnos un clúster funcional de Big Data Service. Simplemente requerirá:

  • Password para el administrador.
  • Versión de Cloudera (5 o 6).
  • Nodos Master. Los nodos que contendrán el software de gestión del clúster. Podremos elegir la máquina en la que los vamos a instalar: máquinas virtuales a hardware dedicado.
  • Nodos Worker. Los nodos que soportarán el trabajo de cómputo y almacenaje de datos. Igual que los nodos master tendremos que elegir cuántos y sobre qué máquinas queremos que corran.
  • Configuración sobre la red dentro de OCI donde correrá y opciones de claves públicas.

 

Por defecto nos instalará el siguiente software:

  • Una instalación completa de Cloudera
    • Cloudera Manager
    • Apache Hadoop
    • Apache Flume
    • Apache Hive
    • Apache Spark
    • Apache Hue
    • Apache Kafka
    • Apache Solr
    • Apache Sentry
  • Todas las herramientas y utilidades de Cloudera Enterprise Data Hub.
  • Una Api REST para la gestión del cluster.
  • Herramientas de línea de comandos para la gestión de los datos.
  • Integración con Oracle Cloud SQL, que nos permitiría analizar información no solo en Haddop sino también en Apache Kafka, Oracle NoSQL y Oracle Object Store.

 

A partir de aquí ya podremos acceder a todas las funcionalidades que nos ofrece una instalación de Cloudera, pero conviviendo dentro de un completo ecosistema de herramientas Big Data.

 

 

Sin duda Oracle da un paso adelante más en la creación de su plataforma de datos, cada vez más productos se suman a su portfolio, creando un ecosistema completo. Este ecosistema va desde la adquisición del dato, ya sea de datos en reposo o en real-time, su gestión con productos como éste, bases de datos autónomas, bases de datos NoSQL y almacenamiento de objetos y su tratamiento y exposición con herramientas de reporting, machine learning y analítica avanzada.

 

Podéis consultar la documentación de producto para conocerlo más en profundidad.

 

 

Twitter
LinkedIn
Evolución, innovación y transformación
18 Service Expertise avalados por Oracle 
Nuestra propuesta de valor
Posts 100% Oracle
Sigue nuestro día a día