Oracle-GPU-NVIDIA, HPC y AI en la Cloud
10/12/2018 -
Oracle y Nvidia anunciaron el 10 de octubre un acuerdo de colaboración por el que Oracle es el primer proveedor de cloud pública que soporta la plataforma Nvidia HGX-2. Los servicios basados en esta plataforma aparecerán como nuevas opciones dentro de la Cloud de Infraestructura de Oracle (OCI). Oracle ya venía ofreciendo en su Cloud instancias GPU como servicio, ya sea con máquinas virtuales (VM) o no virtualizadas (Bare Metal). Estas máquinas tienen un gran rendimiento cuando son usadas para la Inteligencia Artificial (AI) y la computación de alto rendimiento (HPC) ya que los procesadores gráficos (GPU) permiten un gran paralelismo que no se consigue con un procesador convencional. Estos servidores los utilizan entre otros los Data Scientists en tareas de Investigación y desarrollo ya que puedes llegar a reducir en órdenes de magnitud los tiempos de proceso.
La plataforma Nvidia HGX-2 está compuesta por 16 GPUs Tesla V100, interconectadas por 12 conmutadores (Nvidia NVSwitch) que trabajan como un único acelerador gráfico con 2 petaFLOPs, medio terabyte (TB) de memoria y 16 terabytes por segundo (TB/s) de ancho de banda a memoria agregado. De acuerdo con las cifras de Nvidia, HGX-2 permite ejecutar cargas de machine learning casi 550 veces más rápido, de deep learning unas 300 veces y de high performance computing unas 160 veces, comparándolas con entornos de computación tradicionales basados en CPUs convencionales.
Oracle también ha anunciado el soporte nativo de las librerías RAPIDS en OCI, así como el trabajo conjunto con Nvidia para incluir su soporte en el servicio Oracle Data Science Cloud. RAPIDS es un conjunto de librerías de código abierto, desarrolladas por Nvidia junto con la comunidad para la ejecución optimizada de aplicaciones de Data Science usando infraestructura basada en GPUs. En la actualidad soporta funcionalidades analíticas y de machine learning y pronto incluirá también características de visualización de datos. RAPIDS está basado en Python (Pandas and scikit-learn) y construido sobre Apache Arrow. Está previsto que en poco tiempo se integre con Apache Spark. Se basa en las primitivas de CUDA para la optimización de los componentes hardware, pero expone el paralelismo y el acceso a memoria rápido y con gran ancho de banda de las GPUs usando la interfaz mucho más amigable de Python.
Aparte de Oracle, otros actores importantes del mundo de la ciencia de datos han anunciado el soporte a RAPIDS en sus nuevos sistemas, plataformas o piezas de software. Entre ellos se incluyen IBM, HPE, Cisco, Dell-EMC, etc. Esto asegura un amplio apoyo de la industria y un crecimiento rápido.
Por último, el anuncio del acuerdo entre Oracle y Nvidia incluye también la disponibilidad de los contenedores acelerados mediante GPU disponibles en la cloud de Nvidia (NGC) en OCI. Estos contenedores incluyen software de deep learning optimizado por NVIDIA, aplicaciones HPC y herramientas de visualización. Esto, junto con la disponibilidad de RAPIDS, permite optimizar, con muy pocos cambios en el código, aplicaciones basadas en las librerías Python de Data Science para su aceleración mediante GPUs y desplegarlas directamente como contenedores en la cloud de infraestructura de Oracle.
Este acuerdo de colaboración permitirá a Nvidia extender su ecosistema de hardware y software optimizado para GPU a los clientes de la cloud de Oracle, que a su vez obtiene una propuesta diferencial en un mercado muy competitivo. Adicionalmente, cualquier nuevo cliente de la cloud de Oracle puede obtener 300 dólares de créditos gratuitos para probar los servicios antes de comprarlos.
Para más información:
https://blogs.oracle.com/cloud-infrastructure/inside-nvidia-and-oracles-partnership-on-ai-and-hpc-in-the-cloud