Componentes de Oracle Endeca Information Discovery (OEID)
13/05/2013 -
Para ir conociendo un poco más sobre Endeca, vamos a explicar a grandes rasgos cuáles son sus componentes y qué aporta cada uno de ellos.
En primer lugar, habrá que distinguir entre la parte cliente (Endeca Information Discovery Studio) y la parte servidor (Endeca Server), puesto que podemos utilizarlos conjuntamente, o utilizar el Server como motor de datos para otras aplicaciones.
En el gráfico a continuación, representamos cada uno de los componentes, ubicándolos en la capa funcional correspondiente.
Oracle Endeca Information Discovery
Se compone a su vez de dos productos: Studio y Integrator, que actúan de interfaces de Endeca Server tal y como veremos a continuación:
- Oracle Endeca Information Discovery Studio. Es la herramienta para la creación y explotación de aplicaciones para descubrir información. Es 100% web y con ella, los usuarios de negocio podrán ir interrogando al motor, que les irá respondiendo y descubriéndo nuevos datos o relaciones que le llevarán a nuevas preguntas, para así ir tejiendo sobre la marcha, sin reglas preestablecidas, una red de nuevos conocimientos a medida que se va descubriendo la información. Las aplicaciones están compuestas por páginas que se organizan en pestañas que contienen los diferentes componentes gráficos que ofrecen las siguientes funcionalidades: navegar o buscar datos, mostrar información detallada, mostrar gráficas y otras representaciones de datos, manipular y analizar datos, resaltar datos específicos. Como complemento para agilizar el desarrollo y dar mayor independencia a los usuarios, dispone del Provisioning Service, una herramienta que permite a los analistas de negocio subir sus propias hojas de cálculo y empezar a crear sus aplicaciones a partir de ellas. Cabe destacar también que ofrece integración SOA.
- Oracle Endeca Information Discovery Integrator. Mediante el Integrator Acquisition System (IAS) proporciona las herramientas necesarias para la adquisición (desde sistema de ficheros, gestores de contenidos, servidores Web y orígenes de datos propietarios) y enriquecimiento de datos (normalización, cleansing, extracción de tags, análisis sentimientos, descubrir ubicaciones geográficas), más próximas a un perfil de usuario de TI, con necesidades o exigencias más complejas: porque requieren una cierta orquestación o de un proceso más elaborado para su extracción.
Oracle Endeca Server (motor MDEX)
Es el motor de BD de búsqueda-analítico que se encarga de organizar datos complejos y variados provenientes de orígenes diversos en un modelo extremadamente flexible que reduce la necesidad de modelar los datos. Es muy escalable (puede tener múltiples nodos) y permite explorar y navegar por los datos de manera espontánea y sin restricciones, respondiendo rápidamente a las preguntas que van surgiendo tras cada nueva conclusión.
Cada aplicación cuenta con un Data Domain, el conjunto de datos y metadatos gestionado por Endeca Server. Por cada data domain existirán n procesos DGraph, que almacenan los índices creados tras la “ingesta” de información, y que serán los responsables de procesar las peticiones de los usuarios a medida que avanzan en el análisis y el descubrimiento de información.
Siendo SOA nativo, articula su funcionamiento a través de diversos web services, algunos de uso interno, y otros, como los que destacamos en el gráfico, lo comunican con el exterior: el WS Data Ingest es el que recibe los datos, bien provengan de un usuario de negocio vía Provisioning Service o de un origen más complejo que haya sido procesado mediante Integrator. Como alternativa a este WS, existe también un proceso llamado Bulk Load Interface, diseñado para cargas masivas de datos desde disco. La comunicación con la capa de aplicación, se realiza a través del Conversation WS.