Como arquitecto de datos en una de las grandes empresas de servicios públicos en Australia, me preguntaba si nosotros, como empresa, deberíamos considerar VORA o no. Ciertamente, podríamos pedirle a SAP que nos haga una pequeña presentación, pero pensé en investigar un poco por mi cuenta. Me gustaría compartir mis pensamientos y observaciones con ustedes y espero que esto les ayude a ustedes o a su organización de alguna manera. Como VORA es un producto nuevo y el conocimiento/información en el mercado aún no está ampliamente disponible, hay varias preguntas para las cuales encontrar una respuesta es complicado. Intenté recopilar toda esta información en un solo lugar desde la perspectiva de un analista, arquitecto y gerente de BI.
¿Qué es VORA y qué hace?
VORA es un motor de consulta en memoria que se conecta al marco de trabajo de Apache Hadoop para proporcionar análisis interactivos. Utiliza la biblioteca SPARK SQL y el motor de cálculo HANA. VORA maneja muy bien el análisis OLAP y las consultas jerárquicas, ya que realiza algunas mejoras en Spark SQL. Puede existir de forma independiente con uno de los nodos de Hadoop, pero también puede integrarse con HANA clásico.
Características específicas de VORA vs Apache Spark
VORA es una extensión de la plataforma Hadoop e incluye las siguientes características en su primera versión:
- Procesamiento acelerado en memoria
- Consultas compiladas
- Soporte para Scala, Python y Java
- Combinación de HANA y Hadoop
- Soporte para HDFS, Parquet y ORC
- Conciencia NUMA
¿VORA está basado en SAP HANA?
No, VORA es un código completamente nuevo, pero el equipo de ingeniería es el mismo grupo que el equipo de ingeniería de HANA, por lo que se han tomado muchos conceptos e ideas de SAP HANA, como se puede ver en la lista de características. VORA y SAP HANA pueden existir por separado.
¿Quién se beneficiará al usar SAP HANA VORA?
SAP HANA VORA entregará el mayor valor a las personas en las siguientes posiciones:
- Los analistas de negocios pueden realizar análisis de causa raíz utilizando consultas interactivas en datos empresariales y de Hadoop para comprender mejor el contexto empresarial.
- Los científicos de datos pueden descubrir patrones al probar nuevas técnicas de modelado con una combinación de datos empresariales y de Hadoop, todo sin duplicar copias de datos dentro de los lagos de datos.
- Los desarrolladores de software pueden implementar un motor de consulta dentro de aplicaciones que pueden abarcar sistemas empresariales y de Hadoop utilizando herramientas de programación familiares.
¿Cuándo se lanzará VORA al mercado?
SAP VORA se lanzará el 18 de septiembre de 2015. Según la hoja de ruta y las direcciones estratégicas de SAP, estará disponible primero en la nube. Espero que todos los tipos de licencias estén disponibles a partir del 18 de septiembre, pero en caso de que haya un retraso, podría ser solo para la versión local.
Integración con Hadoop
Como se puede ver en la captura de pantalla a continuación, SAP HANA VORA estará disponible como una herramienta configurable dentro del paisaje de Hadoop. Ahora surge la pregunta de cuándo aceptarán y lanzarán esto en su paisaje las versiones empresariales de Hadoop, como HORTONWORKS y CLOUDERA. Steve Lucas, presidente del Grupo de Productos de Plataforma de SAP, mencionó en una conversación con “Fortune” que VORA es para complementar y acelerar las consultas de datos no estructurados, pero no para reemplazar Apache Spark.
Conclusión
Según mi opinión, SAP VORA será una buena adición para las empresas que ya están en plataformas SAP. Estas empresas pueden integrar sus fuentes de datos transaccionales, de lago y otras en un solo VORA y crear consultas combinadas para un análisis profundo e interactivo. Para otros, recomiendo explorar las opciones de una herramienta dentro del espacio de Big Data o considerar comprar VORA, que es un producto comercial y se ofrece por separado de HANA.
Si tienen alguna pregunta, no duden en contactarme.
Referencias:
SAP HANA VORA & HADOOP | Amandeep Modgil | LinkedIn
http://image.slidesharecdn.com/saphanavora-150902163438-lva1-app6891/95/sap-hana-vora-an-overview-8-638.jpg?cb=1441303367
http://core0.staticworld.net/images/article/2015/09/screen-shot-2015-08-28-at-1.00.47-pm-100611602-primary.idge.png
SAP HANA Vora: An Overview from SAP Technology & SAP Product guide


