SAP HANA - SAP HANA

SAP HANA
Logotipo de SAP SE
Desarrollador (es) SAP SE
Versión inicial 2010 ( 2010 )
Lanzamiento estable 2.0 SPS05 (26 de junio de 2020 ; hace 12 meses ) [±] ( 2020-06-26 )
Escrito en C , C ++
Sistema operativo Linux
Disponible en inglés
Tipo Base de datos multimodelo
Licencia Software comercial patentado
Sitio web www .sap .com / products / hana .html

SAP HANA (dispositivo analítico de alto rendimiento) es un sistema de gestión de bases de datos relacionales en memoria , orientado a columnas , desarrollado y comercializado por SAP SE . Su función principal como software que ejecuta un servidor de base de datos es almacenar y recuperar datos según lo soliciten las aplicaciones. Además, realiza análisis avanzados (análisis predictivo , procesamiento de datos espaciales , análisis de texto, búsqueda de texto, análisis de transmisión , procesamiento de datos gráficos ) e incluye capacidades de extracción, transformación y carga (ETL), así como un servidor de aplicaciones .

Historia

Durante el desarrollo inicial de SAP HANA, SAP SE desarrolló o adquirió una serie de tecnologías . Estos incluyeron el motor de búsqueda TREX ( motor de búsqueda orientado a columnas en memoria ), P * TIME ( plataforma de procesamiento de transacciones en línea en memoria (OLTP) adquirida por SAP en 2005) y MaxDB con su motor liveCache en memoria.

La primera gran demostración de la plataforma fue en 2008: equipos de SAP SE , el Instituto Hasso Plattner y la Universidad de Stanford demostraron una arquitectura de aplicación para análisis y agregación en tiempo real llamada HYRISE. El ex ejecutivo de SAP SE, Vishal Sikka , mencionó esta arquitectura como "la nueva arquitectura de Hasso". Antes de que se estabilizara el nombre "HANA", la gente se refería a este producto como "Nueva base de datos". El software se llamaba anteriormente "Dispositivo analítico de alto rendimiento de SAP".

Un primer artículo de investigación sobre HYRISE se publicó en noviembre de 2010. El motor de investigación se lanzó posteriormente de código abierto en 2013 y se rediseñó en 2016 para convertirse en HYRISE2 en 2017.

El primer producto se envió a fines de noviembre de 2010. A mediados de 2011, la tecnología había atraído interés, pero los clientes comerciales más experimentados la consideraban "en los primeros días". El soporte de HANA para SAP NetWeaver Business Warehouse se anunció en septiembre de 2011 para estar disponible en noviembre.

En 2012, SAP promovió aspectos de la computación en la nube . En octubre de 2012, SAP anunció una plataforma como oferta de servicio llamada SAP HANA Cloud Platform y una variante llamada SAP HANA One que usaba una menor cantidad de memoria.

En mayo de 2013, se anunció una oferta de nube privada administrada denominada servicio HANA Enterprise Cloud.

En mayo de 2013, Business Suite en HANA estuvo disponible, lo que permitió a los clientes ejecutar las funciones de SAP Enterprise Resource Planning en la plataforma HANA.

S / 4HANA , lanzado en 2015, escrito específicamente para la plataforma HANA, combina funcionalidad para ERP , CRM , SRM y otros en un solo sistema HANA. S / 4HANA está destinado a ser una suite de negocios simplificada, reemplazando los sistemas ERP de generaciones anteriores . Si bien es probable que SAP centre sus innovaciones en S / 4HANA, algunos clientes que utilizan sistemas que no son HANA han expresado su preocupación por verse limitados a los productos SAP. Dado que S / 4HANA requiere un sistema SAP HANA para ejecutarse, los clientes que ejecuten aplicaciones SAP Business Suite en hardware no certificado por SAP tendrían que migrar a una base de datos HANA certificada por SAP si eligen las funciones ofrecidas por S / 4HANA.

En lugar de crear versiones , el software utiliza paquetes de servicios , denominados Support Package Stacks (SPS), para las actualizaciones. Las pilas de paquetes de soporte se lanzan cada 6 meses.

En noviembre de 2016, SAP anunció SAP HANA 2, que ofrece mejoras en múltiples áreas como la gestión de bases de datos y la gestión de aplicaciones e incluye dos nuevos servicios en la nube: Análisis de texto y Análisis de observación de la Tierra. Los clientes de HANA pueden actualizar a HANA 2 desde SPS10 y superior. Los clientes que ejecutan SPS9 y versiones anteriores deben actualizar primero a SPS12 antes de actualizar a HANA 2 SPS01.

Arquitectura

Descripción general

Las distinciones clave entre Hana y sistemas de generación de SAP anteriores son que es un orientada a columnas , base de datos en memoria , que combina OLAP y OLTP operaciones en un solo sistema; por lo tanto, en general, SAP HANA es un sistema OLTAP. El almacenamiento de datos en la memoria principal en lugar de en el disco proporciona un acceso a los datos más rápido y, por extensión, consultas y procesamiento más rápidos. Si bien el almacenamiento de datos en la memoria confiere ventajas de rendimiento, es una forma más costosa de almacenamiento de datos. Al observar los patrones de acceso a los datos, es posible que se acceda con poca frecuencia a hasta el 85% de los datos en un sistema empresarial, por lo que puede ser rentable almacenar los datos a los que se accede con frecuencia o "calientes" en la memoria, mientras que los datos "calientes" de acceso menos frecuente se almacenados en disco, un enfoque que SAP ha denominado "organización dinámica en niveles".

Los sistemas orientados a columnas almacenan todos los datos de una sola columna en la misma ubicación, en lugar de almacenar todos los datos de una sola fila en la misma ubicación (sistemas orientados a filas). Esto puede permitir mejoras de rendimiento para consultas OLAP en grandes conjuntos de datos y permite una mayor compresión vertical de tipos de datos similares en una sola columna. Si los tiempos de lectura de los datos almacenados en columnas son lo suficientemente rápidos, las vistas consolidadas de los datos se pueden realizar sobre la marcha , eliminando la necesidad de mantener vistas agregadas y su redundancia de datos asociada .

Aunque los sistemas orientados a filas han sido tradicionalmente favorecidos para OLTP , el almacenamiento en memoria abre técnicas para desarrollar sistemas híbridos adecuados para capacidades OLAP y OLTP , eliminando la necesidad de mantener sistemas separados para operaciones OLTP y OLAP.

Componentes del indexador

El servidor de índices realiza la gestión de sesiones, la autorización, la gestión de transacciones y el procesamiento de comandos. La base de datos tiene un almacén de filas y un almacén de columnas. Los usuarios pueden crear tablas usando cualquiera de las tiendas, pero la tienda en columnas tiene más capacidades y se usa con más frecuencia. El servidor de índices también administra la persistencia entre las imágenes de la memoria caché de los objetos de la base de datos, los archivos de registro y los archivos de almacenamiento permanente. El motor XS permite crear aplicaciones web.

El modelado de información de SAP HANA (también conocido como modelado de datos de SAP HANA) es parte del desarrollo de aplicaciones de HANA. El modelado es la metodología para exponer los datos operativos al usuario final. Los objetos virtuales reutilizables (vistas de cálculo con nombre) se utilizan en el proceso de modelado.

MVCC

SAP HANA gestiona la simultaneidad mediante el uso del control de simultaneidad multiversion (MVCC), que brinda a cada transacción una instantánea de la base de datos en un momento determinado. Cuando una base de datos MVCC necesita actualizar un elemento de datos, no sobrescribirá los datos antiguos con datos nuevos, sino que marcará los datos antiguos como obsoletos y agregará la versión más nueva.

Big data

En un entorno de escalamiento horizontal, HANA puede mantener volúmenes de hasta un petabyte de datos en la memoria mientras devuelve los resultados de las consultas en menos de un segundo. Sin embargo, la RAM sigue siendo mucho más cara que el espacio en disco, por lo que el enfoque de escalamiento horizontal solo es factible para ciertos casos de uso críticos en el tiempo.

Analítica

SAP HANA incluye varios motores analíticos para varios tipos de procesamiento de datos. La biblioteca de funciones comerciales incluye una serie de algoritmos disponibles para abordar los algoritmos comunes de procesamiento de datos comerciales, como la depreciación de activos , el pronóstico continuo y el promedio móvil . La biblioteca de análisis predictivo incluye algoritmos nativos para calcular medidas estadísticas comunes en áreas como agrupamiento , clasificación y análisis de series de tiempo .

HANA incorpora el lenguaje de programación estadística de código abierto R como lenguaje compatible dentro de los procedimientos almacenados .

La base de datos de almacenamiento de columnas ofrece capacidades de base de datos de gráficos . El motor de gráficos procesa el lenguaje de consulta cifrado y también tiene una manipulación visual de gráficos a través de una herramienta llamada Graph Viewer. Las estructuras de datos de gráficos se almacenan directamente en tablas relacionales en el almacén de columnas de HANA. Los algoritmos prediseñados en el motor de gráficos incluyen la coincidencia de patrones, la búsqueda de vecindarios, la ruta más corta y componentes fuertemente conectados. Las situaciones de uso típicas para Graph Engine incluyen ejemplos como la trazabilidad de la cadena de suministro, la detección de fraudes y la logística y la planificación de rutas.

HANA también incluye un motor de base de datos espacial que implementa tipos de datos espaciales y extensiones SQL para operaciones CRUD en datos espaciales. HANA está certificada por el Consorcio Geoespacial Abierto y se integra con el sistema de información geográfica ArcGIS de ESRI .

Además de los algoritmos numéricos y estadísticos, HANA puede realizar análisis de texto y búsqueda de texto empresarial. La capacidad de búsqueda de HANA se basa en una búsqueda tolerante a fallas “difusa”, muy similar a los motores de búsqueda modernos basados ​​en la web. Los resultados incluyen una medida estadística de la relevancia de los resultados de búsqueda y los criterios de búsqueda pueden incluir un umbral de precisión para los resultados. Los análisis disponibles incluyen la identificación de entidades como personas, fechas, lugares, organizaciones, solicitudes, problemas y más. Dicha extracción de entidades puede adaptarse a casos de uso específicos como Voz del cliente (preferencias y expectativas del cliente), Empresa (es decir, fusiones y adquisiciones, productos, organizaciones) y Sector público (personas públicas, eventos, organizaciones). También se pueden implementar extracciones y diccionarios personalizados.

Desarrollo de aplicaciones

Además de la base de datos y las capacidades de análisis de datos, SAP HANA es un servidor de aplicaciones basado en la web , que aloja aplicaciones orientadas al usuario estrechamente integradas con la base de datos y los motores de análisis de HANA. El "XS Advanced Engine" (XSA) funciona de forma nativa con lenguajes y tiempos de ejecución Node.js y JavaEE . XSA se basa en la arquitectura Cloud Foundry y, por lo tanto, admite la noción de "Traiga su propio idioma", lo que permite a los desarrolladores desarrollar e implementar aplicaciones escritas en lenguajes y en tiempos de ejecución distintos a los implementados por XSA de forma nativa, así como implementar aplicaciones como microservicios . XSA también permite JavaScript del lado del servidor (XSJS).

El servidor de aplicaciones es compatible con un conjunto de herramientas de gestión del ciclo de vida de las aplicaciones que permiten la implementación del desarrollo y la supervisión de las aplicaciones de cara al usuario.

Despliegue

HANA se puede implementar en las instalaciones o en la nube desde varios proveedores de servicios en la nube .

HANA se puede implementar localmente como un nuevo dispositivo de un proveedor de hardware certificado. Alternativamente, los componentes de hardware existentes, como el almacenamiento y la red, se pueden utilizar como parte de la implementación, un enfoque que SAP denomina "Integración a medida del centro de datos (TDI)". HANA está certificado para ejecutarse en varios sistemas operativos, incluidos SUSE Linux Enterprise Server y Red Hat Enterprise Linux . Las plataformas de hardware admitidas para la implementación local incluyen Intel 64 y POWER Systems . El sistema está diseñado para admitir escalado tanto horizontal como vertical .

Varios proveedores de nube ofrecen SAP HANA en una infraestructura como servicio , que incluyen:

SAP también ofrece sus propios servicios en la nube en forma de:

Ediciones

Las licencias de SAP HANA se dividen principalmente en dos categorías.

Licencia de ejecución:

Se utiliza para ejecutar aplicaciones de SAP como SAP Business Warehouse con tecnología de SAP HANA y SAP S / 4HANA .

Licencia de uso completo:

Se utiliza para ejecutar aplicaciones SAP y no SAP. Esta licencia se puede utilizar para crear aplicaciones personalizadas.

Como parte de la licencia de uso completo, las funciones se agrupan como ediciones destinadas a varios casos de uso.

  • Base Edition: proporciona funciones básicas de base de datos y herramientas de desarrollo, pero no es compatible con aplicaciones SAP.
  • Platform Edition: Edición base más espacial, predictiva, integración de servidor R, búsqueda, texto, análisis, motores de gráficos y bibliotecas comerciales empaquetadas adicionales.
  • Enterprise Edition: edición de plataforma más componentes empaquetados adicionales para algunas de las capacidades de carga de datos y el marco de reglas.

Además, las capacidades como la transmisión por secuencias y ETL se licencian como opciones adicionales.

A partir del 9 de marzo de 2017, SAP HANA está disponible en una edición Express ; una versión optimizada que puede ejecutarse en computadoras portátiles y otros entornos con recursos limitados. La licencia para SAP HANA, Express Edition es gratuita, incluso para uso productivo de hasta 32 GB de RAM. Se pueden adquirir aumentos de capacidad adicionales.

Ver también

Referencias

enlaces externos