SAP HANA. Acerca de los beneficios del almacenamiento en columnas

En este artículo, veremos rápidamente los principales beneficios del almacenamiento en columnas implementado en la base de datos HANA.





Las bases de datos relacionales suelen utilizar un tipo de almacenamiento de cadenas. SAP HANA utiliza tipos de almacenamiento de cadenas y columnas. En este caso, en el proceso de creación de una tabla sin especificar explícitamente el tipo, se creará una tabla con el tipo COLUMN en la base de datos. En SAP HANA, estos dos tipos de tablas son muy diferentes desde el punto de vista de un administrador de base de datos, mientras que para un desarrollador estas diferencias no siempre son obvias.





Las bases de datos orientadas a columnas son más adecuadas que las bases de datos tradicionales orientadas a filas para tareas analíticas como grandes almacenes de datos, soporte de decisiones, análisis predictivo, etc.





La memoria de la computadora está organizada en una secuencia lineal. Las tablas clásicas de almacenamiento de filas se almacenan como una secuencia de registros que contienen campos de una fila. En el almacenamiento de columnas, las columnas se almacenan en ubicaciones de memoria contiguas. La siguiente figura muestra la diferencia en el almacenamiento de memoria entre las tablas de cadenas y columnas.





Vista de almacenamiento de memoria (columna frente a fila)
Vista de almacenamiento de memoria (columna vs fila)

La principal diferencia en los tipos de almacenamiento son las operaciones de lectura, que son más eficientes con el almacenamiento de columnas que con el almacenamiento de cadenas.





, :

























, .





, . , . , , RAM CPU.





SAP HANA ( ) – Dictionary ( ). , Main, Delta store. , , . «» .





( ) M_CS_COLUMNS COMPRESSION_TYPE.





! . .





SAP HANA : . . :





(Dictionary) «Last Name» «Location» :





Atributos del diccionario (campos Apellido, Ubicación)
( Last Name, Location)

, , , . .





integer, . :





Vector de atributo de apellido
Last Name
Vector de atributo de ubicación
Location

, , , . , . , , .





, , , . CPU. , CPU. , , , (). CPU. SAP HANA.





Capacidades de almacenamiento de columnas simultáneas

– , . (). , Join. . , , .





, , . .   





En este artículo, echamos un vistazo rápido a los principales beneficios del almacenamiento en columnas implementado en la base de datos SAP HANA. Este es el tipo de almacenamiento predeterminado. En cierto sentido, este es el intento de SAP de unir los dos mundos de las aplicaciones OLAP y OLTP, ya que las tablas en columnas no solo aumentan el rendimiento en las operaciones de lectura, sino que también le permiten construir vistas analíticas "pesadas" en sistemas transaccionales.








All Articles