Modelado de datos: descripción general

En nuestro trabajo, mis colegas y yo vemos a menudo cómo las empresas se enfrentan al problema de la gestión de datos, cuando hay muchas tablas y consultas y es muy difícil gestionar todo esto. En tales situaciones, recomendamos modelar los datos. Para entender de qué se trata, traduje un artículo-reseña sobre modelado de datos de Towards Data Science, en el que, además de términos y conceptos básicos, se puede encontrar un ejemplo ilustrativo del uso del modelado de datos en retail. ¡Adelante debajo del corte!





Si observa cualquier aplicación de software, verá que, en un nivel fundamental, organiza, procesa y presenta datos para cumplir con los requisitos comerciales.





Un modelo de datos es una representación conceptual para expresar y comunicar los requisitos comerciales. Muestra visualmente la naturaleza de los datos, las reglas comerciales que rigen los datos y cómo se organizarán los datos en la base de datos.





El modelado de datos se puede comparar con la construcción de una casa. Digamos que ABC necesita construir una casa de huéspedes (base de datos). La empresa llama al arquitecto (modelador de datos) y le explica los requisitos del edificio (requisitos comerciales). El arquitecto (modelador de datos) desarrolla el plan (modelo de datos) y lo envía a ABC. Finalmente, ABC llama a ingenieros civiles (DBA y DBA) para construir una casa.





Términos clave en el modelado de datos

Entidades y atributos. Las entidades son "cosas" en el entorno empresarial sobre las que queremos almacenar datos, como productos, clientes, pedidos, etc. Los atributos se utilizan para organizar y estructurar datos. Por ejemplo, necesitamos almacenar cierta información sobre los productos que vendemos, como los precios de venta o las cantidades disponibles. Estos datos son atributos de la entidad Producto. Las entidades suelen ser tablas de bases de datos y los atributos son columnas de esas tablas.





Relación . La relación entre entidades describe cómo una entidad se relaciona con otra. En el modelo de datos, las entidades se pueden relacionar como uno a uno, varios a uno o varios a varios. 





. « », , « » « ». 





: 2 — . , .





, « »:





ER .  ER- , .





, . :





— . , , , - -. :





, , , . , , — . :





:

vs

- . — , . , . 3- . OLTP   .





. , . 





 

ABC 200 . , « », «», « », « » .. 20 000 . (SKU). 6 000 -, . - (UPC). POS- 2 : , , .





, . , , ..





.





1. -





, POS-. , , , . , , .





2:





. . , . :





  • Date Dimension





  • Product Dimension





  • Store Dimension





  • Promotion Dimension





, (, , .), .





3:





, . :





4:





. :





Date Dimension:





Product:





Store:





Promotion:





Sales Fact:





  • .





  • (, ).





  • : * .





  • : , .





  • : - .





:





Paso 5: crear tablas físicas en la base de datos





Con una herramienta de modelado de datos o scripts personalizados, ahora puede crear tablas físicas en la base de datos.





Creo que se ha vuelto bastante obvio ahora que el modelado de datos es una de las tareas más importantes en el desarrollo de una aplicación de software. Y sienta las bases para organizar, almacenar, recuperar y presentar datos.








All Articles