艾伦•西蒙

可以将数据建模看作是数据和系统的等等物,就像制造公司在开始构建实际对象之前构建汽车、家用电器或飞机的模型。模型帮助我们描绘出不同对象和子系统如何相互关联的概念图。我们可以在花费大量的时间和资源在实际对象上之前就计算出这些细节。

在数据模型的情况下,我们可以列出主要的数据块如何相互关联,它们各自的特征和属性是什么,以及哪些业务规则应用于整个模型以及较小的组件。数据科学家、数据分析师、软件开发人员和其他人可以使用数据模型的描述性内容,在构建分析模型、软件的数据定义和组织数据的其他用途之前,清楚地了解每一段数据的实际含义。

掌握数据建模基础

最后更新2020年3月

畅销书
  • 37个讲座
  • 初学者水平
4.3 (1646)

实体关系技术和最佳实践阿兰•西蒙

探索课程

在本文中,我们将深入挖掘数据建模的基础知识,并回答一些常见的问题:为什么它是数据科学的重要组成部分?

数据建模是如何工作的?

数据建模帮助我们以高度概念化的方式开始处理数据。它的目的是比许多数据库更接近地反映现实世界。此外,建模可以沿着概念-逻辑-物理生命周期转换和映射数据,一直到设计为支持最佳在线性能和响应时间的高度调优的数据结构。

换句话说,数据建模是一种镜像以概念性视图和结束的其他类型技术,例如软件开发和业务流程建模的思考。bob外围官网

数据科学家何时使用建模?

数据科学团队负责构建复杂的分析模型,为广泛的预测和探索/发现分析奠定基础。这些分析模型的关键构建块是获得正确的数据。这意味着准确地理解每个数据元素的含义、其内容值的可能范围或列表、数据实例是否必须存在或是否允许缺失数据(例如,是否允许NULL值)、数据如何与其他数据关联等等。

数据模型帮助数据科学团队充分理解数据,并确定任何可能影响其模型有效性和准确性的问题。

掌握数据建模基础
艾伦•西蒙
4.3 (1646)
畅销书
面向初学者的数据仓库基础
艾伦•西蒙
4.5 (3358)
畅销书

课程:Alan Simon

数据建模的三种类型是什么?

现在,我们已经了解了数据建模工作原理的基础知识,下面让我们介绍三种类型的数据模型,每种模型在数据库系统中都有自己的角色。

概念数据模型

概念数据模型在理想情况下尽可能地反映现实世界。换句话说,我们试图避免特定数据库管理系统的约束,这些约束通常要求我们的数据以非常特定的方式结构化,有时包括“人工”数据库表或其他克服这些约束所必需的结构。相反,我们希望概念模型用实际的对象、特征、关系和业务规则来表示特定的业务问题,或者我们构建它的目的。

逻辑数据模型

逻辑数据模型将概念模型映射到特定于数据库的结构集。例如,在关系数据库中,我们有某些结构,如由行和列组成的表。我们采用我们在概念层次上构建的模型,并应用我们需要进行的任何转换,以便使模型现在符合关系数据库的规则,或我们正在使用的任何类型的数据管理系统。

物理数据模型

在物理层,我们通过两种方式对逻辑模型进行调整。第一种方式是由特定于产品的特性和限制驱动的。第二种方法尝试在数据库实际填充和实现数据后提高性能和响应时间。

所有三个级别都非常重要,数据建模生命周期理想情况下包括三个级别中的每个级别的实质性参与。

什么是常见的数据建模工具?

数据建模工具是一种专门的软件,它不仅允许我们绘制主要的数据建模结构——实体、属性和关系——而且还将语义附加到这些对象上。这些含义可能像属性的数据类型和大小一样简单,也可能像管理数据模型上两个实体之间特定关系的业务规则一样复杂。

语义然后帮助我们将反映现实世界的高度概念性模型转换为特定于数据库的结构,从而成为一个或多个应用程序和系统的数据管理平台。

数据建模工具可以从Microsoft Visio等通用封装中,它已经演变为一个全功能的产品来构建和管理数据模型,专业软件,如CA Erwin,ER / Studio数据架构等。这是看五个最受欢迎的工具。

  1. Microsoft Visio

如果您不需要非常专业的软件,那么Microsoft Visio可能是一个很好的开始。它的图表是专业和直观的。此外,流程图模板是现代的,您可以在工具中与您的团队协作,以获得真实世界的见解。

  1. CA Erwin

如果您使用Windows作为操作系统并正在寻找使用结构化和非结构化数据的数据建模器,Erwin Data Modeler是一家屡获殊荣的高质量建模工具。

  1. ER /工作室

Idera的ER/Studio是另一个在Windows下运行最好的软件。使用企业团队版本,您可以对来自BI、大数据、ETL、NoSQL和关系源的数据建模,还可以实现命名标准、定义术语表术语,并将模型保存在存储库中供其他团队成员查看。

  1. PowerDesigner

SAP PowerDesigner工具最适合用于数据建模、lync-and-sync和元数据管理。该界面易于导航,并具有一个存储库,因此您可以轻松地与您的团队协作。这个工具最适合Windows。

  1. Navicat

在任何操作系统上使用Navicat。与其他一些工具相比,它是构建高质量数据模型的一种更经济有效的方法,而且您仍然可以执行许多相同的任务。Navicat最适合于正向工程和/或反向工程,从其他数据源导入模型,或生成复杂的SQL/DDL。

流行的数据建模技术

数据建模的方法不止一种。正确的技术将取决于您的用例和业务需求。一些数据建模方法可以被认为是以数据库为中心的,这意味着它们致力于数据和数据对象之间关系的图形化描述,最终目标是设计和创建数据库。其他技术在本质上更具整体性,它们协同处理数据模型,同时处理流程建模和系统开发的其他方面。bob外围官网

大多数方法都可以追溯到实体-关系(E-R)模型,该模型始于1976年Peter Chen的学术论文,并经过多年的发展。另一种与经典E-R建模密切相关的技术是所谓的“鱼尾纹表示法”,它遵循许多与“经典”E-R建模相同的规则,但使用不同的符号来表示数据和业务规则。

E-R模型,不考虑符号,表示现实世界的对象。实体是现实世界中的事物。它有一组属性或属性,这些属性可以有值。因为可以有很多实体,所以这些实体之间可以有关系。因此,E-R建模对这些实体以及它们之间的属性和关系进行建模。

现在,我们已经讨论了很多关于数据建模的内容,所以您可能想知道它如何适合您的职业发展。bob外围官网IT和数据专业人员可以将数据建模作为他们所做的以数据为中心的工作的一部分(数据仓库或将数据模型作为更大工作主体的一部分,如定制软件开发、打包软件开发或数据科学和机器学习。bob外围官网一般来说,数据建模对于任何处理数据的人来说都是一项非常重要的技能。有些人可以把数据建模作为他们职业生涯的中心点,或者它可以成为更大的技能工具包的一部分。

让你的团队。领导行业。

使用Udemy for Business订阅在线课程库和数字学习工具。

请求一个演示

页面最后更新:2020年6月