艾伦•西蒙

认为数据建模的数据和相当于一个生产企业建立汽车,家电,或飞机模型的系统在他们开始建设的实际对象之前。模型帮助我们描绘出不同的对象和子系统如何将涉及到另一个概念图片。我们的时间和资源的昂贵的投资转化为实际的对象过不了多久制定出这些细节。

在数据模型的情况下,我们可以制定出如何将数据的主要部分将涉及到另一个,有什么各自的特点和属性,以及业务规则适用于模型作为一个整体,以及更小的组件是什么。数据科学家,数据分析人员,软件开发人员,而其他人可以使用一个数据模型的描述性内容是水晶上清楚每件实际数据的装置的建立分析模型,数据定义为软件之前,和组织数据的其他用途。

掌握数据建模基础

最后更新2020年3月

畅销书
  • 37个讲座
  • 初学者水平
4.3 (431)

实体关系技术和最佳实践作者:Alan西蒙

探索课程

在本文中,我们将深入研究数据建模的基本原理,并回答为什么它是数据科学的重要组成部分的常见问题。

数据如何建模工作?

数据建模可以帮助我们开始在一个高度概念化的方式处理数据。它的目的是更密切反映现实世界比许多数据库。此外,模拟转换和映射数据一起概念 - 逻辑 - 物理生命周期,一路下跌到设计,支持最好的在线性能和响应时间高度优化的数据结构。

换句话说,数据建模是一门反映其他类型技术的学科,这些技术从概念视图开始,以技术实现结束——比如软件开发和业务流程建模。bob外围官网

当进行数据科学家利用建模?

数据科学团队负责构建复杂的分析模型背后广泛的预测和探索/发现分析的。这些分析模型的一个关键构建块获取数据的权利。This means accurately understanding exactly what each data element means, the possible ranges or lists of values for its contents, whether data instances must be present or if missing data is permitted (e.g., if NULL values are allowed), how the data relates to other data, and much more.

数据模型帮助数据科学团队充分理解数据,并识别可能影响模型有效性和准确性的任何可能问题。

掌握数据建模基础
艾伦•西蒙
4.3 (431)
畅销书
数据仓库基础入门
艾伦•西蒙
4.5 (1110)
畅销书

Alan Simon授课

什么是3种类型的数据建模的?

现在我们已经了解了数据建模工作原理的基础知识,接下来让我们进入三种类型的数据模型,每种数据模型在数据库系统中都有自己的角色。

概念数据模型

概念数据模型理想反映了真实世界尽可能接近。换句话说,我们尽量避免特定的数据库管理系统,这往往会要求我们的数据在非常特殊的方式来结构的制约,有时还包括要克服这些制约因素“人工”数据库表或其他结构。相反,我们希望概念模型来表示一个特定的业务问题,或任何我们正在建设它,用实际的目的,特征,关系和业务规则。

逻辑数据模型

逻辑数据模型将概念模型映射到特定于数据库的一组结构中。例如,在关系数据库中,我们有某些结构,如由行和列组成的表。我们采用我们在概念层次上构建的模型,并应用我们需要进行的任何转换,以便使模型现在符合关系数据库的规则,或者我们正在使用的任何类型的数据管理系统。

物理数据模型

在物理层,我们通过两种方式对逻辑模型进行调整。第一种方式是由特定产品的特性和限制驱动的。第二种方法尝试在数据库实际填充并实现数据后提高性能和响应时间。

所有这三个水平是非常重要的,而数据建模的生命周期非常包括在每一个三级的大量参与。

什么是常见的数据建模工具?

数据建模工具是一种专门的软件,它不仅允许我们绘制主要的数据建模构造—实体、属性和关系—而且还为这些对象附加语义。这些含义可能像数据类型和属性大小那样简单,也可能像控制数据模型上两个实体之间特定关系的业务规则那样复杂。

然后,语义帮助我们将反映现实世界的高度概念化的模型转换为特定于数据库的构造,这些构造成为一个或多个应用程序和系统的数据管理平台。

数据建模工具可以是通用的软件包,如Microsoft Visio,它已经发展成为构建和管理数据模型的功能齐全的产品,也可以是专门的软件,如CA Erwin、ER/Studio Data Architect等。以下是五个最流行的工具。

  1. Microsoft Visio

如果你不需要难以置信专门的软件,那么微软的Visio可能是一个很好的起点。它的图是专业和直观。此外,该流程图模板是现代的,你可以在工具来获得真实世界的洞察与您的团队协作。

  1. CA欧文

如果您使用Windows作为操作系统,并且正在寻找使用结构化和非结构化数据的数据建模器,Erwin data modeler是一个屡获殊荣的高质量建模工具。

  1. ER / Studio的

井寺的ER / Studio是最适合运行Windows其他软件。使用企业团队版,您可以从BI,大数据,ETL,NoSQL的和关系数据源的数据模型以及实施命名标准,定义词汇表术语,并保存在仓库中的其他团队成员视图模型。

  1. PowerDesigner

SAP PowerDesigner工具最适合用于数据建模、lync-and-sync和元数据管理。该界面易于导航,并具有存储库,因此您可以轻松地与团队协作。这个工具最适合Windows。

  1. Navicat的

跨任何操作系统使用Navicat。与其他一些工具相比,它是构建高质量数据模型的更经济有效的方法,而且您仍然可以执行许多相同的任务。Navicat最适合进行正向和/或逆向工程,从其他数据源导入模型,或生成复杂的SQL/DDL。

流行的数据建模技术

数据建模的方法不止一种。正确的技术将取决于您的用例和业务需求。一些数据建模方法可以被认为是以数据库为中心的,这意味着它们致力于数据的图形描述和数据对象之间的关系,其最终目标是设计和创建数据库。其他技术在本质上更全面,它们协同处理数据模型,并与流程建模和系统开发的其他方面一起处理数据模型。bob外围官网

大多数方法追踪他们的根回到实体关系(E-R)模型,开始于1976年,彼得·陈的学术论文,并已发展了很多年。密切相关的经典è-R造型另一种方法是所谓的“乌鸦脚符号”,它遵循许多相同的规则为“经典” E-R模型,但使用不同的符号来表示数据和业务规则。

在E-R型,无论符号的,代表了真实世界的物体。实体是在现实世界中的事情。它有一组属性或属性的那些属性可以有值。因为可能有很多的实体,这些实体可以与彼此之间的关系。Ë-R的造型,因此,模型的实体和它们之间的属性和关系。

现在,我们已经介绍了关于数据建模很多,所以你可能想知道如何融入你的事业发展。bob外围官网IT和数据专业人士可以专注于数据建模为他们做数据中心工作的一部分(数据仓库或大数据等)或数据模型的工作作为工作,如定制软件开发,打包的软件开发或数据科学和机器学习的一个更大的身体的一部分。bob外围官网在一般情况下,数据建模是任何人谁在任何容量数据工作的非常重要的技能。有人可以使数据建模自己的职业生涯的中心点,也可以是技能较大的工具包的一部分。

让你的团队。领导行业。

通过Udemy for Business为你的组织订阅在线课程和数字学习工具库。

申请演示