何为数据冗余?

当数据库或数据存储技术中存在相同的数据时,便出现数据冗余。数据可能重复出现在同一数据库的两个不同的字段,或者多个软件平台或环境中两个不同位置。数据冗余有时是意外产生,有时是备份和恢复目的的必然产物。

由低效率编码或进程复杂性导致的数据重复会造成意外数据冗余,而目的性数据冗余则通常用于保护数据和促进一致性。

数据存储于多处并非不可,但为了避免出现问题,应为这些数据建立一个主控性的中心字段或空间,以便通过单一访问点对所有数据冗余之处进行更新。否则,由于对一个字段的更新并未自动应用到其他字段,此类数据冗余会导致数据不一致。本应一致的数据具有不同的值,将给处理带来困难。

MDM 如何减少数据冗余

数据冗余是很多企业面临的共同问题。多数大型企业拥有异构性应用程序组合,往往会导致不准确、不完整且不一致的碎片化数据驻留在各个应用程序孤岛上。期望对客户群建立一致性认识的企业往往会受到数据冗余的困扰,这些企业也苦于无法协调不同操作系统的数据。

Ready For More? Download 何为数据冗余? User Guide now.

View Now

例如,一名客户在一个系统里被称呼为 Smith 女士,而在另一个系统里为 Theresa Smith。此类问题会导致智能化决策难度增加,解决这些问题的关键则在于共享数据的处理方式。

主数据管理 (MDM) 是一个综合性方法,企业可借此将所有重要数据链接至一个“主文件”中,这一“主文件”可以提供共同的兴趣点。主数据包括客户、产品、资产、地点、员工和企业部门等。

MDM 已成为更高效地管理共享数据的方式,可减少数据冗余,创建难能可贵的“单一真实版本”。MDM 能够提供数据一致性和敏捷性,带来巨大的竞争优势和可观的投资回报率 (ROI)。

各企业正竭力追求大幅降低成本、满足合规报告强制性要求、提高销量、向客户和供应商提供优质服务,针对这些企业,分析人员宣称 MDM 是对其优先事项大有助益的解决方案。

主数据管理包含一组流程和工具,能持续定义和管理企业中的非事务性数据实体。其目的是在企业内收集、聚合、匹配、整合数据,保证上述数据质量,以及存储和分发上述数据,确保信息持续性维护和应用程序使用过程中的一致性和可控性。

Ready For More? Download 何为数据冗余? User Guide now.

View Now

Talend MDM 解决方案如何解决数据冗余问题

Talend MDM 是一个由模型驱动的非侵入型解决方案,可轻松与特定业务需求相适应,且实施迅速。它专为解决主数据创建和管理中的困难而开发,面向各类企业,尤其适用于企业数据以各种格式托管于各种系统且极具易变性的情况。

Talend MDM 提供可主控、治理和集成企业内所有数据的完整功能。它会将企业内所有主数据汇集到一个中心枢纽。这种标准化的存储库可利用数据模型,提供数据和更新通过验证的先决条件。

Talend Studio 是 Talend MDM 解决方案的关键组成部分,尤其适合解决由数据冗余引发的问题。Talend Studio 提供的处理层可确保正确的人员拥有恰当的工具,集中为主数据建立模型并处理这些数据。这一主要功能由涉及主数据治理和管理的相关功能构成。

数据治理是对主数据必须遵守的规则进行定义的过程。数据管理是确保数据遵守上述规则的过程。因此,必须同时具备治理功能和管理功能,方可确保在恰当的控制已建立的情况下,这些控制措施得以贯彻实施。

Talend Studio 中包含:

  • 数据剖析和数据质量功能通过剖析透视图实现。这些功能可使源数据在加载至 MDM 中心前得到剖析和清洗,从而保证企业主数据达到高质量标准。在剖析透视图中,用户可以剖析和清洗来自各个数据源的数据,然后把数据加载到 MDM 中心。
  • 主数据管理功能通过 MDM 透视图实现。该功能使您可以利用必要的业务规则和数据规则构建数据模型,创立数据的单一主版本,然后将该版本传播回源系统和目标系统。
  • 数据解析功能通过 Talend Data Stewardship Console 在 Talend MDM Web User Interface 中实现,可处理不同数据源匹配操作产生的记录,以及需要决策时的相关记录,最终产生最佳主数据记录。

随着数据量的增大,以及数据源和数据种类的增多,数据冗余也正成为困扰数据驱动型企业的一大难题。主数据管理可大幅减少数据冗余问题,为这些企业带来福音。

立即试用 Talend MDM 开源产品

| Last Updated: January 23rd, 2019