何为数据仓库?为何它对您的企业至关重要?

数据仓库是大型的企业数据集合,可用于企业决策。数据仓库的概念在20世纪80年代就已存在,它的出现促进了数据从仅用于支持运营转变为可助力于决策支持系统,最终实现商业智能。数据仓库中的海量数据来自不同的数据源,其中包括内部应用程序(如市场营销类、销售类和财务类的应用程序)、面向客户的应用程序,以及外部合作伙伴系统等。

在某种技术层面,数据仓库可从上述应用程序和系统中周期性提取数据,随后将数据格式化并导入进程,与数据库中已有的数据进行匹配。数据仓库将存储这些已经处理的数据,以备决策者进行访问。数据提取的频率和数据格式化的方式等,取决于企业的需求。

Ready For More? Download 何为数据仓库?为何它对您的企业至关重要? User Guide now.

View Now

数据仓库的若干优势

将数据仓库用于分析和商业智能的企业可获得诸多优势:

  • 数据质量提高:将数据源添加至数据仓库使企业能够确保从该数据源收集的数据具有一致性和相关性。在数据进入系统时,企业不必考虑该数据是否具有可访问性或是否具有一致性。如此一来,数据质量数据完整性得以提高,从而增强了决策的可靠性。
  • 决策速度加快:仓库中的数据格式一致,便于进行分析。此外还可增强分析能力,获得更完整的数据集,使决策具有坚实事实依据。决策者从此不必再依赖预感、不完整数据或低质量数据进行决策,从而降低滞后及不准确的决策结果所带来的风险。

 

数据仓库与其他技术的区别

1. 数据仓库不同于数据库

数据仓库和数据库很容易混淆,因为这两者的概念有一些相似之处。然而,在企业需要基于大型数据集合进行分析时,这两者之间最主要的区别便会显现出来。数据仓库专为处理此类任务而开发,数据库却并非如此。以下图标展示了数据仓库和数据库的区别:

 

数据库

数据仓库

概念

为多个事务性目的而收集的数据。对其进行优化以便进行读/写访问。

聚合型事务性数据,为实现分析目的而进行转换和存储。对其进行优化后可实现对大型数据集的聚合和检索。

用途

数据库的设计目的是实现信息的快速记录与检索。

数据仓库可存储来自多个数据库的数据,为数据分析提供便利。

类型

数据库可在数据仓库中使用,但该术语通常是指在线的事务性处理数据库。数据库也包括其他类型,例如 csv、html 和以数据库为目的的 Excel 工作表。

数据仓库是分析型数据库,位于事务性数据库的上一层级,用于分析。


2. 数据仓库不同于数据湖

数据湖和数据仓库虽然都是用于业务分析目的,但两者之间的主要区别在于:数据湖内存储的数据在投入使用前,涵盖了来自所有数据源的所有类型的原始的、结构化的和非结构化地源生格式数据;而数据仓库则是以更加井然有序的方式将数据存储在文件或文件夹中,使之可直接用于生成报表或数据分析。

3. 数据仓库不同于数据集市

数据仓库有时会与数据集市相混淆。但数据仓库通常规模更大,所含的数据更加多样化,而数据集市则限于其应用目的。

数据集市通常是数据仓库的子集,其目的是轻松向特定用户提供特定数据,以实现特定应用目的。一言以蔽之,数据集市可看作是针对单一主体的,而数据仓库则涵盖多个主体。

数据仓库的未来:云端迁移

随着企业逐步实现云端迁移,企业的数据库和数据仓库工具也在同步转向云端。云计算技术可提供诸多优势:灵活性、协作、随时随地可访问性等等。Amazon Redshift、Microsoft Azure SQL Data Warehouse、Snowflake 及 Google BigQuery等常见工具为企业将云数据存储于数据仓库并对云数据进行分析提供了简便的方法。

云模式降低了曾制约采纳和成功使用数据仓库技术的准入门槛,尤其是在降低成本、减少复杂性和缩短时间到价值的转化周期方面。企业可以借此根据自身需求扩展或缩减(即开启或关闭)数据仓库的功能。此外,数据仓库的启用快捷方便,无需大量前期投资,也不需要费时且同样成本高昂的部署过程。

云数据仓库极大地规避了本地部署数据仓库范式中常见的风险,企业无需再为相关硬件和软件作出预算或进行采购,也可省去每年的维护和支持相关的预算项目。实现向云端迁移后,曾困扰数据仓库团队的成本问题(即为已计划和未计划的系统升级编制预算)迎刃而解。

Ready For More? Download 何为数据仓库?为何它对您的企业至关重要? User Guide now.

View Now

数据仓库示例

Beachbody 是一款提供健身、营养和减重等服务的供应商,在业内居于领先地位。该公司需要更好地定位目标客户,并向客户提供个性化服务和产品,以提高客户的健康水平,最终提升自身经营业绩。

公司改进了原有的分析架构,将基于 Hadoop 的云数据湖添加到 AWS上,并借助Talend Real-Time Big Data所提供的技术支持。新架构使 Beachbody 的数据获取时间减少了 5 倍,同时提高了市场推广活动所使用的数据库的准确性。

探索数据仓库的力量

企业从简单数据库步入数据仓库时代后,可从分析工作中获益更多。找到符合企业需求的数据仓库解决方案可彻底改进企业高效服务客户和扩大经营规模的方式。

如需了解数据仓库对您的企业和数据产生作用的方式,请下载 Talend Open Studio - 我们的免费开源集成软件平台。

| Last Updated: January 23rd, 2019

Most Downloaded Resources

Browse our most popular resources - You can never just have one.