Full Resource Library

数据清洗简介

数据清洗通过减少数据的不一致性和错误,保持数据的高质量和完整性,让您能够做出准确的知情决策。

View Now

何为数据准备?

数据准备是指在处理和分析之前对原始数据进行清洗和转换。这个流程非常耗时,但对于获得商业智能必不可少。如今,随着智能自助服务数据准备工具的出现,数据准备变得前所未有地轻松高效。

View Now

数据提取定义

了解数据提取的定义,以及 ETL 流程如何通过支持数据集成为您的公司带来实际益处。

View Now

何为数据处理?

数据处理可将原始数据转换成更易于读取的格式,以便于计算机进行解释及企业全体员工加以使用。

View Now

何为商业智能 (BI)?

商业智能 (BI) 是用于制定数据驱动型知情业务决策的流程、技术、技能和应用程序,包括有助于决策的数据收集、聚合、分析和有意义的呈现。

View Now

何为数据冗余?

当数据库或数据存储技术中存在相同的数据时,便出现数据冗余。数据可能重复出现在同一数据库的两个不同的字段,或者多个软件平台或环境中两个不同位置。了解 MDM 如何避免数据冗余及其所引发问题的发生。

View Now

何为机器学习?

机器学习是一种技术,它会向计算机提供大量外部输入,利用统计概率让计算机逐渐培养自身的“学习”能力。

View Now

何为 MapReduce?

MapReduce 是 Hadoop 框架中的一种编程模型或模式,用于访问 Hadoop File System (HDFS) 中存储的大数据。映射函数可接收输入对,进行处理,并生成另一组中间对作为输出。

View Now

数据湖与数据仓库

数据湖和数据仓库都广泛用于存储大数据,但二者并非可互换的术语。数据湖是一个庞大的原始数据池,池中原始数据的用途尚未定义。数据仓库是一个数据存储库,其中的数据为已结构化、经过筛选且已针对特定用途进行过处理的数据。

View Now

何为数据集市

数据集市是一种面向主题的数据库,可以满足特定用户群的需求。数据集市可加快业务流程,让您在数天之内而不是数月或更长时间,即可访问数据仓库或操作数据存储中的信息。

View Now

ETL 测试:简介

ETL 测试指的是在整个 ETL 流程中的应用的测试,这些测试可验证并保证数据的准确性,防止出现重复记录和数据丢失。了解 ETL 测试的 8 个阶段、9 中测试类型、常见注意事项以及确定最佳工具的方法等。

View Now

何为 Hadoop?

Hadoop 是一种基于 Java 的开源框架,可存储和处理大数据。数据存储在作为集群运行的廉价市售服务器中。其分布式文件系统可提供并发处理和容错能力。

View Now

大数据的未来

大数据指的是对于传统数据处理和数据管理应用程序而言过大且过于复杂的数据集。大数据还成为了收集、分析和使用海量数字信息以改善企业经营活动的统称。了解大数据如何推动企业变革,以及云如何推动大数据变革。

View Now

何为数据湖?

数据湖是一个中央存储库,能够以数据的原始格式存储来自多个数据源的大数据。数据湖格式的优势正吸引各企业纷纷抛弃数据仓库。了解数据湖的独特优势、其广受欢迎的原因以及如何入门。

View Now

何为数据剖析?

了解数据剖析如何帮助整理和分析您的数据,从而发挥数据的最大价值,并助您在市场上取得竞争优势。

View Now

何为主数据管理?

主数据管理 (MDM) 是一种确保企业始终依照单一版本的当前“真实”数据开展工作和作出决策的方法。了解主数据管理对企业有何益处、需为哪些挑战制定应对计划,以及如何轻松入门。

View Now

何为数据库集成?

数据库集成是指从多个源聚合信息,并跨整个企业共享最新的纯净版信息的过程。它是大数据的运行核心。以下介绍了与数据库集成相关的流程、合作伙伴以及集成工具。

View Now


displaying pages of 2