Full Resource Library

何为数据准备?

数据准备是指在处理和分析之前对原始数据进行清洗和转换。这个流程非常耗时,但对于获得商业智能必不可少。如今,随着智能自助服务数据准备工具的出现,数据准备变得前所未有地轻松高效。

View Now

何为数据处理?

数据处理可将原始数据转换成更易于读取的格式,以便于计算机进行解释及企业全体员工加以使用。

View Now

何为机器学习?

机器学习是一种技术,它会向计算机提供大量外部输入,利用统计概率让计算机逐渐培养自身的“学习”能力。

View Now

何为 MapReduce?

MapReduce 是 Hadoop 框架中的一种编程模型或模式,用于访问 Hadoop File System (HDFS) 中存储的大数据。映射函数可接收输入对,进行处理,并生成另一组中间对作为输出。

View Now

数据湖与数据仓库

数据湖和数据仓库都广泛用于存储大数据,但二者并非可互换的术语。数据湖是一个庞大的原始数据池,池中原始数据的用途尚未定义。数据仓库是一个数据存储库,其中的数据为已结构化、经过筛选且已针对特定用途进行过处理的数据。

View Now

ETL 测试:简介

ETL 测试指的是在整个 ETL 流程中的应用的测试,这些测试可验证并保证数据的准确性,防止出现重复记录和数据丢失。了解 ETL 测试的 8 个阶段、9 中测试类型、常见注意事项以及确定最佳工具的方法等。

View Now

何为 Hadoop?

Hadoop 是一种基于 Java 的开源框架,可存储和处理大数据。数据存储在作为集群运行的廉价市售服务器中。其分布式文件系统可提供并发处理和容错能力。

View Now

大数据的未来

大数据指的是对于传统数据处理和数据管理应用程序而言过大且过于复杂的数据集。大数据还成为了收集、分析和使用海量数字信息以改善企业经营活动的统称。了解大数据如何推动企业变革,以及云如何推动大数据变革。

View Now

何为数据湖?

数据湖是一个中央存储库,能够以数据的原始格式存储来自多个数据源的大数据。数据湖格式的优势正吸引各企业纷纷抛弃数据仓库。了解数据湖的独特优势、其广受欢迎的原因以及如何入门。

View Now

何为数据剖析?

了解数据剖析如何帮助整理和分析您的数据,从而发挥数据的最大价值,并助您在市场上取得竞争优势。

View Now

何为 ETL(提取、转换、加载)?

提取、转换、加载 (ETL) 是一种流行的数据提取和迁移概念。下面我们将介绍这一概念如何运作、ETL 目前所处的状况、当前面临的挑战和最佳实践、ETL 在云端的应用,以及其未来前进的方向。

View Now

自助服务分析

数据让当今组织如虎添翼,但大部分公司只分析收集的一小部分数据。了解自助分析如何在众多公司中构建数据驱动文化。

Download Now

使用 Spark 进行高级分析

通过向 Hadoop 添加实时功能,Apache Spark 为大数据世界开启了前所未闻的可能性。Spark 和 Hadoop 将令各行各业各种规模的公司都能将流式大数据和传感器信息转换为即时可行的洞察,从而实现个性化推荐、预测性定价、前瞻性患者护理等各种用例。

Download Now