Full Resource Library

机器学习指南(英文版)

本指南将详述如何确认与数据相关的常见问题,如何准备数据以成功实施机器学习策略,以及探索机器学习的最佳实践将如何改善数据处理的方式,从而在商用层面定义机器学习的内涵。

Download Now

数据清洗简介

数据清洗通过减少数据的不一致性和错误,保持数据的高质量和完整性,让您能够做出准确的知情决策。

View Now

数据提取定义

了解数据提取的定义,以及 ETL 流程如何通过支持数据集成为您的公司带来实际益处。

View Now

数据湖与数据仓库

数据湖和数据仓库都广泛用于存储大数据,但二者并非可互换的术语。数据湖是一个庞大的原始数据池,池中原始数据的用途尚未定义。数据仓库是一个数据存储库,其中的数据为已结构化、经过筛选且已针对特定用途进行过处理的数据。

View Now

何为数据集市

数据集市是一种面向主题的数据库,可以满足特定用户群的需求。数据集市可加快业务流程,让您在数天之内而不是数月或更长时间,即可访问数据仓库或操作数据存储中的信息。

View Now

何为 Hadoop?

Hadoop 是一种基于 Java 的开源框架,可存储和处理大数据。数据存储在作为集群运行的廉价市售服务器中。其分布式文件系统可提供并发处理和容错能力。

View Now

何为数据库集成?

数据库集成是指从多个源聚合信息,并跨整个企业共享最新的纯净版信息的过程。它是大数据的运行核心。以下介绍了与数据库集成相关的流程、合作伙伴以及集成工具。

View Now

数据迁移

借助我们领先的开源数据迁移解决方案 Talend Open Studio for Data Integration,您可以立即取得实质性的进步,而无需费力从新构建内部数据迁移工具,或者为了购买成本高昂的专有软件而打旷日持久的预算战争。

View Now

云集成入门:从 iPaaS 到 SaaS 再到安全

The practice of cloud integration has been well-mapped, and a wide variety of tools and services exist to help with it. At the individual organization level, companies have to then make critical decisions on how to use the data they have. Let’s take a look at both.

View Now