TALEND WEBINAR : March 27th, 2018 | Step-by-Step to Enterprise Data Integration

使用 Talend Cloud 以简单架构在 Azure 上构建大数据湖

使用 Talend Cloud 以简单架构在 Azure 上构建大数据湖

  • Jennifer Zhou
    Jennifer Zhou joined Talend as a Product Marketing Manager in 2016. In this role, Jennifer works with the Director of Product Marketing for Cloud to bring Talend Integration Cloud to new markets, and to drive Talend’s cloud strategy. Prior to Talend, Jennifer studied at the University of Washington Foster School of Business, where she picked up an MBA with a concentration in Finance, Marketing, and Entrepreneurship. Jennifer brings 6 years of marketing and business development experience from companies such as EMC, F5 Networks, and Microsoft.
  • March 12, 2018

大数据已成为企业塑造自身未来的最重要工具。Amazon、Uber 和 Netflix 等大公司都选择使用大数据,帮助加速推动从客户参与到新产品开发,再到业务优化策略等各个领域的创新。Hadoop、Spark、Kubernetes 和 Kafka 等大数据技术的崛起,以及云技术的广阔前景,让无数企业轻而易举地完成了各种大数据计划。云计算的采用已为公司带来诸多利益,比如提高供应速度、市场投放速度、灵活性和敏捷性,增加即时扩展性,以及降低总体 IT 和业务成本等等。

即刻开始使用 Azure Talend Cloud

在各种领先的云平台中,应用最广泛的是 Microsoft Azure, 一个安全、灵活的企业级云平台,可提供 IaaS、PaaS、SaaS 及其他多种开发工具和框架,有利于创建数据湖和交付企业大数据分析

Talend Cloud 则是一个开放且高度可扩展的云集成 (iPaaS) 解决方案,可以简化数据和应用程序集成操作。Talend Cloud 的功能包括:

  • 多样性连接:允许连接到任何本地部署数据库、SaaS 应用程序、云应用程序、Azure Blob 存储、Azure Data Lake Store、Azure HDInsight、Azure SQL 数据仓库、Azure CosmosDB 等等
  • 源生 Spark 和 Hadoop 支持
  • 内置数据质量
  • 自助服务功能,比如数据准备、数据管理和数据治理
  • 企业功能,比如 SDLC 和多云支持

Azure 上创建大数据湖,获取准确可靠的数据

Talend 和 Azure 长期互助合作,为共同客户提供超大规模云数据湖解决方案,最终为客户提供可执行的洞察信息。但首先应了解数据湖的含义。数据湖是一种架构,能使组织将大量数据存储到中央存储库。通常,这些数据分属不同类型且源于多种来源,组织中的各个分组都可以轻松对其进行分类、处理、分析和使用。数据湖有助于消除数据孤岛,能够 360 度全方位掌握组织、客户和合作伙伴数据。与传统的数据存储和分析相比,数据湖 - 尤其是在云环境中构建的数据湖 - 有助于提高灵活性和敏捷性。当采用新的 IT 解决方案、连接新的数据类型和数据源,以及执行新型分析时,数据湖架构可以快速进行更改,不受响应时间的限制。

下图显示一名典型客户使用 Azure 和 Talend Cloud 所实现的数据湖解决方案:

在这个简化的用例中,全部网络、社交、机器传感器、设备或本地部署应用程序中的结构化或非结构化数据都被摄取至 Azure Data Store (ADL Store),一个用于大数据分析工作负载的超大规模 Hadoop 文件系统。ADL Store与 Hadoop 分布式文件系统 (HDFS) 兼容,并可与 Hadoop 生态系统结合使用。

随后,Talend Cloud 会帮助剖析存储于 ADL Store 中的数据,添加数据治理、业务规则,以及监管和合规要求。继而使用 Talend 源生于 Azure HDInsight 的内置数据质量工具来准备数据以备分析。最后,将经过转换和清洗的数据迁移至 Azure SQL 数据仓库,业务分析人员可以在此直接获取这些数据以用于 BI 报告。

许多公司通过使用 Talend 将 Microsoft Azure Data Lake 的数据摄取时间缩短了 50%。请观看以下视频,了解 Talend Cloud 如何帮助客户转向云计算;也可以立即申请 30 天免费试用,亲身体验 Talend Cloud 的便利功能。

Join The Conversation

0 Comments

Leave a Reply

Your email address will not be published. Required fields are marked *