Big Data Platform

将大数据转化为值得信赖的洞察力。

使用领先的开源大数据工具快速启动并运行。

Talend Big Data Platform 可简化复杂集成,以充分利用 Apache Spark、Databricks、Qubole、AWS、Microsoft Azure、Snowflake、Google Cloud 平台和 NoSQL,并提供集成的数据质量,让您的企业可以将更多数据转化为值得信赖的洞察力。通过基于 Spark 构建的面向云、混合云或多云架构的领先数据集成和数据质量平台,充分发挥大数据的全部功能和规模优势。

Talend Fall’18 大数据产品发布新动态

Big Data Platform 特性

高级数据剖析

  • 使用本福德法则的欺诈模式检测
  • 附带指标阈值的高级统计
  • 列集分析
  • 高级匹配分析
  • 时间列相关性分析
+ 显示更多特性

大数据质量

  • Spark 和 Hadoop 上的数据清洗、剖析、屏蔽、解析和匹配
  • 针对数据匹配和重复删除的机器学习
  • 对 Cloudera Navigator 和 Apache Atlas 的支持
  • HDFS 文件剖析
+ 显示更多特性

组件

  • Hadoop 组件:HDFS、Hbase、Hive、Pig、Sqoop
  • 文件管理:无脚本打开、移动、压缩、解压缩
  • 控制与协调数据流以及与主作业的数据集成
  • 映射、聚合、排序、扩充及合并数据
+ 显示更多特性

连接器

  • 云:Amazon Web Services (AWS)、Microsoft Azure、Google Cloud Platform 等
  • 支持的大数据发行版:Amazon EMR、Azure HDInsight、Cloudera、Google Dataproc、Hortonworks、MapR
  • 无服务器:Cloudera Altus,Databricks,Qubole
  • Spark Mllib(分类、聚类分析、建议、回归)
  • NoSQL:Cassandra、Couchbase、DynamoDB、MongoDB、Neo4j 等
  • RDBMS:Oracle、Teradata、Microsoft SQL Server 等
  • SaaS:Marketo、Salesforce、NetSuite 等
  • 打包应用:SAP、Microsoft Dynamics、Sugar CRM 等
  • 技术:Dropbox、Box、SMTP、FTP/SFTP、LDAP 等
  • 可选第三方地址验证服务
+ 显示更多特性

Data Preparation 和 Data Stewardship

  • 2个免费许可和订阅
  • 从任何数据库、Excel 文件或 CSV 文件中导入、导出及合并数据
  • 导入,导出和组合CSV,Parquet和AVRO文件**
  • 导出至 Tableau
  • 自助按需访问批准的数据集
  • 共享数据准备和数据集
  • 将准备工作应用于任何数据或大数据集成流程
  • 将准备作业实施于所有云集成流中
  • 在 Apache Beam 上运行准备作业*
  • 自动发现、标准化、自动剖析、智能建议和数据可视化
  • 自定义语义类型,用于自动剖析和标准化
  • 智能选择性抽样和全运行
  • 具备基于角色安全保护的数据追踪和屏蔽
  • 清洗和扩充功能
  • Data Stewardship App,用于数据管理和认证
  • 相应地定义数据模型,数据语义和配置文件数据。定义和应用规则
  • 合并和匹配数据,解决数据错误并对数据进行仲裁(分类和认证)
  • 协调和协作活动中的活动
  • 定义用户角色,工作流和优先级,分配和委派任务,标记和注释
  • 在数据集成流程中嵌入治理和管理,并管理拒绝
  • 将人工认证和错误解决方案嵌入到MDM流程中
  • 采取无法自动处理的匹配决策
  • 通过机器学习大规模重复数据
  • 审核和跟踪数据错误解决操作。监控活动的进度。根据业务需求撤消/重做
+ 显示更多特性

数据质量和治理

  • 使用图形图表和深入分析数据进行数据分析和分析
  • 自动进行数据质量错误解析及执行规则
  • 数据清理和掩蔽
  • 具有监控、报告功能和仪表板的数据质量门户
  • 附带自动模式检测的语义发现
  • 全面存活
  • 数据抽样
  • 扩充、调和、模糊匹配和重复删除
+ 显示更多特性

设计与效率工具

  • Spark 上复杂 JSON、XML 和 EDI 的可视化映射
  • Spark 和 MapReduce 作业设计器
  • 生成源生 MapReduce 和 Spark 批处理代码
  • 通过Databricks和Qubole进行无服务器Spark处理
  • 动态分发支持
  • 附带 YARN 的 Hadoop 作业调度程序
  • 符合 Kerberos 的 Hadoop 安全性
  • 向数据湖中摄取、加载、转存数据
  • 图形设计环境
  • 团队协作与共享存储库
  • 持续集成/持续交付
  • 复杂JSON,XML和EDI的可视化映射
  • 审计、作业比较、影响分析、测试、调试和调优
  • 元数据桥,用于元数据导入/导出及集中化元数据管理
  • 远程运行和并行化
  • 动态模式、可重复使用的小作业和参考项目
  • 存储库管理器
  • ETL 和 ELT 支持
  • 向导和交互式数据查看器
  • 版本控制
  • 变更数据捕获 (CDC)
  • 自动文档记录
  • 可自定义评估
  • 模式库
+ 显示更多特性

许可证与支持

  • 附带保修单与补偿保证的订阅许可
  • 任何Talend订阅的2个免费数据准备和2个免费的数据管理许可
  • 可用作云服务和可下载软件

联络销售

如需了解有关我们对您的个人信息进行的收集和使用、我们的隐私和安全实践,以及您的数据保护权方面的更多信息,请参考我们的隐私政策