热点推荐
ZOL首页 > 企业存储 > 新闻产业 > 新品曝料 > EMC推基于Hadoop的大数据分析开源技术

EMC推基于Hadoop的大数据分析开源技术


CBSi中国·ZOL 作者:中关村在线 王迪 【原创】 2011年05月11日 09:33 评论

  随着EMC World大会的召开,众多存储产品和技术盛装亮相大会,其中EMC公司针对常用于数据密集型分布式应用的Apache Hadoop开源软件,宣布了一项有关软件发布、集成和支持的全面战略,为客户提供了最强大、最高效率的方法,充分挖掘大数据的价值。这项战略发布,将进一步巩固EMC的领先地位。EMC今天还推出了世界上第一个定制的、高性能的Hadoop专用数据协同处理设备--Greenplum HD数据计算设备(Data Computing Appliance)。


EMC World 2011: Atmos与Greenplum亮相

  该设备结合了Hadoop和EMC Greenplum数据库,从而在一个单一、无缝的解决方案中实现了结构化和非结构化数据的协同处理。此外,EMC还推出了面向Hadoop的EMC Greenplum HD社区版和EMC Greenplum HD企业版软件。加之目前已经有12家领先合作伙伴的产品通过了相关认证,今天的发布将有助于实现实时数据交互等技术创新,提高可靠性,并使Hadoop的部署和使用更容易。

  Apache Hadoop已经迅速成长为首选的、适用于非结构化数据的大数据分析解决方案。企业正在从瞬息万变的商业环境中寻求机遇,他们发现大数据分析能带来竞争优势。基于Hadoop、利用商品化硬件对海量的结构化和非结构化数据进行批处理,给数据分析领域带来了深刻的变化。通过挖掘机器产生的非结构化数据中蕴藏的知识,企业可以做出更好的决策,促进收入增长,改善服务,降低成本。

  EMC Greenplum HD产品系列能帮助企业利用大数据分析。与今天市场上那些臃肿复杂的工具和解决方案相比,该系列产品不会增加任何额外开销和复杂性。Greenplum HD软件有社区版和企业版两种版本,是一个完整的平台,在简单的Apache Hadoop软件发布包之外,还包括安装、培训、全球支持和增值服务。

EMC World 2011: Atmos与Greenplum亮相
Greenplum HD社区版和企业版

  EMC为Hadoop提供的独特价值和功能包括:

  ·EMC Greenplum HD数据计算设备 -- 在Greenplum HD数据计算设备中,Apache Hadoop与Greenplum数据库实现了无缝集成。该解决方案支持Hadoop外部表格,因此使用户能访问驻留在Hadoop分布式文件系统(HDFS)上的数据,而无需物化数据。从Greenplum到HDFS,管理员可以并行读写文件,实现快速、简单的数据共享。借助强大的Greenplum SQL以及可访问HDFS数据的先进分析功能,可执行跨平台分析。这个整合式解决方案提供了业界惟一一个完整的大数据分析平台。

  ·EMC Greenplum HD企业版 -- 该企业版与Apache Hadoop软件实现了100%的接口兼容性。通过保持与Hadoop的接口兼容性,该企业版提供无缝的应用可移植性,同时为更大型的企业提供了所需的先进功能,包括:

  数据管理功能,如快照和广域复制;

  利用本机网络文件系统(NFS)接口进行简单的数据加载和访问;

  端到端可管理性,包括简单的集群部署、自动故障检测和通知、多站点管理以及滚动升级。

  ·最重要的是,EMC Greenplum HD企业版提供这些功能的同时,还提供了2倍到5倍于Apache Hadoop标准打包版的性能。

  ·EMC Greenplum HD社区版 -- 该社区版100%通过了的开源认证,100%支持由HDFS、MapReduce、Zookeeper、Hive和HBase组成的Apache Hadoop软件。EMC Greenplum提供针对名字节点(Name Node)和作业跟踪器(Job Tracker)的容错能力,在标准Hadoop配置中,这两者都是单一故障点。

查看本文作者 王迪 的其他文章>>
相关搜索:存储技术 
给文章打分 5分为满分(共0人参与) 查看排行>>
视觉焦点
企业存储新闻产业热点
排行 文章标题
TOP10周热门NAS网络存储排行榜
  • 热门
  • 新品
查看完整榜单>>