用户登录
用户注册

分享至

开源技术领军大数据应用

  • 作者: 好快的时间
  • 来源: 51数据库
  • 2020-10-10

    企业将被迫根据数据量的增长点来扩大他们的基础设施的规模,而传统的“规模”技术,遗留系统和授权模式根本不起作用。从其发端开始,开源技术就一直站在海量数据管理的最前沿。今天,开源提供了最有效的方式来解决这样一个大规模的问题,并能够保证较之一小部分的替代解决方案做得更快,更准确。


    开源的数据和分析产品不再是其曾经的那样属于危险的赌注。他们现在不可或缺的业务组成部分,专有软件真正的替代。其具有一套基本的工具和坚实的技术基础,开源已成为一个引人注目的非常强大、极具成本效益的企业应用和基础设施建设模块。它已经登上了主流:不仅在供应商领域,同时还包括所有类型和规模的企业客户内部。


    一个全新世界的创新


    大多数新的大数据框架和数据库在开放源代码的世界里都有其根源,开发者经常创造出一些还没有进入主流的新的问题解决方法。这方面的代表企业包括许多大的网上通讯和数据交易供应商--Facebook、雅虎、亚马逊、Twitter和易趣网。他们均使用有助于创新开放性开发的举措。大数据重要性的普及及其成长可直接归因于开放源码。


    最终用户都开始改变他们的商业模式以支持Hadoop,努力创造新的数据服务。这改变了企业如何思考他们的数据库、数据仓库和智能系统。例如,沃尔玛最近表示,他们改变了其电子商务模式,通过将10个网站转移到一个,并从TrialSize系列十节点Hadoop簇转移到250节点Hadoop簇。同时,沃尔玛将建立若干工具从甲骨文、Netezza和EMCGreenplum系统来迁移数据。他们希望采用开放源码工具。沃尔玛还将使用一些现有的数据仓库技术,但程度要小得多。


    虽然这些公司是更好的Hadoop的发展的合作伙伴,但客户将只能选择一个给定的供应商合作伙伴进行部署。当然他们对于ApacheHadoop堆栈都做出了相同的贡献。这就是开源的美妙之处。大数据的技术复杂性是如此之大,你需要的是一个社会的共同努力,而不是仅仅靠单一的供应商来解决它。


    展望未来,我们将开始看到越来越多的“混合型”平台,企业之间共生的软件:甲骨文OracleExadata与Cloudera,或EMCGreenplum与MapR.开放源码运动将带来更大的创新,通过数据集成工具来处理开源和客户的遗留系统之间的鸿沟。


    企业期望利用大数据,不仅要了解像Hadoop这样的基础技术的复杂性,而且还需要有相关的基础设施,以帮助他们做出战略性决策的时代已经到来。没有这些配套能力,大数据将仍然是一个IT的特权,并仍然是业务线上的业务人员所无法企及的范围。


    如果你想减轻Hadoop的复杂性吗,你需要熟练的资源和互补的技术。随着企业Hadoop市场的不断成熟,企业为最苛刻的分析挑战部署集群,数据科学家们将继续利用开源为中心平台,以满足这些关键需求。
 


软件
前端设计
程序设计
Java相关