大数据培训
美国上市大数据培训机构

400-111-8989

大数据培训

开源大数据经典案例

  • 发布:达内编辑
  • 来源:达内大数据培训
  • 时间:2018-06-12 17:25

开源大数据经典案例应用到哪些项目上了?开源让越来越多的项目可以直接采用大数据技术,而我国开源产品较国外来讲水平不高,国内的大部分企业还只是开源的使用者和借鉴者,目前还没有到发明创造的阶段。开源大数据经典案例项目有4家应用的较为成熟。

开源数据案例

山世光:大陆学界硕果仅存的 SeetaFace

SeetaFace 基于 C++,不依赖于任何第三方的库函数。作为一套全自动人脸识别系统,它集成了三个核心模块,即:人脸检测模块、面部特征点定位模块以及人脸特征提取与比对模块。 SeetaFace 将供学界和工业界免费使用。它的开源,有望帮助大量有人脸识别任务需求的公司与实验室,在它们的产品服务中接入 SeetaFace,大幅减少开发成本。

阿里巴巴:犹抱琵牌半遮面的 DTPAI

阿里在2015 年就宣布了数据挖据平台 DTPAI , DTPAI 将集成阿里巴巴核心算法库,包括特征工程、大规模机器学习、深度学习等等。其次,与百度、腾讯一样,阿里也很重视旗下产品的易用性。阿里 ODPS 和 iDST 产品经理韦啸表示,DTPAI 支持鼠标拖拽的编程可视化,也支持模型可视化;并且广泛与MapReduce、Spark、DMLC、R 等开源技术对接。

腾讯:面向企业的 “Angel”

Angel 将成为PaddlePaddle 之后、BAT 发布的第二个重磅开源平台。Angel 是面向机器学习的分布式计算框架,它为企业级大规模机器学习任务提供解决方案,可与 Caffe、TensorFlow 和Torch 等业界主流深度学习框架很好地兼容。“Angel 采用多种业界最新技术和腾讯自主研发技术使得 Angel 性能大幅提高,达到 Spark 的数倍到数十倍,能在千万到十亿级的特征维度条件下运行。”

百度:希望获得开发者青睐的 “PaddlePaddle”

2016年9月1日,国内第一个机器学习开源平台PaddlePaddle诞生。

PaddlePaddle 能在多 GPU,多台机器上进行并行计算。相比现有深度学习框架,PaddlePaddle 对开发者来说有易用性、快速等优势。许多资深开发者认为PaddlePaddle 的设计理念与 Caffe 十分相似,怀疑是百度对标 Caffe 开发出的替代品。业内对 PaddlePaddle 的总体评价是“设计干净、简洁,稳定,速度较快。

看我开源大数据经典案例,我们接下来分析一下开源大数据的发展趋势。

开源让越来越多的项目可以直接采用大数据技术,不断的推动着大数据的创业创新,赛智时代分析师认为未来开源大数据将向以下三个方向发展:

容器技术愈受欢迎

容器技术能够使代码在任意环境中快速地 “接入并运行”,降低企业时间和资金成本。其速度和灵活性能够决定促使业务成功开展。

Hadoop与Spark应用增加

据福瑞斯特研究显示,Hadoop正以32.9%的速度增长。由于其可以降低企业成本且可以快速改进,很多企业表示会继续扩大相应的技术应用,所以未来Hadoop将会更加普及。而另一位后起之秀Spak在迭代计算上具有比Hadoop更高的效率并且数据集操作类型的开发更广泛,未来的广泛应用也是指日可待的。

智能开源技术的应用更深入

人工智能正慢慢普及,全新的智能开源解决方案将改变人们和系统交互的方式,转变由来已久的工作观念,加深行业大数据的应用。

以下IT经理网为大家遴选四个成功挖掘大数据商业价值,提升生产力,获得高ROI回报的企业案例:

TXU Energy——智能电表:

有了智能电表,供电公司能每隔15分钟就读一次用电数据,而不是过去的一月一次。这不仅仅节省了抄表的人工费用,而且由于能高频率快速采集分析用电数据(产生大数据),供电公司能根据用电高峰和低谷时段制定不同的电价,TXU Energy就利用这种价格杠杆来平抑用电高峰和低谷的波动幅度。例如,TXU Energy打出了这样的宣传口号:亲,晚上再洗衣服洗碗吧,晚上用电不要钱。实际上,智能电表和大数据应用让分时动态定价成为可能,而且这对于TXU Energy和用户来说是一个双赢变化。

T-Mobile

移动运营商T-Mobile在多个IT系统中整合了大数据应用,对客户交易和互动数据进行综合分析,更准确地预测客户流失率。通过将社交媒体数据和CRM和计费系统中的交易数据进行综合分析,T-mobile在一个季度内将客户流失率降低了一半!

US Xpress

US Xpress部署了一系列的运输大数据应用,采集上千种数据类型,从油耗、胎压、卡车引擎运行状况到GPS信息等,US Xpress甚至从司机们抱怨该系统的博客中收集数据,并通过分析这些数据来优化车队管理、提高生产力、降低油耗,每年节省了数百万美元的运营成本。

麦克拉伦一级方程式车队(Mclaren’s F1 racing team)

麦克拉伦车队通过汽车传感器在赛前的场地测试中实时采集数据,结合历史数据,通过预测型分析发现赛车问题,并预先采取正确的赛车调校措施,降低事故几率并提高比赛胜。

看完开源大数据经典案例,其发展空间还是很大的。虽然技术的发展是全球化的,技术开发的交互性促进了技术的不断突破,然而我国却不能过分依赖于借鉴国外技术,应抵制以低成本换来高性能的产品或系统的诱惑,加大我国创业团队的研发投入,目前对于开源大数据的高端人口需求还很大。想了解更多培训课程请关注达内大数据培训机构

预约申请免费试听课

填写下面表单即可预约申请免费试听!怕钱不够?可就业挣钱后再付学费! 怕学不会?助教全程陪读,随时解惑!担心就业?一地学习,可全国推荐就业!

上一篇:达内4月份-大数据培训免费体验营课程安排
下一篇:大数据培训学习什么架构?大数据培训五大基础构架分享
选择城市和中心
贵州省

广西省

海南省