首页

手游

新游

礼包

攻略

开测表

专题

话题

 首页 > 业内资讯 > 大数据职位，数据场技能

创世纪.神

幽游白书武术会

阴阳师妖怪屋

怒剑传说

远征2最新版

顽石英雄

迷你装甲

魔法学徒的一天游戏

白蛇仙劫

大数据职位，数据场技能

时间：2016-02-02　|　来源：developerWorks　|　阅读：185

话题： developerWorks

简单的数据收集与处理，很多时候也会依赖于Linux系统或者基于其上的一系列工具，比如常用的Web服务器引擎Nginx及其产生的日志，常用的文件传输scp或者rsync，常用的定时任务crontab等等这些工具，稳定又实用。

2.3 Python或者R语言生态

掌握一门分析专用语言，很有必要。其中以R语言和Python语言为代表。R起源于统计学，如今在数据科学领域也占有强大的阵地。Python更是一门完整的编程语言，不论是Web开发、自动化运维、云计算，还是数据科学领域，都有众多的用户。两者在数据分析中都有完整的生态圈，而且其它环境对这两者的支持也是非常好的。

无意于争端，全看个人喜好。本人只熟悉Python这块生态，因此只讨论这一块相关的。最为大众熟悉的一些包为：Numpy，Scipy, Pandas和Scikit-learn，Keras，解决了从数据分析到机器学习和深度学习的几乎所有任务。

2.4 Hadoop与Spark生态

大数据平台，无疑是以Hadoop和Spark为代表，无论在线处理还是离线分析。Hadoop比较适合离线处理。而在线处理中，Storm就是比较有名的。如果需要自己实现Map-Reduce或者对接数据之类的开发，编程语言中以Java和Scala为代表。

在线搜索相关，估计会用前面说过的ElasticSearch或者Solr。当然，区别于hadoop的Map-Reduce流程，Spark提供的弹性数据集RDD，能作用于RDD上的算子非常多，使得数据处理与分析更加方便。除此之外，Spark还提供了实时任务的Streaming，能实时的对数据进行处理与获取结果。还有Spark SQL功能，尤其以其中的DataFrame重为重要。另外，ML与MLlib也是分布式机器学习的重要部分。

Spark是Hadoop生态圈中的有力补充，并非替代品，如果要说替代，那也只是替代了MapReduce分布式计算框架而已，分布式调试与管理依然用Yarn，文件系统依然会使用HDFS。

小编推荐

Python3入门教程提高代码质量：如何编写函数一周 IT技术干货浅谈12306核心模型设计思路和架构设计关于新框架的学习：Angular,React,Vue

首页上一页 1 2 3 4 5 下一页尾页

视频推荐

推荐

最新好玩手游

更多 

手游风云榜

更多 

月神宝藏(送GM商城) V1.0 安卓版

君临城下(送GM万充) V1.0 安卓版

悠唐天下(炸服GM神卡) V1.0 安卓版

伏魔诀（无限送真充） V1.0 安卓版

天空之息 V1.0 安卓版

纯三国送无限资源 V1.0 安卓版

思仙 V1.5.6 安卓版

仙语奇缘连抽版 v1.0.4 安卓版

校花的贴身高手天阶岛福利版 V1.0 安卓版

阿拉德之怒 V5.2.3 安卓版

235.76 Bytes 10

群英之战 V1.0 安卓版

闪烁之光 V1.9.7 安卓版

决战玛法 V7.5.0 安卓版

资讯阅读

更多 

《热血江湖手游技能加点攻略》（掌握技能加点要诀，成就无敌江湖之王）

业内资讯  2025-05-21
新版本赏金玩法出装攻略（全面解析最优出装方案，让你在新版本赏金玩法中独领风骚）

业内资讯  2025-05-20
老鼠铲子出装铭文攻略（打造无敌老鼠！）

业内资讯  2025-05-20
王者太虚战场出装攻略（打造最强装备，征服太虚战场）

业内资讯  2025-05-19
制裁战神队友出装攻略（打造最强战队，击败敌人无往不胜）

业内资讯  2025-05-19
《狐狸端游联盟出装攻略》（狐狸出装攻略，助你战胜对手！）

业内资讯  2025-05-18
王者荣耀（揭开哪吒输出利器，带你稳定carry全场）

业内资讯  2025-05-18
地狱男爵技能加点攻略

业内资讯  2025-05-16
逐梦三国（揭秘孙权如何在起凡中成为绝对强者）

业内资讯  2025-05-16
《凯德出装铭文推荐攻略，助你稳定击败对手》

业内资讯  2025-05-13
护卫乌龟出装攻略（如何选择适合乌龟的护卫出装）

业内资讯  2025-05-11
《公主级2-6攻略技能大揭秘》（掌握攻略技能，成为公主级2-6的王者！）

业内资讯  2025-05-08

查看更多

湘ICP备2022002427号-10湘公网安备：43070202000427号
© 2013~2019 haote.com 好特网