首页

手游

新游

礼包

攻略

开测表

专题

话题

 首页 > 业内资讯 > 大数据工具比较：R语言和Spark谁更胜一筹？

创世纪.神

幽游白书武术会

阴阳师妖怪屋

怒剑传说

远征2最新版

顽石英雄

迷你装甲

魔法学徒的一天游戏

白蛇仙劫

大数据工具比较：R语言和Spark谁更胜一筹？

时间：2015-12-09　|　来源：数据挖掘与数据分析　|　阅读：180

话题：数据挖掘与数据分析

以下两份资料可以帮你避免这些问题，同时理顺学习的思路：

Spark机器学习所有的源代码，可提供任何人拿来与R语言作对比：

https://github.com/vivekmurugesan/experiments/tree/master/spark-ml

Docker容器的源代码，Spark和上述项目的包已预置在内，以供快速实施：

https://hub.docker.com/r/vivekmurugesan/spark-hadoop/ Docker容器中已事先安装Apache Hadoop，并且在伪分布式环境下运行。这可以将大容量文件放进分布式文件系统来测试Spark。通过从分布式文件系统加载记录，可以很轻松地来创建RDD实例。

产能和精度

人们会使用不同的指标来衡量这些工具的好坏。对我来说，精准度和产能是决定性的因素。

大家总是喜欢R多过于Spark机器学习，是因为经验学习曲线。他们最终只能选择在R上采用少量的样本数据，是因为R在大数据量的样本上花了太多时间，而这也影响了整个系统的性能。

对我来说，用少量的样本数据是解决不了问题的，因为少量样本根本代表不了整体（至少在大部分情况下是这样）。所以说，如果你使用了少量样本，就是在精度上选择了妥协。

一旦你抛弃了少量样本，就归结到了生产性能的问题。机器学习的问题本质上就是迭代的问题。如果每次迭代都花费很久的话，那么完工时间就会延长。可是，如果每次迭代只用一点时间的话，那么留给你敲代码的时间就会多一些了。

结论

R语言包含了统计计算的库和像ggplot2这样可视化分析的库，所以它不可能被完全废弃，而且它所带来的挖掘数据和统计汇总的能力是毋庸置疑的。

但是，当遇到在大数据集上构建模型的问题时，我们应该去挖掘一些像Spark ML的工具。Spark也提供R的包，SparkR可以在分布式数据集上应用R。

最好在你的“数据军营”中多放点工具，因为你不知道在“打仗”的时候会遇到什么。因此，是时候从过去的R时代迈入Spark ML的新时代了。

原文：Tools in the data armoury: R vs Spark

小编推荐

BAT疯抢2.19亿二次元用户，90后为谁买单？麦肯锡压箱底的10个经典方法！可视性与策略：云如何帮助增强IT安全性报告显示：2016互联网数据分析人才高度稀缺北京到底有多大？居然......这么大！

首页上一页 1 2 3 4 5 下一页尾页

视频推荐

推荐

最新好玩手游

更多 

手游风云榜

更多 

月神宝藏(送GM商城) V1.0 安卓版

君临城下(送GM万充) V1.0 安卓版

悠唐天下(炸服GM神卡) V1.0 安卓版

伏魔诀（无限送真充） V1.0 安卓版

天空之息 V1.0 安卓版

纯三国送无限资源 V1.0 安卓版

思仙 V1.5.6 安卓版

仙语奇缘连抽版 v1.0.4 安卓版

校花的贴身高手天阶岛福利版 V1.0 安卓版

阿拉德之怒 V5.2.3 安卓版

235.76 Bytes 10

群英之战 V1.0 安卓版

闪烁之光 V1.9.7 安卓版

决战玛法 V7.5.0 安卓版

资讯阅读

更多 

《热血江湖手游技能加点攻略》（掌握技能加点要诀，成就无敌江湖之王）

业内资讯  2025-05-21
新版本赏金玩法出装攻略（全面解析最优出装方案，让你在新版本赏金玩法中独领风骚）

业内资讯  2025-05-20
老鼠铲子出装铭文攻略（打造无敌老鼠！）

业内资讯  2025-05-20
王者太虚战场出装攻略（打造最强装备，征服太虚战场）

业内资讯  2025-05-19
制裁战神队友出装攻略（打造最强战队，击败敌人无往不胜）

业内资讯  2025-05-19
《狐狸端游联盟出装攻略》（狐狸出装攻略，助你战胜对手！）

业内资讯  2025-05-18
王者荣耀（揭开哪吒输出利器，带你稳定carry全场）

业内资讯  2025-05-18
地狱男爵技能加点攻略

业内资讯  2025-05-16
逐梦三国（揭秘孙权如何在起凡中成为绝对强者）

业内资讯  2025-05-16
《凯德出装铭文推荐攻略，助你稳定击败对手》

业内资讯  2025-05-13
护卫乌龟出装攻略（如何选择适合乌龟的护卫出装）

业内资讯  2025-05-11
《公主级2-6攻略技能大揭秘》（掌握攻略技能，成为公主级2-6的王者！）

业内资讯  2025-05-08

查看更多

湘ICP备2022002427号-10湘公网安备：43070202000427号
© 2013~2019 haote.com 好特网