首页

手游

新游

礼包

攻略

开测表

专题

话题

 首页 > 业内资讯 > 大数据工具比较：R语言和Spark谁更胜一筹？

创世纪.神

幽游白书武术会

阴阳师妖怪屋

怒剑传说

远征2最新版

顽石英雄

迷你装甲

魔法学徒的一天游戏

白蛇仙劫

大数据工具比较：R语言和Spark谁更胜一筹？

时间：2015-12-09　|　来源：数据挖掘与数据分析　|　阅读：84

话题：数据挖掘与数据分析

本文有两重目的，一是在性能方面快速对比下R语言和Spark，二是想向大家介绍下Spark的机器学习库。

背景介绍

由于R语言本身是单线程的，所以可能从性能方面对比Spark和R并不是很明智的做法。即使这种比较不是很理想，但是对于那些曾经遇到过这些问题的人，下文中的一些数字一定会让你很感兴趣。

36大数据专稿，原文作者：Vivek Murugesan本文由36大数据翻译组-冷逸翻译，任何不标明译者和出处以及本文链接http://www.36dsj.com/archives/37692 的均为侵权。

你是否曾把一个机器学习的问题丢到R里运行，然后等上好几个小时？而仅仅是因为没有可行的替代方式，你只能耐心地等。所以是时候去看看Spark的机器学习了，它包含R语言大部分的功能，并且在数据转换和性能上优于R语言。

曾经我尝试过利用不同的机器学习技术——R语言和Spark的机器学习，去解决同一个特定的问题。为了增加可比性，我甚至让它们运行在同样的硬件环境和操作系统上。并且，在Spark中运行单机模式，不带任何集群的配置。

在我们讨论具体细节之前，关于Revolution R 有个简单的说明。作为R语言的企业版，Revolution R试图弥补R语言单线程的缺陷。但它只能运行在像Revolution Analytics这样的专有软件上，所以可能不是理想的长期方案。如果想获得微软Revolution Analytics软件的扩展，又可能会让事情变得更为复杂，比方说牵扯到许可证的问题。

因此，社区支持的开源工具，像是Spark，可能成为比R语言企业版更好的选择。

数据集和问题

分析采用的是Kaggle网站 [译者注：Kaggle是一个数据分析的竞赛平台]上的数字识别器的数据集，其中包含灰度的手写数字的图片，从0到9。

每张图片高28px，宽28px，大小为784px。每个像素都包含关于像素点明暗的值，值越高代表像素点越暗。像素值是0到255之间的整数，包括0和255。整张图片包含第一列在内共有785列数据，称为“标记”，即用户手写的数字。

小编推荐

BAT疯抢2.19亿二次元用户，90后为谁买单？麦肯锡压箱底的10个经典方法！可视性与策略：云如何帮助增强IT安全性报告显示：2016互联网数据分析人才高度稀缺北京到底有多大？居然......这么大！

1 2 3 4 5 下一页尾页

视频推荐

推荐

最新好玩手游

更多 

手游风云榜

更多 

月神宝藏(送GM商城) V1.0 安卓版

君临城下(送GM万充) V1.0 安卓版

悠唐天下(炸服GM神卡) V1.0 安卓版

伏魔诀（无限送真充） V1.0 安卓版

天空之息 V1.0 安卓版

纯三国送无限资源 V1.0 安卓版

思仙 V1.5.6 安卓版

仙语奇缘连抽版 v1.0.4 安卓版

校花的贴身高手天阶岛福利版 V1.0 安卓版

阿拉德之怒 V5.2.3 安卓版

235.76 Bytes 10

群英之战 V1.0 安卓版

闪烁之光 V1.9.7 安卓版

决战玛法 V7.5.0 安卓版

资讯阅读

更多 

《热血江湖手游技能加点攻略》（掌握技能加点要诀，成就无敌江湖之王）

业内资讯  2025-05-21
新版本赏金玩法出装攻略（全面解析最优出装方案，让你在新版本赏金玩法中独领风骚）

业内资讯  2025-05-20
老鼠铲子出装铭文攻略（打造无敌老鼠！）

业内资讯  2025-05-20
王者太虚战场出装攻略（打造最强装备，征服太虚战场）

业内资讯  2025-05-19
制裁战神队友出装攻略（打造最强战队，击败敌人无往不胜）

业内资讯  2025-05-19
《狐狸端游联盟出装攻略》（狐狸出装攻略，助你战胜对手！）

业内资讯  2025-05-18
王者荣耀（揭开哪吒输出利器，带你稳定carry全场）

业内资讯  2025-05-18
地狱男爵技能加点攻略

业内资讯  2025-05-16
逐梦三国（揭秘孙权如何在起凡中成为绝对强者）

业内资讯  2025-05-16
《凯德出装铭文推荐攻略，助你稳定击败对手》

业内资讯  2025-05-13
护卫乌龟出装攻略（如何选择适合乌龟的护卫出装）

业内资讯  2025-05-11
《公主级2-6攻略技能大揭秘》（掌握攻略技能，成为公主级2-6的王者！）

业内资讯  2025-05-08

查看更多

湘ICP备2022002427号-10湘公网安备：43070202000427号
© 2013~2019 haote.com 好特网