澳洲华人网

搜索
猜你喜欢
查看: 207|回复: 0

如何google云计算平台上使用Rstudio-server

[复制链接]

82

主题

55

帖子

129

积分

注册会员

Rank: 2

积分
129
发表于 2018-4-17 10:40:24 | 显示全部楼层 |阅读模式
相信很多做文本挖掘应用的同学都离不开R这个平台,以及诸如topicmodels,lda,stm等文本挖掘包。然而,随着要处理的文本规模越来越大,计算文档-单词矩阵所需要的计算资源也越来越多,我们自己可怜的8g或者16g内存的机器就显得捉襟见肘了。
云计算平台是解决这一问题的一个思路,因为云计算平台往往能提供更为丰富的计算资源,并且是在云端运行,保存的,我们也不会受到“机器在跑代码,我就想等着,不想干别的活”的强迫症的干扰了,可以更充分的利用时间。本文介绍在联合使用google cloud和Rstudio-server作为云计算的解决方案。
首先,我们需要创建一个google账户(可能需要翻墙)。
然后我们登陆google cloud的页面http://cloud.google.com/,如图1所示:

图1. google cloud主页
先登陆一下,登录完成后会返回该页面,我们点击右上角的try it free,出现图2所示页面

图2. 申请免费试用
选择你所在的国家,并且下面两个选项都选择“是”,再点击同意并继续,来到图3和图4:

图3. 申请表填写part1

图4. 申请表填写part2
添加信用卡是没有关系,因为谷歌会赠送300美元,够用很长时间,之后如果用完的话,谷歌会提醒你要开始收费了,所以先试用着吧(说实话,其实收费也不贵)。点击开始免费试用,就来到了你的云计算平台控制台了,如图5所示:

图5. 控制台
点击图5左上方的试用计算引擎,进入了快速入门的教程,以下我不一一截图,按照教程的指示做就可以了,创建一个tutorial project,这个创建需要一点时间,我们耐心等待。
我们跳到创建实例的步骤,如图6:

图6. 创建实例
在图6中,我们先点击“升级账户”,这样可以更加灵活的配置cpu和内存。
升级完成后,将“机器类型”改成“自定义”,就可以自由选择cpu和内存了,如图7所示,我们选择了一个8核52g内存的机器:

图7. 机器类型
之后再选择磁盘和操作系统,我选择的是Ubuntu 16.10和新的 10 GB 标准永久性磁盘,如图8所示:

图8. 磁盘和操作系统
此外,要记得设置允许http和https流量,这样才能远程访问rstudio-server,其他设置默认即可,如图9所示:

图9. 防火墙等其他设置
点击"创建"按钮,就来到实例里面了,需要等一会,实例才可以操作,如图10所示,点击ssh,进入ubuntu的系统,安装R和Rstudio-server:

图10. 实例界面
进入Ubuntu的命令行后,依次输入如下命令(复制$之后的即可):
$ sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys E084DAB9$ sudo apt-get update$ sudo apt-get install r-base注意可能要输入几个Y,此时你输入R之后,就可以进入熟悉的R的命令行了。如图11所示:

图11. R命令行
输入quit()即可退出。然后我们安装Rstudio-server,输入如下命令行:
$ sudo apt-get install gdebi-core$ wget http://download2.rstudio.org/rstudio-server-0.99.903-amd64.deb$ sudo gdebi rstudio-server-0.99.903-amd64.deb至此,我们已经安装Rstudio-server了,并且已经启动了,我们就可以把小黑窗关了,去设置网络。点击instance的链接,进入instance的属性编辑页面,如图12、13所示。

图12. instance链接

图13. instance属性编辑
点击图13中网络下面的default链接,进入网络详细信息,点击添加防火墙规则,添加如图14所示的防火墙规则,并创建:

图14. 防火墙设置
返回VM实例,查看自己的外部ip,我的是104.196.189.7 ,在浏览器中输入http://104.196.189.7:8787即可,进入rstudio-server的登录界面,如图15:

图15. Rstudio-server登录界面
然而,我们并不知道用户名和密码,此时我们需要再回到ubuntu界面,添加用户。在vm实例界面中点击左上角的ssh,如图16所示。

图16. 再次进入ssh
出现命令行后,输入以下指令(将<username>替换成任何你想要的用户名):
$ sudo adduser <username>之后系统会提示你,输入密码,再次确认密码(ubuntu输入密码是无痕迹的,没有*显示),然后输入各种工作信息(可忽略),最后确认信息正确,如图17所示:

图17. 创建一个账号访问rstudio-server
最后,再次登录http://104.196.189.7:8787,输入用户名和密码,我们就进入了熟悉的Rstudio界面啦,如图18所示。这个是在云端跑的,8核52g内存,够大家用的啦!

图18. 进入Rstudio-server
最后的最后,因为ubuntu里面可能没有中文字体,特别是在plot图像的时候会比较崩溃。
我们需要再ssh中再输入:
#安装简体中文字体sudo apt-get install language-pack-zh-hans#安装渲染包sudo apt-get install xfonts-wqy#似乎需要重启就可以显示中文了
安装devtools之前需要在ubuntu的命令行下输入:
sudo apt-get install libgdal-dev

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册 |

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 |

本版积分规则

快速回复 返回顶部 返回列表