❶ 如何在rstudio里面检验异方差性
安装:R语言和它的UI界面非常安装比较简单,这里就不重复描述了,只需要到R的上,对应自己电脑的操作系统对应的版本即可。R提供window、linux和MAC OS X版本,对应即可,如笔者的是普通的window 32位。网络R,左上角的download,选择合适的镜像。如果找不到安装,那就不适合继续学习R语言了。
安装好之后,我们打开R界面,可以看到,R的界面非常简洁,只有一个菜单栏,和一个默认新建的R Console 控制台。
R Console 控制台的使用:我们可以在R Console 控制台内输入脚本进行运算、绘图和分析、如我们输入运算:1+2,按回车键。可以看到系统在下一行内弹出了一个3,有点类似于cmd的操作。
我们也可以对编辑脚本,打开文件--新建--new script,可以在弹出的R编辑器--R Editor中进行编辑录入脚本的操作,编辑完毕可以进行保存和读入等一系列操作
从上面的界面和操作可以看出,单单使用R自带的gui界面,难以进行方便快捷的操作,因此我们需要使用到R的辅助UIRStudio。同样地我们安装好并打开它。我们看到RStudio界面比R自身内容丰富很多,整个界面切成多个模块进行同步操作显示,脚本区、控制台区、文件区非常清晰易用。
同样的,我们操作1+2、1+3的运算,可以在脚本区编辑录入1+2,回车下一行继续录入1+3,这时我们看到编辑区有两行代码,证明这个区域与运行区是分离的,可以方便我们自由地编写修改脚本。
如果我们需要运行刚才编辑的两行脚本,我们可以选中它,按Ctrl+回车即可进行运行,选中1行则执行一行,选中全部则执行全部。这里操作运算了3次,对应不同的运算结果显示在了编辑区下方的控制台Console 区域。同样地,我们可以对这类脚本进行保存、打开重编辑、运行等一系列操作
❷ 如何高效地使用RStudio
RStudio Server 是 RStudio 公司打造的一款基于 Web 的开源编辑器,如果你熟悉 RStudio的桌面版本,那么使用RStudio Server对你来说基本上没什么难度。
在
实际的工程中,我们的服务器大多是基于Linux的,比如常见的 ubuntu、centos
等。这些操作系统有时并不提供图形化界面,这时候RStudio的服务器版本就派上用场了。启动RStudio
Server后,进入在浏览器中进入某一个页面后就可以像桌面版一样使用RStudio编辑器。当R的代码在服务器上出现bug了,线上的hotfix是
在所难免的,这时候必然会用到 RStudio Server 应个急。
这一次,我们将继续利用Docker神器,快速初始化RStudio Server环境的配置,并结合Git实现代码的版本控制。
准备
一个 Ubuntu 服务器
第一步:安装 RStudio Server
首先,我们通过docker 安装一个标准的RStudio Server
docker pull quantumobject/docker-rstudio
docker run -d -p 8787:8787 quantumobject/docker-rstudio
这样在你的电脑的8787端口就可以访问到rstudio的登陆界面了。
第二步:初始化 RStudio 账号
接着,我们需要初始化一个rstudio的账号
docker exec -it container-id /bin/bash
adser harryzhu # 设置新用户名
passwd harryzhu # 设置该用户的密码
mkdir /home/harryzhu # 初始化工作空间
chmod -R harryzhu /home/harryzhu # 给工作空间赋权
第三步:安装 git
然后,我们进入rstudio的服务器,我们打算引入git版本控制
sudo apt-get install git-core
第四步:解决 ssh 的认证问题
使用 git 的过程可能遇到SSL certificate problem。对于ssh的问题,我们可以选择建立一个ssh认证的key,也可以在git中设置为忽略。
生成一个key:
$ssh-keygen -t rsa
Generating public/private rsa key pair.
Enter file in which to save the key (/root/.ssh/id_rsa):
Created directory '/root/.ssh'.
连续按下回车,跳过密码设置
显示秘钥信息:
sudo cat /root/.ssh/id_rsa.pub
如果没有ssh认证的需求,也可以选择忽略:
git config --global http.sslVerify false
第五步:在 RStudio Server 中配置Git
在最上方的菜单栏中可以选择Project Options。
接着填写配置。
第六步:克隆 Git 项目到本地
Git 功能已经集成在 RStudio-Server 中了,在新建项目时可以选择新建一个Version Control 的 Git 项目。
大功告成!
参考资料
docker-rstudio 手册
张丹老师的 RStudio-Server 配置实战
Rstudio 官方 git 解决方案
刘坤老师的 Git 中文教程
---------------------------------------------------------------------------------------------------------------
概述
本文根据 Rstudio Webinars 的教程资源对Rstudio流的R语言教程做一个汇总,可以看到Rstudio对统计报告的Web化和工程化做了大量贡献。感谢Rstudio的众多工程师在开源的道路上的贡献!
谢溢辉:LaTex/Word的统计报告大逃亡之Rmarkdown生态
教学视频地址
在可交互、可复用的统计报告中,谢溢辉将介绍一众R包,包括 knitr、rmarkdown、htmlwidgets、DT、leaflet以及shiny。
快速标准的论文书写# $something$ 或者 $$something$$ 可以解决数学公式的问题
# 利用 bib 文件和[@something] 可以解决引用的问题
# 同样的,你也可以根据一些机构要求引入标准的模板。
参考谢溢辉的Rmarkdown论文
参考谢溢辉的bib文件
屏蔽源码# ```{r echo=F}屏蔽源代码
# ```{r, fig.width=5, fig.height=4} 设置配图大小
# 脚注
代码段内存共享
利用cache选项复用代码和数据
Sys.sleep(5)
rnorm(1)
输出其他语言代码
利用engine选项选择代码引擎,驱动python、R、scala、Rcpp、bash、perl、node等
x = 'hello, python
world!'
print(x)
print(x.split(' '))
交互式文档
利用yaml配置中的runtime选项
---
author: Harry Zhu
output: html_document
runtime: shiny
---
同理,你也可以选择输出slide、pdf或者word,你甚至可以给html定制一个css皮肤。
在我看来,rmarkdown是一款超越Zeppelin和iPython notebook的产品。
最总要的意义在于,学术工作者和工程师们不仅仅可以摆脱格式对创作的束缚专注于代码和文档,更是随意输出pdf、slide、html、word、latex等多种格式,形成强有力的跨界冲击。
谢溢辉本人有超过10年以上的LaTex使用经验,他的rmarkdown和knitr造福了一代学术工作者,显然LaTex和Word的体系在这种降维攻击下已经摇摇欲坠。
Hadley Wickham:R与大数据共舞
教学视频地址
R是一门为小数据探索和开发设计的语言,但在生产中R和大数据在一起还能发挥作用吗? 我们定义数据量大于单机内存的数据为大数据。让我们对比一下大数据与小数据的生命周期。
一个小数据分析项目的生命周期:
阐明:熟悉数据、模板解决方案
开发:创建有效模型
产品化:自动化与集成
发布:社会化
一个大数据分析项目的生命周期:
切片:抽取部分数据
阐明:熟悉数据、模板解决方案
开发:创建有效模型
扩展:使用到整个数据集
产品化:自动化与集成
发布:社会化
dplyr与数据读取
教学视频地址
PackageDBMSsrc_sqlite()SQLitesrc_mysqlMySQLsrc_postgresPostgreSQLlibrary(bigquery) src_bigquery()Google BigQuery
显示SQLshow_query(clean)
中间缓存
collapse()返回正在处理的结果
# 抽取 1% 的训练数据
random <- clean %>%
mutate(x = random()) %>%
collapse() %>%
filter(x <= 0.01) %>%
select(-x) %>%
collect()
数据存储
_to() 根据本地的data frame 在数据库创建一个表
# air为connection名称,query5为data frame,"gains"为表名
_to(air, query5, name = "gains")
# 关闭连接
rm(air)
# 垃圾收集器
gc()
Hadley Wickham:ETL
教学视频地址
本节将讨论一个有效的数据分析/数据科学问题框架,包括:
数据读取 readr/httr/DBI
数据清洗 tidyr/jsonlite
数据处理 dplyr/rlist
数据可视化 ggplot2/ggvis
数据建模 broom
broom:快速分析install.packages("broom")
# 查看相关例子
browseVignettes(package="broom")
Hadley Wickham是RStudio的首席科学家,并兼任统计莱斯大学的兼职教授。他将一一介绍他认为你应该知道的各种R包,并概述大数据和R,但主要是解释为什么他相信你不应该担心大数据的问题。
garrettgman:packrat与虚拟化技术
教学视频地址
你
是否有过这样与人合作开发的经历:在自己机器上运行完美的R代码,复制到另外一台同事的机器上运行就有很多R包需要重新安装,有的R包甚至依赖于不同的版
本?现在,在不使用Docker或Vagrant等全局虚拟化技术的条件下,只需要运用packrat包,就可以保证你的R项目的依赖问题被很好的解决,
一次运行,到处运行。
if(!require(packrat)){install.packages("packrat")}
getOption("repos") # 显示代码镜像源
packrat:: bundle() # 打包当前环境并虚拟化
packrat:: unbundle(bundle="xxx.tar.gz",where=".") # 加载已经打包过的环境
packrat::opts$local.repos("~/R") # 设置本地repos为路径
packrat::install_local("pryr") # 从本地安装
Hadley Wickham:Git与团队协作
教学视频地址
团队协作:利用Git 和 GitHub,你可以很轻松的与人协作,你不再需要用邮件附件来备份文档,或者在Dropbox上为争夺编辑权限而争吵。相反,你可以独立工作,最后只需要合并你们的成果就可以。
版本控制: Git 在我们制造重大错误时都允许我们回滚到之前的任意时间点。我们也可以回顾我们之前所做的一起历史记录,跟踪bug的形成过程。
❸ 如何用rstudio进行误差分析
安装:R语言和它的UI界面非常安装比较简单,这里就不重复描述了,只需要到R的上,对应自己电脑的操作系
❹ 怎么用Rstudio (R语言) 去化简矩阵,得到row echelon form (行阶梯矩阵)
你好,给你一篇文章,希望能帮到你!
R语言与矩阵运算
R语言矩阵运算
主要包括以下内容:
创建矩阵向量;矩阵加减,乘积;矩阵的逆;行列式的值;特征值与特征向量;QR分解;奇异值分解;广义逆;backsolve与fowardsolve函数;取矩阵的上下三角元素;向量化算子等.
1 创建一个向量
在R中可以用函数c()来创建一个向量,例如:
> x=c(1,2,3,4)
> x
[1] 1 2 3 4
2 创建一个矩阵
在R中可以用函数matrix()来创建一个矩阵,应用该函数时需要输入必要的参数值。
> args(matrix)
function (data = NA, nrow = 1, ncol = 1, byrow = FALSE, dimnames = NULL)
data项为必要的矩阵元素,nrow为行数,ncol为列数,注意nrow与ncol的乘积应为矩阵元素个数,byrow项控制排列元素时是否按行进行,dimnames给定行和列的名称。例如:
> matrix(1:12,nrow=3,ncol=4)
[,1] [,2] [,3] [,4]
[1,] 1 4 7 10
[2,] 2 5 8 11
[3,] 3 6 9 12
………………
文章地址: http://m.blog.csdn.net/blog/hawksoft_11109/7773323
❺ 如何用Rstudio 计算AIC,BIC的值
通过AIC、BIC函数计算,但针对的模型很少,比如线性回归模型。
还有模型内部已经计算了AIC、BIC等。举个例子。或者根据AIC和BIC的公式自己写代码计算。
相关拓展
函数:是指一段可以直接被另一段程序或代码引用的程序或代码。也叫做子程序、(OOP中)方法。
一个较大的程序一般应分为若干个程序块,每一个模块用来实现一个特定的功能。所有的高级语言中都有子程序这个概念,用子程序实现模块的功能。在C语言中,子程序是由一个主函数和若干个函数构成的。由主函数调用其他函数,其他函数也可以互相调用。同一个函数可以被一个或多个函数调用任意多次。
在程序设计中,常将一些常用的功能模块编写成函数,放在函数库中供公共选用。要善于利用函数,以减少重复编写程序段的工作量。
函数分为全局函数、全局静态函数;在类中还可以定义构造函数、析构函数、拷贝构造函数、成员函数、友元函数、运算符重载函数、内联函数等。
以上内容参考 网络-函数
❻ 如何用rstudio做cluster分析 heatmap
点击开始扫描后,R-Studio弹出扫描设置窗口,1般采取默许选项便可,也能够去掉我们不需要的文件系统,可加快分析速度。我们要扫描的是全部硬盘,所以从0位置开始,长度149.1G。
❼ 怎么从rstudio中导入本身具备的数据
下载安装:R语言和它的UI界面非常安装比较简单,这里就不重复描述了,只需要到R的官网上,对应自己电脑的操作系统下载对应的版本即可。R提供window、linux和MAC OS X版本,对应下载即可,如笔者的是普通的window 32位。网络R官网,左上角的download,选择合适的镜像。如果找不到下载安装,那就不适合继续学习R语言了。
安装好之后,我们打开R界面,可以看到,R的界面非常简洁,只有一个菜单栏,和一个默认新建的R Console 控制台。
R Console 控制台的使用:我们可以在R Console 控制台内输入脚本进行运算、绘图和分析、如我们输入运算:1+2,按回车键。可以看到系统在下一行内弹出了一个3,有点类似于cmd的操作。
我们也可以对编辑脚本,打开文件--新建--new script,可以在弹出的R编辑器--R Editor中进行编辑录入脚本的操作,编辑完毕可以进行保存和读入等一系列操作
从上面的界面和操作可以看出,单单使用R自带的gui界面,难以进行方便快捷的操作,因此我们需要使用到R的辅助UI软件RStudio。同样地我们安装好并打开它。我们看到RStudio界面比R自身内容丰富很多,整个界面切成多个模块进行同步操作显示,脚本区、控制台区、文件区非常清晰易用。
同样的,我们操作1+2、1+3的运算,可以在脚本区编辑录入1+2,回车下一行继续录入1+3,这时我们看到编辑区有两行代码,证明这个区域与运行区是分离的,可以方便我们自由地编写修改脚本。
如果我们需要运行刚才编辑的两行脚本,我们可以选中它,按Ctrl+回车即可进行运行,选中1行则执行一行,选中全部则执行全部。这里操作运算了3次,对应不同的运算结果显示在了编辑区下方的控制台Console 区域。同样地,我们可以对这类脚本进行保存、打开重编辑、运行等一系列操作
❽ 如何高效地使用RStudio
RStudioServer是RStudio公司打造的一款基于Web的开源编辑器,如果熟悉RStudio的桌面版本,那么使用RStudioServer对来说基本上没什么难度。在实际的工程中,的服务器大多是基于Linux的,比如常见的ubuntu、centos等。这些操作系统有时并不提
❾ r-studio 使用方法
帮不了你,换换别的软件吧!!