❶ 如何在rstudio裡面檢驗異方差性
安裝:R語言和它的UI界面非常安裝比較簡單,這里就不重復描述了,只需要到R的上,對應自己電腦的操作系統對應的版本即可。R提供window、linux和MAC OS X版本,對應即可,如筆者的是普通的window 32位。網路R,左上角的download,選擇合適的鏡像。如果找不到安裝,那就不適合繼續學習R語言了。
安裝好之後,我們打開R界面,可以看到,R的界面非常簡潔,只有一個菜單欄,和一個默認新建的R Console 控制台。
R Console 控制台的使用:我們可以在R Console 控制台內輸入腳本進行運算、繪圖和分析、如我們輸入運算:1+2,按回車鍵。可以看到系統在下一行內彈出了一個3,有點類似於cmd的操作。
我們也可以對編輯腳本,打開文件--新建--new script,可以在彈出的R編輯器--R Editor中進行編輯錄入腳本的操作,編輯完畢可以進行保存和讀入等一系列操作
從上面的界面和操作可以看出,單單使用R自帶的gui界面,難以進行方便快捷的操作,因此我們需要使用到R的輔助UIRStudio。同樣地我們安裝好並打開它。我們看到RStudio界面比R自身內容豐富很多,整個界面切成多個模塊進行同步操作顯示,腳本區、控制台區、文件區非常清晰易用。
同樣的,我們操作1+2、1+3的運算,可以在腳本區編輯錄入1+2,回車下一行繼續錄入1+3,這時我們看到編輯區有兩行代碼,證明這個區域與運行區是分離的,可以方便我們自由地編寫修改腳本。
如果我們需要運行剛才編輯的兩行腳本,我們可以選中它,按Ctrl+回車即可進行運行,選中1行則執行一行,選中全部則執行全部。這里操作運算了3次,對應不同的運算結果顯示在了編輯區下方的控制台Console 區域。同樣地,我們可以對這類腳本進行保存、打開重編輯、運行等一系列操作
❷ 如何高效地使用RStudio
RStudio Server 是 RStudio 公司打造的一款基於 Web 的開源編輯器,如果你熟悉 RStudio的桌面版本,那麼使用RStudio Server對你來說基本上沒什麼難度。
在
實際的工程中,我們的伺服器大多是基於Linux的,比如常見的 ubuntu、centos
等。這些操作系統有時並不提供圖形化界面,這時候RStudio的伺服器版本就派上用場了。啟動RStudio
Server後,進入在瀏覽器中進入某一個頁面後就可以像桌面版一樣使用RStudio編輯器。當R的代碼在伺服器上出現bug了,線上的hotfix是
在所難免的,這時候必然會用到 RStudio Server 應個急。
這一次,我們將繼續利用Docker神器,快速初始化RStudio Server環境的配置,並結合Git實現代碼的版本控制。
准備
一個 Ubuntu 伺服器
第一步:安裝 RStudio Server
首先,我們通過docker 安裝一個標準的RStudio Server
docker pull quantumobject/docker-rstudio
docker run -d -p 8787:8787 quantumobject/docker-rstudio
這樣在你的電腦的8787埠就可以訪問到rstudio的登陸界面了。
第二步:初始化 RStudio 賬號
接著,我們需要初始化一個rstudio的賬號
docker exec -it container-id /bin/bash
adser harryzhu # 設置新用戶名
passwd harryzhu # 設置該用戶的密碼
mkdir /home/harryzhu # 初始化工作空間
chmod -R harryzhu /home/harryzhu # 給工作空間賦權
第三步:安裝 git
然後,我們進入rstudio的伺服器,我們打算引入git版本控制
sudo apt-get install git-core
第四步:解決 ssh 的認證問題
使用 git 的過程可能遇到SSL certificate problem。對於ssh的問題,我們可以選擇建立一個ssh認證的key,也可以在git中設置為忽略。
生成一個key:
$ssh-keygen -t rsa
Generating public/private rsa key pair.
Enter file in which to save the key (/root/.ssh/id_rsa):
Created directory '/root/.ssh'.
連續按下回車,跳過密碼設置
顯示秘鑰信息:
sudo cat /root/.ssh/id_rsa.pub
如果沒有ssh認證的需求,也可以選擇忽略:
git config --global http.sslVerify false
第五步:在 RStudio Server 中配置Git
在最上方的菜單欄中可以選擇Project Options。
接著填寫配置。
第六步:克隆 Git 項目到本地
Git 功能已經集成在 RStudio-Server 中了,在新建項目時可以選擇新建一個Version Control 的 Git 項目。
大功告成!
參考資料
docker-rstudio 手冊
張丹老師的 RStudio-Server 配置實戰
Rstudio 官方 git 解決方案
劉坤老師的 Git 中文教程
---------------------------------------------------------------------------------------------------------------
概述
本文根據 Rstudio Webinars 的教程資源對Rstudio流的R語言教程做一個匯總,可以看到Rstudio對統計報告的Web化和工程化做了大量貢獻。感謝Rstudio的眾多工程師在開源的道路上的貢獻!
謝溢輝:LaTex/Word的統計報告大逃亡之Rmarkdown生態
教學視頻地址
在可交互、可復用的統計報告中,謝溢輝將介紹一眾R包,包括 knitr、rmarkdown、htmlwidgets、DT、leaflet以及shiny。
快速標準的論文書寫# $something$ 或者 $$something$$ 可以解決數學公式的問題
# 利用 bib 文件和[@something] 可以解決引用的問題
# 同樣的,你也可以根據一些機構要求引入標準的模板。
參考謝溢輝的Rmarkdown論文
參考謝溢輝的bib文件
屏蔽源碼# ```{r echo=F}屏蔽源代碼
# ```{r, fig.width=5, fig.height=4} 設置配圖大小
# 腳注
代碼段內存共享
利用cache選項復用代碼和數據
Sys.sleep(5)
rnorm(1)
輸出其他語言代碼
利用engine選項選擇代碼引擎,驅動python、R、scala、Rcpp、bash、perl、node等
x = 'hello, python
world!'
print(x)
print(x.split(' '))
互動式文檔
利用yaml配置中的runtime選項
---
author: Harry Zhu
output: html_document
runtime: shiny
---
同理,你也可以選擇輸出slide、pdf或者word,你甚至可以給html定製一個css皮膚。
在我看來,rmarkdown是一款超越Zeppelin和iPython notebook的產品。
最總要的意義在於,學術工作者和工程師們不僅僅可以擺脫格式對創作的束縛專注於代碼和文檔,更是隨意輸出pdf、slide、html、word、latex等多種格式,形成強有力的跨界沖擊。
謝溢輝本人有超過10年以上的LaTex使用經驗,他的rmarkdown和knitr造福了一代學術工作者,顯然LaTex和Word的體系在這種降維攻擊下已經搖搖欲墜。
Hadley Wickham:R與大數據共舞
教學視頻地址
R是一門為小數據探索和開發設計的語言,但在生產中R和大數據在一起還能發揮作用嗎? 我們定義數據量大於單機內存的數據為大數據。讓我們對比一下大數據與小數據的生命周期。
一個小數據分析項目的生命周期:
闡明:熟悉數據、模板解決方案
開發:創建有效模型
產品化:自動化與集成
發布:社會化
一個大數據分析項目的生命周期:
切片:抽取部分數據
闡明:熟悉數據、模板解決方案
開發:創建有效模型
擴展:使用到整個數據集
產品化:自動化與集成
發布:社會化
dplyr與數據讀取
教學視頻地址
PackageDBMSsrc_sqlite()SQLitesrc_mysqlMySQLsrc_postgresPostgreSQLlibrary(bigquery) src_bigquery()Google BigQuery
顯示SQLshow_query(clean)
中間緩存
collapse()返回正在處理的結果
# 抽取 1% 的訓練數據
random <- clean %>%
mutate(x = random()) %>%
collapse() %>%
filter(x <= 0.01) %>%
select(-x) %>%
collect()
數據存儲
_to() 根據本地的data frame 在資料庫創建一個表
# air為connection名稱,query5為data frame,"gains"為表名
_to(air, query5, name = "gains")
# 關閉連接
rm(air)
# 垃圾收集器
gc()
Hadley Wickham:ETL
教學視頻地址
本節將討論一個有效的數據分析/數據科學問題框架,包括:
數據讀取 readr/httr/DBI
數據清洗 tidyr/jsonlite
數據處理 dplyr/rlist
數據可視化 ggplot2/ggvis
數據建模 broom
broom:快速分析install.packages("broom")
# 查看相關例子
browseVignettes(package="broom")
Hadley Wickham是RStudio的首席科學家,並兼任統計萊斯大學的兼職教授。他將一一介紹他認為你應該知道的各種R包,並概述大數據和R,但主要是解釋為什麼他相信你不應該擔心大數據的問題。
garrettgman:packrat與虛擬化技術
教學視頻地址
你
是否有過這樣與人合作開發的經歷:在自己機器上運行完美的R代碼,復制到另外一台同事的機器上運行就有很多R包需要重新安裝,有的R包甚至依賴於不同的版
本?現在,在不使用Docker或Vagrant等全局虛擬化技術的條件下,只需要運用packrat包,就可以保證你的R項目的依賴問題被很好的解決,
一次運行,到處運行。
if(!require(packrat)){install.packages("packrat")}
getOption("repos") # 顯示代碼鏡像源
packrat:: bundle() # 打包當前環境並虛擬化
packrat:: unbundle(bundle="xxx.tar.gz",where=".") # 載入已經打包過的環境
packrat::opts$local.repos("~/R") # 設置本地repos為路徑
packrat::install_local("pryr") # 從本地安裝
Hadley Wickham:Git與團隊協作
教學視頻地址
團隊協作:利用Git 和 GitHub,你可以很輕松的與人協作,你不再需要用郵件附件來備份文檔,或者在Dropbox上為爭奪編輯許可權而爭吵。相反,你可以獨立工作,最後只需要合並你們的成果就可以。
版本控制: Git 在我們製造重大錯誤時都允許我們回滾到之前的任意時間點。我們也可以回顧我們之前所做的一起歷史記錄,跟蹤bug的形成過程。
❸ 如何用rstudio進行誤差分析
安裝:R語言和它的UI界面非常安裝比較簡單,這里就不重復描述了,只需要到R的上,對應自己電腦的操作系
❹ 怎麼用Rstudio (R語言) 去化簡矩陣,得到row echelon form (行階梯矩陣)
你好,給你一篇文章,希望能幫到你!
R語言與矩陣運算
R語言矩陣運算
主要包括以下內容:
創建矩陣向量;矩陣加減,乘積;矩陣的逆;行列式的值;特徵值與特徵向量;QR分解;奇異值分解;廣義逆;backsolve與fowardsolve函數;取矩陣的上下三角元素;向量化運算元等.
1 創建一個向量
在R中可以用函數c()來創建一個向量,例如:
> x=c(1,2,3,4)
> x
[1] 1 2 3 4
2 創建一個矩陣
在R中可以用函數matrix()來創建一個矩陣,應用該函數時需要輸入必要的參數值。
> args(matrix)
function (data = NA, nrow = 1, ncol = 1, byrow = FALSE, dimnames = NULL)
data項為必要的矩陣元素,nrow為行數,ncol為列數,注意nrow與ncol的乘積應為矩陣元素個數,byrow項控制排列元素時是否按行進行,dimnames給定行和列的名稱。例如:
> matrix(1:12,nrow=3,ncol=4)
[,1] [,2] [,3] [,4]
[1,] 1 4 7 10
[2,] 2 5 8 11
[3,] 3 6 9 12
………………
文章地址: http://m.blog.csdn.net/blog/hawksoft_11109/7773323
❺ 如何用Rstudio 計算AIC,BIC的值
通過AIC、BIC函數計算,但針對的模型很少,比如線性回歸模型。
還有模型內部已經計算了AIC、BIC等。舉個例子。或者根據AIC和BIC的公式自己寫代碼計算。
相關拓展
函數:是指一段可以直接被另一段程序或代碼引用的程序或代碼。也叫做子程序、(OOP中)方法。
一個較大的程序一般應分為若干個程序塊,每一個模塊用來實現一個特定的功能。所有的高級語言中都有子程序這個概念,用子程序實現模塊的功能。在C語言中,子程序是由一個主函數和若干個函數構成的。由主函數調用其他函數,其他函數也可以互相調用。同一個函數可以被一個或多個函數調用任意多次。
在程序設計中,常將一些常用的功能模塊編寫成函數,放在函數庫中供公共選用。要善於利用函數,以減少重復編寫程序段的工作量。
函數分為全局函數、全局靜態函數;在類中還可以定義構造函數、析構函數、拷貝構造函數、成員函數、友元函數、運算符重載函數、內聯函數等。
以上內容參考 網路-函數
❻ 如何用rstudio做cluster分析 heatmap
點擊開始掃描後,R-Studio彈出掃描設置窗口,1般採取默許選項便可,也能夠去掉我們不需要的文件系統,可加快分析速度。我們要掃描的是全部硬碟,所以從0位置開始,長度149.1G。
❼ 怎麼從rstudio中導入本身具備的數據
下載安裝:R語言和它的UI界面非常安裝比較簡單,這里就不重復描述了,只需要到R的官網上,對應自己電腦的操作系統下載對應的版本即可。R提供window、linux和MAC OS X版本,對應下載即可,如筆者的是普通的window 32位。網路R官網,左上角的download,選擇合適的鏡像。如果找不到下載安裝,那就不適合繼續學習R語言了。
安裝好之後,我們打開R界面,可以看到,R的界面非常簡潔,只有一個菜單欄,和一個默認新建的R Console 控制台。
R Console 控制台的使用:我們可以在R Console 控制台內輸入腳本進行運算、繪圖和分析、如我們輸入運算:1+2,按回車鍵。可以看到系統在下一行內彈出了一個3,有點類似於cmd的操作。
我們也可以對編輯腳本,打開文件--新建--new script,可以在彈出的R編輯器--R Editor中進行編輯錄入腳本的操作,編輯完畢可以進行保存和讀入等一系列操作
從上面的界面和操作可以看出,單單使用R自帶的gui界面,難以進行方便快捷的操作,因此我們需要使用到R的輔助UI軟體RStudio。同樣地我們安裝好並打開它。我們看到RStudio界面比R自身內容豐富很多,整個界面切成多個模塊進行同步操作顯示,腳本區、控制台區、文件區非常清晰易用。
同樣的,我們操作1+2、1+3的運算,可以在腳本區編輯錄入1+2,回車下一行繼續錄入1+3,這時我們看到編輯區有兩行代碼,證明這個區域與運行區是分離的,可以方便我們自由地編寫修改腳本。
如果我們需要運行剛才編輯的兩行腳本,我們可以選中它,按Ctrl+回車即可進行運行,選中1行則執行一行,選中全部則執行全部。這里操作運算了3次,對應不同的運算結果顯示在了編輯區下方的控制台Console 區域。同樣地,我們可以對這類腳本進行保存、打開重編輯、運行等一系列操作
❽ 如何高效地使用RStudio
RStudioServer是RStudio公司打造的一款基於Web的開源編輯器,如果熟悉RStudio的桌面版本,那麼使用RStudioServer對來說基本上沒什麼難度。在實際的工程中,的伺服器大多是基於Linux的,比如常見的ubuntu、centos等。這些操作系統有時並不提
❾ r-studio 使用方法
幫不了你,換換別的軟體吧!!