Rでのデータ解析や可視化の作業について主に解説しています。
目次
1.Rの基本操作と準備
①はじめに・準備
②データの取り込み・保存
③データの基本的な操作
④データのクリーニング
2. 基礎的なデータ分析
⑤データの可視化と関係性の解析
3. 統計学的検定
⑥2群の検定・比較
⑦3群以上の検定・比較
⑧質的データの比較
⑨折れ線グラフ・時系列データ
4. 高度なデータ分析
⑩主成分分析
⑪クラスター分析
⑫回帰分析
⑬対応分析
⑭生存時間解析
5. 応用統計解析
⑮サンプルサイズ
⑯メタアナリシス
6. 参考情報
⑰R関連書籍紹介
1.Rの基本操作と準備
①はじめに・準備
②データの取り込み・保存
③データの基本的な操作
④データのクリーニング
2. 基礎的なデータ分析
⑤データの可視化と関係性の解析
3. 統計学的検定
⑥2群の検定・比較
⑦3群以上の検定・比較
⑧質的データの比較
⑨折れ線グラフ・時系列データ
4. 高度なデータ分析
⑩主成分分析
⑪クラスター分析
⑫回帰分析
⑬対応分析
⑭生存時間解析
5. 応用統計解析
⑮サンプルサイズ
⑯メタアナリシス
6. 参考情報
⑰R関連書籍紹介
1.Rの基本操作と準備
①はじめに・準備
・はじめに -Rでプレゼンテーション
・無料で使える統計解析ソフトウェア Rの魅力
・RとRStudioのインストール方法
・はじめに -Rでプレゼンテーション
・無料で使える統計解析ソフトウェア Rの魅力
・RとRStudioのインストール方法
②データの取り込み・保存
・RStudioの基本的な使い方 ー作業場所とデータの管理・保存についてー
・Rでのデータ取り込みとデータ作成 ーCSVファイル(read.csv)ー
・Rにデータ取り込み ーCSV(read.csv), TSV(read.delim), Excel(readxlパッケージ, read_excel)ー
・Google Colaboratory上でのRの作業方法+Google Driveのデータの保存・読み込み方法
・Web上でR Studioを使おう!ーPosit Cloud, データの取り込みと出力ー
・Rで作図を高解像度に保存する方法について -png(), ggsave() など-
・RStudioの基本的な使い方 ー作業場所とデータの管理・保存についてー
・Rでのデータ取り込みとデータ作成 ーCSVファイル(read.csv)ー
・Rにデータ取り込み ーCSV(read.csv), TSV(read.delim), Excel(readxlパッケージ, read_excel)ー
・Google Colaboratory上でのRの作業方法+Google Driveのデータの保存・読み込み方法
・Web上でR Studioを使おう!ーPosit Cloud, データの取り込みと出力ー
・Rで作図を高解像度に保存する方法について -png(), ggsave() など-
③データの基本的な操作
・Rでデータの選択 ーsubset関数, filter関数などー
・Rでデータの結合① ー行の結合, rbind関数, bind_rows関数ー
・Rでデータの結合② ー列の結合, cbind関数, merge関数ー
・Rでデータの選択 ーsubset関数, filter関数などー
・Rでデータの結合① ー行の結合, rbind関数, bind_rows関数ー
・Rでデータの結合② ー列の結合, cbind関数, merge関数ー
④データのクリーニング
・Rで欠損処理① ーna.omit, is.na, na.rm, 欠損値含むダミーデータ作成、リストワイズ除去法、平均値代入法ー
・Rで欠損処理② ーLittleのMCAR検定(mcar_test)、単一代入法(確定的回帰代入法, 確率的回帰代入法, mice)ー
・Rで欠損処理① ーna.omit, is.na, na.rm, 欠損値含むダミーデータ作成、リストワイズ除去法、平均値代入法ー
・Rで欠損処理② ーLittleのMCAR検定(mcar_test)、単一代入法(確定的回帰代入法, 確率的回帰代入法, mice)ー
2. 基礎的なデータ分析
⑤データの可視化と関係性の解析
・Rでヒストグラム(度数分布)ーhistー
・Rで散布図 ー相関関係の確認ー
・Rで相関行列 ーPearsonの相関係数, corrplotの使い方ー
・Rで相関係数のヒートマップによる可視化:新型コロナ陽性者数の都道府県別動向
・Rで変数ごとに表示をカスタマイズできるヒートマップ ー革新的な可視化, funkyheatmapー
・Rでベン図 ーggVennDiagram, venn, 最大7サンプル表示可能にー
・Rでアップセット図(UpSet図) ーUpSetR, 集合の関係性を示す, サンプル数が多い場合におススメー
・Rでヒストグラム(度数分布)ーhistー
・Rで散布図 ー相関関係の確認ー
・Rで相関行列 ーPearsonの相関係数, corrplotの使い方ー
・Rで相関係数のヒートマップによる可視化:新型コロナ陽性者数の都道府県別動向
・Rで変数ごとに表示をカスタマイズできるヒートマップ ー革新的な可視化, funkyheatmapー
・Rでベン図 ーggVennDiagram, venn, 最大7サンプル表示可能にー
・Rでアップセット図(UpSet図) ーUpSetR, 集合の関係性を示す, サンプル数が多い場合におススメー
3. 統計学的検定
⑥2群の検定・比較
・対応のある2群のt検定 ー箱ひげ図, ggpairedの使い方ー
・Rで対応のない2群検定:Student t 検定, Welch’s t検定, 箱ひげ図, バイオリンプロット,ビースウォームプロット
・Rで対応のない2群検定:Mann-Whitney U検定、Wilcoxon Rank-Sum 検定、箱ひげ図、バイオリンプロット
・対応のある2群のt検定 ー箱ひげ図, ggpairedの使い方ー
・Rで対応のない2群検定:Student t 検定, Welch’s t検定, 箱ひげ図, バイオリンプロット,ビースウォームプロット
・Rで対応のない2群検定:Mann-Whitney U検定、Wilcoxon Rank-Sum 検定、箱ひげ図、バイオリンプロット
⑦3群以上の検定・比較
・Rで3群以上の検定(パラメトリック検定)①ー分散分析(ANOVA)、多重比較(Tukey)、有意差表示付き箱ひげ図ー
・Rで3群以上の検定(パラメトリック検定)② ーANOVA+Dunnett法, Welch ANOVA+Games-Howell法ー
・Rで3群以上の検定(ノンパラメトリック検定)ーKruskal-Wallis検定, Dunn検定, Bonfferoni, Holmー
・Rで3群以上の比較 ー二元配置分散分析(two-way ANOVA), 主効果,交互作用ー
・Rで3群以上の検定(パラメトリック検定)①ー分散分析(ANOVA)、多重比較(Tukey)、有意差表示付き箱ひげ図ー
・Rで3群以上の検定(パラメトリック検定)② ーANOVA+Dunnett法, Welch ANOVA+Games-Howell法ー
・Rで3群以上の検定(ノンパラメトリック検定)ーKruskal-Wallis検定, Dunn検定, Bonfferoni, Holmー
・Rで3群以上の比較 ー二元配置分散分析(two-way ANOVA), 主効果,交互作用ー
⑧質的データの比較
・Rでカイ二乗検定(適合度検定、独立性の検定、モザイクプロット)
・Rでカイ二乗検定(適合度検定、独立性の検定、モザイクプロット)
⑨折れ線グラフ・時系列データ
・Rで時系列データの折れ線グラフ ーggplot2による熊本の気温変化の分析ー
・Rで両側2軸を異なるスケールに設定した折れ線グラフ ーgeom_line, scaleパッケージの使用ー
・Rでggplotによる時系列データの可視化:新型コロナ陽性者数の県別動向
・Rで時系列データの折れ線グラフ ーggplot2による熊本の気温変化の分析ー
・Rで両側2軸を異なるスケールに設定した折れ線グラフ ーgeom_line, scaleパッケージの使用ー
・Rでggplotによる時系列データの可視化:新型コロナ陽性者数の県別動向
4. 高度なデータ分析
⑩主成分分析
・Rで主成分分析(PCA) ーggbiplot, ellipse, 色分けー
・Rで主成分分析(PCA) ーggbiplot, ellipse, 色分けー
⑪クラスター分析
・Rでクラスター分析 -階層クラスター分析,hclust関数, dist関数、シルエット分析,silhouette関数-
・Rでクラスター分析 ー非階層クラスター分析, k平均法, kmeansー
・Rでクラスター分析 -階層クラスター分析,hclust関数, dist関数、シルエット分析,silhouette関数-
・Rでクラスター分析 ー非階層クラスター分析, k平均法, kmeansー