R

Rでデータ解析と可視化

Rでカイ二乗検定(適合度検定、独立性の検定、モザイクプロット)

カイ二乗検定とは、観察データが期待データとどの程度一致するかを評価する統計手法です。主に”カテゴリデータ(質的データ)”の分析に用いられます。■目次1. カイ二乗検定とは(適合度検定と独立性の検定)2. Rでの適合度検定の手順3. Rでの独...
Rでデータ解析と可視化

Rで3群以上の比較 ー二元配置分散分析(two-way ANOVA), 主効果,交互作用ー

2つの独立した変数をもつ場合の3群以上の比較では、二元配置分散分析を用います。同時に、その2つの独立変数における交互作用も評価します。3群以上の比較で、分散分析の一元配置分散分析(one-way ANOVA)を紹介しました。上記の記事の一元...
Rでデータ解析と可視化

Rで3群以上の検定(パラメトリック検定)② ー分散分析(ANOVA) + Dunnett法, Welch ANOVA + Games-Howell法ー

今回は、・コントロールがある3群の検定(正規分布・等分散性有り)・3群のデータが正規分布だが等分散性のない場合の検定について紹介したいと思います。正規分布を前提とする、パラメトリック検定になります。先日は、正規分布・等分散性ありの3群の検定...
Rでデータ解析と可視化

Rでデータの選択 ーsubset関数, filter関数などー

Rを用いてデータの選択を行う方法について紹介します。irisデータセットを例に挙げ、列や行を指定してデータを選択する方法や、特定の条件を満たすデータを選択する方法について解説します。
Rでデータ解析と可視化

Rで欠損処理① ーna.omit, is.na, na.rm, 欠損値含むダミーデータ作成、リストワイズ除去法、平均値代入法ー

データ解析を行うデータを確認すると、データの抜け、いわゆる「欠損値」を含むことがあります。データに欠損値があると、データの解析やモデリングが適切に行えないことも多く、データの前処理が必要になります。この記事では、Rでの欠損値の処理方法につい...
Rでデータ解析と可視化

Rでメタアナリシス① ー効果量, リスク比, 効果モデルの選択, metaforー

メタアナリシスは、論文などで報告された同じテーマに関する複数の研究結果を統合する統計学的手法です。重要なデータを多く組み合わせて議論することから、質の高いエビデンスレベルであるとされています。臨床試験(治療の有効性や安全性など)結果、例えば...
Rでデータ解析と可視化

Rで変数ごとに表示をカスタマイズできるヒートマップ ー革新的な可視化, funkyheatmapー

データ分析では、得られた結果を明確に示す可視化がとても重要です。以前、相関行列のヒートマップについて解説をしました。今回は、多彩なカスタマイズが可能な「funkyheatmap」パッケージを紹介します。■目次 1. funkyheatmap...
Rでデータ解析と可視化

Google Colaboratory上でのRの作業方法+Google Driveのデータの保存・読み込み方法

Google Colaboratoryは、web上で PythonだけでなくRの作業ができます。専用の環境構築も不要という点、無料という点、でも、初心者も使用しやすいツールになっています。ただし、Googleアカウントは必要ですので、アカウ...
Rでデータ解析と可視化

Rで作図を高解像度に保存する方法について ーpng(), ggsave() などー

Rで作図したものを、論文や著書で使用するため、高解像度で保存する方法は?Rは、データの視覚化にとても便利なツールです。データの詳細な分析や学術論文の掲載時には、作った図を高解像度で保存したいですよね。■目次 1. はじめに 画像のサイズと解...
Rでデータ解析と可視化

Rで生存時間解析①単変数で予測 ーカプラン・マイヤー曲線,survfit関数、ログランク検定,survdiff関数ー

臨床現場で白血病患者の治療をしない群(コントロール群)と治療群の生存時間のデータを取得している。取得データから、各群の白血病患者の生存時間を予測したい。また、コントロール群と治療群の2群のデータがあり、それらの2群の比較も合わせて行いたい。...