R

Rでデータ解析と可視化

Rで欠損処理① ーna.omit, is.na, na.rm, 欠損値含むダミーデータ作成、リストワイズ除去法、平均値代入法ー

データ解析を行うデータを確認すると、データの抜け、いわゆる「欠損値」を含むことがあります。 データに欠損値があると、データの解析やモデリングが適切に行えないことも多く、データの前処理が必要になります。 この記事では、Rでの欠損値の処理方...
2024.11.01
Rでデータ解析と可視化

Rでメタアナリシス① ー効果量, リスク比, 効果モデルの選択, metaforー

メタアナリシスは、論文などで報告された同じテーマに関する複数の研究結果を統合する統計学的手法です。 重要なデータを多く組み合わせて議論することから、質の高いエビデンスレベルであるとされています。 臨床試験(治療の有効性や安全性など)結果...
2024.11.19
Rでデータ解析と可視化

Rで変数ごとに表示をカスタマイズできるヒートマップ ー革新的な可視化, funkyheatmapー

データ分析では、得られた結果を明確に示す可視化がとても重要です。 以前、相関行列のヒートマップについて解説をしました。 今回は、多彩なカスタマイズが可能な「funkyheatmap」パッケージを紹介します。 ■目次 1...
2024.01.10
Rでデータ解析と可視化

Google Colaboratory上でのRの作業方法+Google Driveのデータの保存・読み込み方法

Google Colaboratoryは、web上で PythonだけでなくRの作業ができます。専用の環境構築も不要という点、無料という点、でも、初心者も使用しやすいツールになっています。 ただし、Googleアカウントは必要ですので、ア...
2024.01.06
Rでデータ解析と可視化

Rで作図を高解像度に保存する方法について ーpng(), ggsave() などー

Rで作図したものを、論文や著書で使用するため、高解像度で保存する方法は? Rは、データの視覚化にとても便利なツールです。データの詳細な分析や学術論文の掲載時には、作った図を高解像度で保存したいですよね。 ...
2024.10.02
Rでデータ解析と可視化

Rで生存時間解析①単変数で予測 ーカプラン・マイヤー曲線,survfit関数、ログランク検定,survdiff関数ー

臨床現場で白血病患者の治療をしない群(コントロール群)と治療群の生存時間のデータを取得している。 取得データから、各群の白血病患者の生存時間を予測したい。 また、コントロール群と治療群の2群のデータがあり、それらの2群の比較も合わせて行...
2024.11.12
Rでデータ解析と可視化

Rで回帰分析②ー重回帰分析, lm関数, 価格予測ー

AをB、C、Dなどの複数の要因で予測したいという場合に、重回帰分析が用いられます。 例えば、住宅の価格(目的変数)を、町ごとの一人当たり犯罪率、1940年以前に建てられた持ち家の割合、ボストンの5つの雇用中心地までの距離の加重平均のデ...
2024.05.27
Rでデータ解析と可視化

Rで回帰分析① ー単回帰分析, lm関数, 残差プロット, Q-Qプロットー

車の運転速度が速いほど、ブレーキを踏んでから停止するまでに必要な距離は長くなる💡 これは日常の運転でも実感できる事象かと思います。 このような関係性をデータから数式で表現し、予測に活用できる手法である単回帰分析です。 ...
2024.11.05
Rでデータ解析と可視化

対応のある2群のt検定 ー箱ひげ図, ggpairedー

例えば、同じ人が睡眠薬AとBを服用すると、それぞれの効果に差があるのか?ないのか?を知りたいとします。 その際に、よく使用されるのが対応のある2群のt検定です。 ”対応のある”2群のt検定は、比べるデータは同じ人がAを服...
2024.10.02
Rでデータ解析と可視化

Rで主成分分析(PCA) ーggbiplot, ellipse, 色分けー

主成分分析とは、多くの変数により記述された量的データから、できるだけ少ない情報の損失で、情報を縮約して分析を行う方法です。 多くの変数データを圧縮して2軸、あるいは3軸で分析結果を表示します。 主成分分析は、以下の書籍を参考にさ...
2024.10.02
タイトルとURLをコピーしました