R

Rでデータ解析と可視化

Rでロジスティック回帰モデル② -正則化(LASSO・Ridge回帰)で過学習を防ぐ-

ロジスティック回帰は、二値分類問題(例:疾病リスク予測、顧客解約予測)に広く用いられています。先日、Rでのロジスティック回帰分析について解説しました。ステップワイズ法は、AICなどで変数を追加・削除しながら最適なモデルを選択する方法です。こ...
Rでデータ解析と可視化

Rでロジスティック回帰モデル① ー二値の予測・分類、ステップワイズ法、ROC曲線-

今回は、Rでのロジスティック回帰モデルについて解説します。ロジスティック回帰は、目的変数が0か1かの予測・分類するのに役立つ統計手法です。例えば、ある事象が「起こる」か「起こらない」かの"二値"の目的変数を説明変数を用いて予測する、など。💡...
Rでデータ解析と可視化

Rでノモグラム 予測モデルの可視化と解釈(生存時間解析など)

ノモグラムは、医療分野で患者の生存率予測や疾患リスク評価に広く活用されている視覚的な予測ツールです。本記事では、コックス回帰を用いたノモグラムの作成手順を解説し、実際のデータを使って1年・2年後の生存率を予測する方法を紹介します。■目次1....
Rでデータ解析と可視化

Web上でRStudioを使おう!ーPosit Cloud, データの取り込みと出力ー

RStudioの使用環境「Posit Cloud」のご紹介です。いつものパソコン以外でRStudio使いたいけど、クラウド上でやれないかな。。いろいろなツールで統計解析をやってるけど、この部分が対応できない。。Rでできそう!だけど、インスト...
Rでデータ解析と可視化

Rでメタアナリシス② ー出版バイアスの評価:ファンネルプロット, Egger’sテスト, Begg’sテストー

メタアナリシスは、論文などでの同じテーマの研究報告を複数統合する統計学的手法です。複数の研究での議論を行うため、エビデンスレベルも高いとされており、医学研究において重要な役割を担っており、多くのメタアナリシスの研究論文が報告されています。先...
Rでデータ解析と可視化

Rで重回帰モデルの変数選択 ーAIC, BIC, ステップワイズ法ー

目的変数と複数の説明変数があった場合、目的変数の予測に用いることができるのが重回帰分析です。重回帰分析を行う際、そのモデルに使用する変数を適切に選択することはとても重要です。今回使用するデータセットのBostonは、Housing Valu...
Rでデータ解析と可視化

Rでサンプルサイズの計算 ②仮説検定

研究や調査を行う前に、適切なサンプルサイズを計算しておくことは、研究や調査の信頼性を確保し、効率よく実施するためにとても重要です。本記事では、サンプルサイズの計算のうち、仮説検定でのサンプルサイズ決定についてRのコード例と共に紹介したいと思...
Rでデータ解析と可視化

Rでサンプルサイズの計算 ①区間推定

実験や調査の計画段階で「どのくらいのサンプル数が必要か?」を悩んだことはありませんか?サンプルサイズを適切に設定することは、結果の信頼性を左右する重要なポイントです。この記事では、Rを使って簡単にサンプルサイズを計算する方法を紹介します。精...
Rでデータ解析と可視化

Rで生存時間解析②複数因子でも予測できる ーコックス比例ハザードモデル, coxph関数ー

今回は、生存時間解析として広く使用されるコックス比例ハザードモデルについて解説します。以前、生存時間解析として、カプラン・マイヤー曲線やログランク検定などの手法を紹介しました。■目次1. コックス比例ハザードモデルとは(カプラン・マイヤー曲...
Rでデータ解析と可視化

Reactive stat(ブラウザだけで使えるR)でカイ二乗検定をやってみました。

医療関連の研究において統計解析は重要です。医療だけでもいろいろな統計解析の手法が使われており、こちらのWebサイトでもRでの統計解析手法について紹介してきました。最近は、解析用のコードなどがあらかじめ準備されていて、データを入力するだけで、...