Rでプレゼンテーション

Rでプレゼンテーション

Rで回帰分析②ー重回帰分析, lm関数, 価格予測ー

AをB、C、Dなどの複数の要因で予測したいという場合に、重回帰分析が用いられます。 例えば、住宅の価格(目的変数)を、町ごとの一人当たり犯罪率、1940年以前に建てられた持ち家の割合、ボストンの5つの雇用中心地までの距離の加重平均のデ...
2024.05.27
Rでプレゼンテーション

Rで回帰分析①ー単回帰, lm関数, 残差プロット, Q-Qプロットー

車の運転速度から、ブレーキを踏んでから停止までの距離を予測したい! ここで使うのが単回帰分析です! 車の運転速度のデータ(説明変数)を用いて、停止までの距離(目的変数)を予測する式を作る、単回...
2023.08.18
Rでプレゼンテーション

Rで対応のない2群検定:Mann-Whitney U検定、Wilcoxon Rank-Sum 検定、箱ひげ図、バイオリンプロット

例えば、数学のテストでXクラスとYクラスで平均点に差があるのか?ないのか?を調べたいとします。 このクラスの点数は、他のクラスと比べて差があるのか??? これは、XクラスとYクラスが異なる学生からなり、それぞれが受けた数学のテストの点数...
2024.05.28
Rでプレゼンテーション

Rで対応のない2群検定:Student t 検定, Welch’s t検定, 箱ひげ図, バイオリンプロット,ビースウォームプロット

例えば、国語のテストがあった時に、XクラスとYクラスのテストの点数の平均値に差があるのか?ないのか?を知りたいとします。 隣のクラスと差があるのか..?? 各クラスのテストの点数の平均値を比較する際に使用するのは対応のない2群の検定...
2024.05.28
Rでプレゼンテーション

Rで相関係数のヒートマップによる可視化:新型コロナ陽性者数の都道府県別動向 ーcorrplotー

以前の投稿で、熊本県の新型コロナ陽性者数動向と他都道府県との相関関係について書きました。 厚労省のオープンデータを用いて、引き続きデータ解析を行います。 #1 #2まで以前の投稿と同じ部分。 patient_pre...
2024.01.06
Rでプレゼンテーション

Rで時系列データの可視化:新型コロナ陽性者数の県別動向 ーgeom_lineー

厚労省のオープンデータとして、各都道府県における1日当たりのコロナ陽性患者数情報を入手することができます。 熊本県の新型コロナ陽性患者数動向において、相関の高い都道府県はどこか?について調べたいと思います。 患者数動向は、時系列データの...
2024.01.06
Rでプレゼンテーション

Rで両側2軸を異なるスケールに設定した折れ線グラフ ーgeom_lineー

以前、時系列データの折れ線グラフ表示について、下記リンクの投稿をさせていただきました。 今回は、前回表示した気温変化に加え、湿度変化についても同じ図にのせて表示したいと思います。 「単位や、推移するスケールも違うのでは?...
2024.01.06
Rでプレゼンテーション

対応のある2群のt検定 ー箱ひげ図, ggpairedー

例えば、同じ人が睡眠薬AとBを服用すると、それぞれの効果に差があるのか?ないのか?を知りたいとします。 その際に、よく使用されるのが対応のある2群のt検定です。 ”対応のある”2群のt検定は、比べるデータは同じ人がAを服...
2024.01.06
Rでプレゼンテーション

Rで相関行列 ーPearsonの相関係数, corrplotの使い方ー

相関係数とは2つの変数間における関係の強弱を表現する指標です。 2つの変数間だけでなく、複数の変数の情報から、それぞれの相関係数を全部知りたい、 そういう時には相関行列で可視化を行い、すべてを確認し、議論を行うことができます。 ...
2021.11.10
Rでプレゼンテーション

Rで主成分分析(PCA) ーggbiplot, ellipse, 色分けー

主成分分析とは、多くの変数により記述された量的データから、できるだけ少ない情報の損失で、情報を縮約して分析を行う方法です。 多くの変数データを圧縮して2軸、あるいは3軸で分析結果を表示します。 主成分分析は、以下の書籍を参考にさ...
2022.05.06
タイトルとURLをコピーしました