Rでデータ解析と可視化 Rで回帰分析②ー重回帰分析, lm関数, 価格予測ー AをB、C、Dなどの複数の要因で予測したいという場合に、重回帰分析が用いられます。例えば、住宅の価格(目的変数)を、町ごとの一人当たり犯罪率、1940年以前に建てられた持ち家の割合、ボストンの5つの雇用中心地までの距離の加重平均のデータ(説... 2022.07.12 2024.05.27 Rでデータ解析と可視化
Rでデータ解析と可視化 Rで回帰分析① ー単回帰分析, lm関数, 残差プロット, Q-Qプロットー 車の運転速度が速いほど、ブレーキを踏んでから停止するまでに必要な距離は長くなる💡これは日常の運転でも実感できる事象かと思います。このような関係性をデータから数式で表現し、予測に活用できる手法である単回帰分析です。この記事では、車の運転速度を... 2022.05.05 2024.11.05 Rでデータ解析と可視化
Rでデータ解析と可視化 Rで対応のない2群検定:Mann-Whitney U検定、Wilcoxon Rank-Sum 検定、箱ひげ図、バイオリンプロット 例えば、数学のテストでXクラスとYクラスで平均点に差があるのか?ないのか?を調べたいとします。このクラスの点数は、他のクラスと比べて差があるのか???これは、XクラスとYクラスが異なる学生からなり、それぞれが受けた数学のテストの点数を比較し... 2022.04.19 2024.09.30 Rでデータ解析と可視化
Rでデータ解析と可視化 Rで対応のない2群検定:Student t 検定, Welch’s t検定, 箱ひげ図, バイオリンプロット,ビースウォームプロット 例えば、国語のテストがあった時に、XクラスとYクラスのテストの点数の平均値に差があるのか?ないのか?を知りたいとします。隣のクラスと差があるのか..??各クラスのテストの点数の平均値を比較する際に使用するのは対応のない2群の検定です。各クラ... 2021.11.07 2024.05.28 Rでデータ解析と可視化
Rでデータ解析と可視化 Rで相関係数のヒートマップによる可視化:新型コロナ陽性者数の都道府県別動向 ーcorrplotー 以前の投稿で、熊本県の新型コロナ陽性者数動向と他都道府県との相関関係について書きました。厚労省のオープンデータを用いて、引き続きデータ解析を行います。#1 #2まで以前の投稿と同じ部分。patient_prefecture<-read.cs... 2021.09.20 2024.01.06 Rでデータ解析と可視化
Rでデータ解析と可視化 Rで時系列データの可視化:新型コロナ陽性者数の県別動向 ーgeom_lineー 厚労省のオープンデータとして、各都道府県における1日当たりのコロナ陽性患者数情報を入手することができます。熊本県の新型コロナ陽性患者数動向において、相関の高い都道府県はどこか?について調べたいと思います。患者数動向は、時系列データの1種です... 2021.09.18 2024.01.06 Rでデータ解析と可視化
Rでデータ解析と可視化 Rで両側2軸を異なるスケールに設定した折れ線グラフ ーgeom_lineー 以前、時系列データの折れ線グラフ表示について、下記リンクの投稿をさせていただきました。今回は、前回表示した気温変化に加え、湿度変化についても同じ図にのせて表示したいと思います。「単位や、推移するスケールも違うのでは?」それを一度に解決すべく... 2021.09.13 2024.01.06 Rでデータ解析と可視化
Rでデータ解析と可視化 対応のある2群のt検定 ー箱ひげ図, ggpairedー 例えば、同じ人が睡眠薬AとBを服用すると、それぞれの効果に差があるのか?ないのか?を知りたいとします。その際に、よく使用されるのが対応のある2群のt検定です。”対応のある”2群のt検定は、比べるデータは同じ人がAを服用した場合とBを服用した... 2021.06.09 2024.10.02 Rでデータ解析と可視化
Rでデータ解析と可視化 Rで相関行列 ーPearsonの相関係数, corrplotの使い方ー 相関係数とは2つの変数間における関係の強弱を表現する指標です。2つの変数間だけでなく、複数の変数の情報から、それぞれの相関係数を全部知りたい、そういう時には相関行列で可視化を行い、すべてを確認し、議論を行うことができます。相関については、以... 2021.05.18 2021.11.10 Rでデータ解析と可視化
Rでデータ解析と可視化 Rで主成分分析(PCA) ーggbiplot, ellipse, 色分けー 主成分分析とは、多くの変数により記述された量的データから、できるだけ少ない情報の損失で、情報を縮約して分析を行う方法です。多くの変数データを圧縮して2軸、あるいは3軸で分析結果を表示します。主成分分析は、以下の書籍を参考にされてもよいかと思... 2021.05.14 2024.10.02 Rでデータ解析と可視化