Rでデータ解析と可視化 Rで回帰分析②ー重回帰分析, lm関数, 価格予測ー AをB、C、Dなどの複数の要因で予測したいという場合に、重回帰分析が用いられます。例えば、住宅の価格(目的変数)を、町ごとの一人当たり犯罪率、1940年以前に建てられた持ち家の割合、ボストンの5つの雇用中心地までの距離の加重平均のデータ(説... 2022.07.12 2024.05.27 Rでデータ解析と可視化
Rでデータ解析と可視化 Rで回帰分析① ー単回帰分析, lm関数, 残差プロット, Q-Qプロットー 車の運転速度が速いほど、ブレーキを踏んでから停止するまでに必要な距離は長くなる💡これは日常の運転でも実感できる事象かと思います。このような関係性をデータから数式で表現し、予測に活用できる手法である単回帰分析です。この記事では、車の運転速度を... 2022.05.05 2024.11.05 Rでデータ解析と可視化
Rでデータ解析と可視化 対応のある2群のt検定 ー箱ひげ図, ggpairedー 例えば、同じ人が睡眠薬AとBを服用すると、それぞれの効果に差があるのか?ないのか?を知りたいとします。その際に、よく使用されるのが対応のある2群のt検定です。”対応のある”2群のt検定は、比べるデータは同じ人がAを服用した場合とBを服用した... 2021.06.09 2024.10.02 Rでデータ解析と可視化
Rでデータ解析と可視化 Rで主成分分析(PCA) ーggbiplot, ellipse, 色分けー 主成分分析とは、多くの変数により記述された量的データから、できるだけ少ない情報の損失で、情報を縮約して分析を行う方法です。多くの変数データを圧縮して2軸、あるいは3軸で分析結果を表示します。主成分分析は、以下の書籍を参考にされてもよいかと思... 2021.05.14 2024.10.02 Rでデータ解析と可視化
Rでデータ解析と可視化 Rで時系列データの折れ線グラフ ーggplot2による気温変化の分析ー Rで時系列データの分析を行います。2020年の熊本の気温変化データを使ってみます。※更新 2021.9↓↓↓関連した投稿です。時系列を両側2軸で違うスケール表示してますので、参考にされてください。◆今回のポイント①日付を名称でなく、日付とし... 2021.04.16 2024.11.07 Rでデータ解析と可視化
Rでデータ解析と可視化 Rにデータ取り込み ーCSV(read.csv), TSV(read.delim), Excel(readxlパッケージ, read_excel)ー 前回の記事で説明したCSVファイルと、同じようにRStudioの作業で使いやすいTSVファイルについて説明させて頂きます。CSVとTSVファイルは、いわゆるテキストファイルであり、データそのもの以外の情報はありません。一方、ExcelやGo... 2021.04.02 2024.04.18 Rでデータ解析と可視化