R

Rでプレゼンテーション

Rでデータの選択 ーsubset関数, filter関数などー

Rを用いてデータの選択を行う方法について紹介します。 irisデータセットを例に挙げ、列や行を指定してデータを選択する方法や、特定の条件を満たすデータを選択する方法について解説します。
2024.04.30
Rでプレゼンテーション

Rで欠損値の処理 ーna.omit, is.na, na.rm, 欠損値含むダミーデータ作成ー

データ解析を行うデータを確認すると、データの抜け、いわゆる「欠損値」があることがあります。 欠損値があると、データの解析やモデリングが適切に行えない可能性があります。 この記事では、Rでの欠損値の処理方法について解説します。 ■目次 ...
2024.05.28
Rでプレゼンテーション

Rで変数ごとに表示をカスタマイズできるヒートマップ ー革新的な可視化, funkyheatmapー

データ分析では、得られた結果を明確に示す可視化がとても重要です。 以前、相関行列のヒートマップについて解説をしました。 今回は、多彩なカスタマイズが可能な「funkyheatmap」パッケージを紹介します。 ■目次 1...
2024.01.10
Rでプレゼンテーション

Google Colaboratory上でのRの作業方法+Google Driveのデータの保存・読み込み方法

Google Colaboratoryは、web上で PythonだけでなくRの作業ができます。専用の環境構築も不要という点、無料という点、でも、初心者も使用しやすいツールになっています。 ただし、Googleアカウントは必要ですので、ア...
2024.01.06
Rでプレゼンテーション

Rで作図を高解像度に保存する方法について ーpng(), ggsave() などー

Rで作図したものを、論文や著書で使用するため、高解像度で保存する方法は? Rは、データの視覚化にとても便利なツールです。データの詳細な分析や学術論文の掲載時には、作った図を高解像度で保存したいですよね。 ...
2024.05.27
Rでプレゼンテーション

Rで回帰分析②ー重回帰分析, lm関数, 価格予測ー

AをB、C、Dなどの複数の要因で予測したいという場合に、重回帰分析が用いられます。 例えば、住宅の価格(目的変数)を、町ごとの一人当たり犯罪率、1940年以前に建てられた持ち家の割合、ボストンの5つの雇用中心地までの距離の加重平均のデ...
2024.05.27
Rでプレゼンテーション

Rで主成分分析(PCA) ーggbiplot, ellipse, 色分けー

主成分分析とは、多くの変数により記述された量的データから、できるだけ少ない情報の損失で、情報を縮約して分析を行う方法です。 多くの変数データを圧縮して2軸、あるいは3軸で分析結果を表示します。 主成分分析は、以下の書籍を参考にさ...
2022.05.06
Rでプレゼンテーション

Rで時系列データの折れ線グラフ ーggplot2による熊本の気温変化の分析ー

Rで時系列データの分析を行います。2020年の熊本の気温変化データを使ってみます。 ※更新 2021.9 ↓↓↓関連した投稿です。時系列を両側2軸で違うスケール表示してますので、参考にされてください。 ◆今...
2021.12.21
Rでプレゼンテーション

Rにデータ取り込み ーCSV(read.csv), TSV(read.delim), Excel(readxlパッケージ, read_excel)ー

前回の記事で説明したCSVファイルと、同じようにRStudioの作業で使いやすいTSVファイルについて説明させて頂きます。 CSVとTSVファイルは、いわゆるテキストファイルであり、データそのもの以外の情報はありません。 ...
2024.04.18
タイトルとURLをコピーしました