Rでデータ解析と可視化

Rで主成分分析(PCA) ーggbiplot, ellipse, 色分けー

主成分分析とは、多くの変数により記述された量的データから、できるだけ少ない情報の損失で、情報を縮約して分析を行う方法です。多くの変数データを圧縮して2軸、あるいは3軸で分析結果を表示します。主成分分析は、以下の書籍を参考にされてもよいかと思...
Rでデータ解析と可視化

Rで散布図 ー相関関係の確認, plotー

Rで散布図の可視化と考察を、Rに入っているデータセットairqualifyを使用して行います。散布図とは横軸と縦軸に2つの項目の量や大きさ等を対応させて、プロットしたものです。プロットが右上がりに分布する傾向であれば正の相関があり、右下がり...
Rでデータ解析と可視化

Rで時系列データの折れ線グラフ ーggplot2による気温変化の分析ー

Rで時系列データの分析を行います。2020年の熊本の気温変化データを使ってみます。※更新 2021.9↓↓↓関連した投稿です。時系列を両側2軸で違うスケール表示してますので、参考にされてください。◆今回のポイント①日付を名称でなく、日付とし...
Rでデータ解析と可視化

書籍紹介2 RユーザーのためのRStudio[実践]入門、Rグラフィックスクックブック

R関連の書籍紹介2です。RユーザーのためのRStudio入門(技術評論社)最初はRで作業をしていましたが、初めてRStudioで作業をしたとき、なんてすばらしい環境なのかと。。感動したのを覚えています。今思えば、Rでの作業が探り探りだったこ...
Rでデータ解析と可視化

Rでヒストグラム(度数分布)ーhistー

データの取り込みについては、以下に投稿しています。Rを活用して、誰にでもわかりやすく解析結果を共有出来る資料につなげていきたいと思います。今回取り組むのは、ヒストグラム ( 度数分布を表すグラフで、あるデータ区間ごとに存在するサンプルの数を...
Rでデータ解析と可視化

Rにデータ取り込み ーCSV(read.csv), TSV(read.delim), Excel(readxlパッケージ, read_excel)ー

前回の記事で説明したCSVファイルと、同じようにRStudioの作業で使いやすいTSVファイルについて説明させて頂きます。CSVとTSVファイルは、いわゆるテキストファイルであり、データそのもの以外の情報はありません。一方、ExcelやGo...
Pythonでインフォマティクス

HH-suite3を使った高感度な相同性検索:インストールとデータベースの準備

このカテゴリーの記事では、「Pythonを使った機械学習やケモ・バイオインフォマティクスの実装や論文」を紹介していきたいと考えています。Python は3系(3.7)、anacondaを中心にして環境構築していきます。以下のようなハード・ソ...
Pythonでインフォマティクス

BLAST検索結果の分析:Jupyter notebook の使い方

このカテゴリーの記事では、「Pythonを使った機械学習やケモ・バイオインフォマティクスの実装や論文」を紹介していきたいと考えています。Python は3系(3.7)、anacondaを中心にして環境構築していきます。以下のようなハード・ソ...
Pythonでインフォマティクス

BLAST検索結果の分析:テキスト処理とJupyter notebookのインストール

このカテゴリーの記事では、「Pythonを使った機械学習やケモ・バイオインフォマティクスの実装や論文」を紹介していきたいと考えています。Python は3系(3.7)、anacondaを中心にして環境構築していきます。以下のようなハード・ソ...
Rでデータ解析と可視化

Rでのデータ取り込みとデータ作成 ーCSVファイル(read.csv)ー

前回の記事で、Rの作業環境として、RStudioの基本的な使い方を説明しました。今回は、RStudio上で、実際にRを動かします。まずは、自前のデータをRに取り込みます。といっても、どんなデータを使うの??ということで、誰もが使えるようなデ...