hiratomoko

Rでデータ解析と可視化

Rで時系列データの可視化:新型コロナ陽性者数の県別動向 ーgeom_lineー

厚労省のオープンデータとして、各都道府県における1日当たりのコロナ陽性患者数情報を入手することができます。熊本県の新型コロナ陽性患者数動向において、相関の高い都道府県はどこか?について調べたいと思います。患者数動向は、時系列データの1種です...
Pythonでインフォマティクス

AutoDock Vina 1.2 のインストール

このカテゴリーの記事では、「Pythonを使った機械学習やケモ・バイオインフォマティクスの実装や論文」を紹介していきたいと考えています。Python は3系(3.7)、anacondaを中心にして環境構築していきます。以下のようなハード・ソ...
Pythonでインフォマティクス

DeepChemのインストールとチュートリアル 1

このカテゴリーの記事では、「Pythonを使った機械学習やケモ・バイオインフォマティクスの実装や論文」を紹介していきたいと考えています。Python は3系(3.7)、anacondaを中心にして環境構築していきます。以下のようなハード・ソ...
書籍紹介

書籍紹介3 実験で使うとこだけ生物統計1 キホンノキ、実験で使うとこだけ生物統計2 キホンノキ

実験で使うとこだけ生物統計1 キホンノキ 改訂実験を行う際には、得られるであろう結果を想定して組み立てを行っていくことになるかと思います。実験した後で、解析をうーんと考えるのは良くない。なぜなら~が書いてある本です。標準偏差や標準誤差など、...
Rでデータ解析と可視化

Rで両側2軸を異なるスケールに設定した折れ線グラフ ーgeom_lineー

以前、時系列データの折れ線グラフ表示について、下記リンクの投稿をさせていただきました。今回は、前回表示した気温変化に加え、湿度変化についても同じ図にのせて表示したいと思います。「単位や、推移するスケールも違うのでは?」それを一度に解決すべく...
Rでデータ解析と可視化

対応のある2群のt検定 ー箱ひげ図, ggpairedー

例えば、同じ人が睡眠薬AとBを服用すると、それぞれの効果に差があるのか?ないのか?を知りたいとします。その際に、よく使用されるのが対応のある2群のt検定です。”対応のある”2群のt検定は、比べるデータは同じ人がAを服用した場合とBを服用した...
Rでデータ解析と可視化

Rで相関行列 ーPearsonの相関係数, corrplotの使い方ー

相関係数とは2つの変数間における関係の強弱を表現する指標です。2つの変数間だけでなく、複数の変数の情報から、それぞれの相関係数を全部知りたい、そういう時には相関行列で可視化を行い、すべてを確認し、議論を行うことができます。相関については、以...
Rでデータ解析と可視化

Rで主成分分析(PCA) ーggbiplot, ellipse, 色分けー

主成分分析とは、多くの変数により記述された量的データから、できるだけ少ない情報の損失で、情報を縮約して分析を行う方法です。多くの変数データを圧縮して2軸、あるいは3軸で分析結果を表示します。主成分分析は、以下の書籍を参考にされてもよいかと思...
Rでデータ解析と可視化

Rで散布図 ー相関関係の確認, plotー

Rで散布図の可視化と考察を、Rに入っているデータセットairqualifyを使用して行います。散布図とは横軸と縦軸に2つの項目の量や大きさ等を対応させて、プロットしたものです。プロットが右上がりに分布する傾向であれば正の相関があり、右下がり...
Rでデータ解析と可視化

Rで時系列データの折れ線グラフ ーggplot2による気温変化の分析ー

Rで時系列データの分析を行います。2020年の熊本の気温変化データを使ってみます。※更新 2021.9↓↓↓関連した投稿です。時系列を両側2軸で違うスケール表示してますので、参考にされてください。◆今回のポイント①日付を名称でなく、日付とし...