Rでデータ解析と可視化

Rで変数ごとに表示をカスタマイズできるヒートマップ ー革新的な可視化, funkyheatmapー

データ分析では、得られた結果を明確に示す可視化がとても重要です。 以前、相関行列のヒートマップについて解説をしました。 今回は、多彩なカスタマイズが可能な「funkyheatmap」パッケージを紹介します。 ■目次 1...
2024.01.10
Rでデータ解析と可視化

Rでクラスター分析② ー非階層クラスター分析, k平均法, kmeans,clusplotー

クラスター分析の主な目的は、サンプルのデータの類似性やパターンに基づいて、サンプルをグループに分けることです。 クラスター分析は教師なし学習であり、サンプルに対してあらかじめ定義されたラベルやカテゴリがなくても、サンプルをグループ分けする...
2024.10.29
Pythonでインフォマティクス

タンパク質の構造解析手法とIn silicoスクリーニングへの応用事例(株式会社技術情報協会出版)一部執筆担当 

2023年7月に「タンパク質の構造解析手法とIn silicoスクリーニングへの応用事例」の書籍が株式会社技術情報協会様より発売になりました。 この書籍の中の「第4章 分子シミュレーションによるタンパク質構造予測」において「第7節 Ope...
2023.12.06
Rでデータ解析と可視化

Google Colaboratory上でのRの作業方法+Google Driveのデータの保存・読み込み方法

Google Colaboratoryは、web上で PythonだけでなくRの作業ができます。専用の環境構築も不要という点、無料という点、でも、初心者も使用しやすいツールになっています。 ただし、Googleアカウントは必要ですので、ア...
2024.01.06
Rでデータ解析と可視化

Rで作図を高解像度に保存する方法について ーpng(), ggsave() などー

Rで作図したものを、論文や著書で使用するため、高解像度で保存する方法は? Rは、データの視覚化にとても便利なツールです。データの詳細な分析や学術論文の掲載時には、作った図を高解像度で保存したいですよね。 ...
2024.10.02
Pythonでインフォマティクス

ChemBERTaのファインチューニングによる溶解度予測(DeBERTaベースのモデルやGCNも試してみました)

このカテゴリーの記事では、「Pythonを使った機械学習やケモ・バイオインフォマティクスの実装や論文」を紹介しています。 本記事では、前回紹介したSMILESを事前学習したモデル「ChemBERTa」を使用して、ファインチューニン...
Pythonでインフォマティクス

ChemBERTa(分子の言語モデル)の紹介

このカテゴリーの記事では、「Pythonを使った機械学習やケモ・バイオインフォマティクスの実装や論文」を紹介しています。 今回の記事では、自然言語処理モデルBERTを分子へと応用した、ChemBERTaを紹介したいと思います。 ...
2023.04.14
Rでデータ解析と可視化

Rでクラスター分析① ー階層クラスター分析, hclust, dist, シルエット分析, silhouetteー

多くの製品があって、どの製品とどの製品が似ているのか、似ていないのか?などを調べるにはどうすればよいでしょう? 似ているもの同士を集めたり、似ていないものと区別するには、クラスター分析が大変役に立ちます。 例えば、ワインの成分情報か...
2024.10.29
Rでデータ解析と可視化

Rで生存時間解析 ーカプラン・マイヤー曲線,survfit関数と、ログランク検定,survdiff関数ー

臨床現場で白血病患者の治療をしない群(コントロール群)と治療群の生存時間のデータを取得している。 取得データから、各群の白血病患者の生存時間を予測したい。 また、コントロール群と治療群の2群のデータがあり、それらの2群の比較も合わせて行...
2024.07.31
Rでデータ解析と可視化

Rでコレスポンデンス分析ー対応分析, CA, fviz_ca_biplot, repelー

各家庭における家事は、それぞれどんな分担傾向があるのか??? 夫のみ、妻のみ、夫婦一緒に、夫婦どちらかが、行う家事はどういった傾向がみられるのか?実施頻度の情報が、目で見て分かり易い図を作ってみます。 この度は、コレスホ...
タイトルとURLをコピーしました