Rでプレゼンテーション

Rでクラスター分析② ー非階層クラスター分析, k平均法, kmeansー

クラスター分析の主な目的は、サンプルのデータの類似性やパターンに基づいて、サンプルをクラスター化することです。 クラスター分析は教師なし学習であり、サンプルに対して事前に定義されたラベルやカテゴリがなくても、サンプルのクラスター化を行うこ...
Pythonでインフォマティクス

タンパク質の構造解析手法とIn silicoスクリーニングへの応用事例(株式会社技術情報協会出版)一部執筆担当 

2023年7月に「タンパク質の構造解析手法とIn silicoスクリーニングへの応用事例」の書籍が株式会社技術情報協会様より発売になりました。 この書籍の中の「第4章 分子シミュレーションによるタンパク質構造予測」において「第7節 Ope...
2023.12.06
Rでプレゼンテーション

Google Colaboratory上でのRの作業方法+Google Driveのデータの保存・読み込み方法

Google Colaboratoryは、web上で PythonだけでなくRの作業ができます。専用の環境構築も不要という点、無料という点、でも、初心者も使用しやすいツールになっています。 ただし、Googleアカウントは必要ですので、ア...
2024.01.06
Rでプレゼンテーション

Rで作図を高解像度に保存する方法について ーpng(), ggsave() などー

Rで作図したものを、論文や著書で使用するため、高解像度で保存する方法は? Rは、データの視覚化にとても便利なツールです。データの詳細な分析や学術論文の掲載時には、作った図を高解像度で保存したいですよね。 ...
2024.04.19
Pythonでインフォマティクス

ChemBERTaのファインチューニングによる溶解度予測(DeBERTaベースのモデルやGCNも試してみました)

このカテゴリーの記事では、「Pythonを使った機械学習やケモ・バイオインフォマティクスの実装や論文」を紹介しています。 本記事では、前回紹介したSMILESを事前学習したモデル「ChemBERTa」を使用して、ファインチューニン...
Pythonでインフォマティクス

ChemBERTa(分子の言語モデル)の紹介

このカテゴリーの記事では、「Pythonを使った機械学習やケモ・バイオインフォマティクスの実装や論文」を紹介しています。 今回の記事では、自然言語処理モデルBERTを分子へと応用した、ChemBERTaを紹介したいと思います。 ...
2023.04.14
Rでプレゼンテーション

Rでクラスター分析① ー階層クラスター分析, hclust, dist, シルエット分析, silhouetteー

多くの製品があって、どの製品とどの製品が似ているのか、似ていないのか?などを調べるにはどうすればよいでしょう? 似ているもの同士を集めたり、似ていないものと区別するには、クラスター分析が大変役に立ちます。 ...
2024.01.06
Rでプレゼンテーション

Rで生存時間解析 ーカプランマイヤー曲線,survfit関数と、ログランク検定,survdiff関数ー

臨床現場で白血病患者の治療をしない群(コントロール群)と治療群の生存時間のデータを取得している。 取得データから、各群の白血病患者の生存時間を予測したい。 また、コントロール群と治療群の2群のデータがあり、それらの2群の比較も合わせて行...
2023.02.02
Rでプレゼンテーション

Rでコレスポンデンス分析ー対応分析, CA, fviz_ca_biplot, repelー

各家庭における家事は、それぞれどんな分担傾向があるのか??? 夫のみ、妻のみ、夫婦一緒に、夫婦どちらかが、行う家事はどういった傾向がみられるのか?実施頻度の情報が、目で見て分かり易い図を作ってみます。 この度は、コレスホ...
Rでプレゼンテーション

Rで回帰分析②ー重回帰分析, lm関数, 価格予測ー

AをB、C、Dなどの複数の要因で予測したいという場合に、重回帰分析が用いられます。 例えば、住宅の価格(目的変数)を、町ごとの一人当たり犯罪率、1940年以前に建てられた持ち家の割合、ボストンの5つの雇用中心地までの距離の加重平均のデ...
2023.08.18
タイトルとURLをコピーしました