Moleculatioの内部で採用している技術と計算条件などのまとめ
Moleculatio は、Chemoinformatics、Quantum Chemistry、Molecular Dynamics の3つのテーマについて、分子シミュレーションを手軽に体験できるウェブアプリです。
本ノートでは、Moleculatio が内部でおこなっている各シミュレーションの条件と採用した技術について、簡単にまとめてみます。
Chemoinformatics
Chemoinformatics モジュールでは、分子構造の入力・解析から可視化、基本的な記述子の計算までをシームレスに実行できます。
機能
分子構造の生成
- SMILES の直接入力、または準備された分子ライブラリからの選択が可能
- RDKit による分子の 2D/3D 変換と MMFF 力場による構造最適化
分子記述子計算
- 分子量、LogP(疎水性指標)、tPSA(極性表面積)、水素結合ドナー/アクセプター数、回転可能結合数をリアルタイムで計算
可視化
- 2D view
- 分子構造の平面表示と、電荷分布・物性のヒートマップ表示
- 3D view
- 3Dmol によるインタラクティブな分子操作
Quantum Chemistry
Quantum Chemistry モジュールでは、分子の電子状態や振動状態を簡単に解析できます。
計算条件
構造最適化と振動解析
- xTB (GFN2-xTB) による構造最適化を実施
- xTB の計算結果に基づいて、振動モードと IR スペクトルを表示
熱力学解析
- xTB による基準振動解析の結果に基づいて、ASE の Thermochemistry モジュールを用いて、エンタルピー、エントロピー、ギブズ自由エネルギーを算出
分子軌道計算
- Psi4 を用いた HF/STO-3G 計算(一点計算)を実施
- Psi4 で生成した cube ファイルに基づいて、電子密度、静電ポテンシャル(ESP)マップ、HOMO(最高占有軌道)、最低非占有軌道(LUMO)を 3Dmol で描画
- Psi4 による一点計算の結果に基づいて、分子軌道エネルギー(HOMO/LUMO)を表示
Molecular Dynamics
Molecular Dynamics モジュールでは、分子の動的なふるまいを解析し、構造変化の動力学的特性を視覚化できます。
計算条件
初期条件
- xTB (GFN1-xTB) を用いた構造最適化(ASE のBFGS アルゴリズムを使用)
速度分布の設定
- マックスウェル・ボルツマン分布により初期速度を割り当て
- 並進運動と回転運動の成分を除去
分子動力学計算
- Langevin ダイナミクスによるシミュレーション(ASE のアルゴリズムを使用)
- 時間ステップ:1–2 fs(分子サイズに応じて調整)
- 温度範囲:100–500 K(ユーザー指定可能)
- シミュレーション時間:約 1 ps
動的挙動の解析
- 得られたトラジェクトリーデータをもとに、scikit-learn を用いて、主成分分析(PCA)による分子構造変化の特徴抽出と解析
採用技術
RDKit
RDKit は、分子の記述子計算と構造操作を効率的に実行する包括的なケモインフォマティクスライブラリです。分子の生成、変換、特性予測、フィンガープリント生成、構造の類似性評価など、幅広い機能を提供し、Python インターフェースを通じて直感的に利用することができます。特に、SMILES や MOL ファイルなど様々な分子入力形式に対応し、2D/3D 構造の生成や最適化も高速に実行できる点が特徴です。
3Dmol
3Dmol 1は、分子構造の3D可視化を実現するJavaScriptライブラリです。WebGLテクノロジーを効果的に活用することで、ブラウザ上でスムーズかつ軽量な分子の操作を実現しています。電子密度マップや静電ポテンシャルなどの複雑な物性値についても、直感的でわかりやすい可視化表現を提供しており、分子の立体構造と物性の関係性を視覚的に把握することができます。
xTB
xTB 2は、計算速度と精度のバランスが取れた半経験的の量子化学計算手法です。従来の第一原理計算と比較して大幅に計算コストを削減しながら、多様な分子系に対して信頼性の高い結果を提供します。特に、有機分子や生体分子の構造最適化、振動解析、熱力学特性の予測において優れた性能を発揮します。
- GFN2-xTB: 汎用性の高いパラメータ化モデルで、主要な元素に対して高精度な構造最適化と電子状態計算を実現。特に有機分子や生体分子に対して信頼性の高い結果を提供
- GFN1-xTB: 高速計算が可能で、特に大規模分子系や多数の構造最適化が必要な場合に効果的。GFN2-xTB と比較して計算時間を大幅に短縮できるため、分子動力学シミュレーションなどの反復計算に適している
ASE
ASE (Atomic Simulation Environment) は、原子・分子レベルのシミュレーションを包括的にサポートする強力なPythonフレームワークです。構造最適化から分子動力学まで、幅広い計算機能を統一的なインターフェースで提供し、様々な量子化学計算エンジンとシームレスに連携することができます。
ASE の Thermochemistry モジュールでは、振動解析の結果から熱力学的物性値(エンタルピー、エントロピー、ギブズ自由エネルギー)を自動的に算出できます。
Psi4
Psi4 3 は、最先端の量子力学的手法を実装した高精度の量子化学計算エンジンです。Hartree-Fock 法から高度な post-HF 法まで、様々なレベルの理論計算に対応。また、柔軟な Python インターフェースが提供されていて、カスタム計算の実装や他のツールとの連携が容易です。さらに、プラグインシステムを採用していて、独自の計算モジュールを追加することで機能を拡張することができます。
scikit-learn
scikit-learn は、機械学習のためのPythonライブラリです。主成分分析(PCA)などの統計的な手法を含む、幅広い機械学習アルゴリズムを提供します。また、データの前処理、モデルの評価、パラメータのチューニングなど、機械学習の一連のワークフローをサポートする豊富なツールを備えています。特に、直感的なAPIと充実したドキュメントにより、データサイエンスの初学者から専門家まで幅広いユーザーに利用されています。
Streamlit
Moleculation は、Python ベースのフレームワークである Streamlit を利用して開発しました。Streamlit は、データサイエンスやウェブアプリケーション開発のためのPythonフレームワークで、最小限のコードで対話的なユーザーインターフェースを構築することができます。直感的なAPI設計と豊富なコンポーネントライブラリにより、複雑な機能を持つアプリケーションでも効率的に開発することが可能です。
おわりに
Moleculatio に興味を持たれた方は、ぜひ 公式ドキュメント をご覧ください。また、使い方に関する質問やフィードバックがあれば、お気軽にお問い合わせください!
N. Rego and D. Koes, Bioinformatics (2015). DOI: 10.1093/bioinformatics/btu829 ↩︎
C. Bannwarth, et al., WIREs Comput. Mol. Sci. (2020). DOI: 10.1002/wcms.1493 ↩︎
D. G. A. Smith, et al., J. Chem. Phys., (2020). DOI: 10.1063/5.0006002 . ↩︎