Researchers Database

Shugo Nakamura

    Department of Information Networking for Innovation and Design Professor
    Course of Information Networking for Innovation and Design Professor
    Information Networking for Innovation and Design collaboration Hub for University and Business Researcher
Last Updated :2024/04/23

Researcher Information

Degree

  • Ph.D.(The University of Tokyo)

Research funding number

  • 90272442

J-Global ID

Research Interests

  • 生命情報科学   生物情報工学   計算機科学   information science   

Research Areas

  • Informatics / Biological, health, and medical informatics / Bioinformatics
  • Informatics / Intelligent informatics / Machine Learning
  • Informatics / Statistical science / Data Science

Academic & Professional Experience

  • 2017/04 - Today  Toyo UniversityINIADProfessor
  • 2016/04 - 2017/03  The University of TokyoGraduate School of Agricultural and Life Sciences准教授
  • 2002/02 - 2017/03  Associate Professor, The Univ. of Tokyo
  • 2012/04 - 2016/03  The University of Tokyo大学院情報学環准教授
  • 2002/02 - 2012/03  The University of TokyoGraduate School of Agricultural and Life Sciences准教授
  • 1995/08 - 2002/01  The University of Tokyo大学院農学系研究科助手
  • 1995/08 - 2002/01  Assitant Professor, The Univ. of Tokyo

Education

  • 1991/04 - 1995/07  The University of Tokyo  大学院農学系研究科  応用生命工学専攻
  •        - 1995  The University of Tokyo  Graduate School, Division of Agricultural Science
  • 1989/04 - 1991/03  The University of Tokyo  The Faculty of Engineering  Department of Mathematical Engineering and Information Physics
  •        - 1991  The University of Tokyo  Faculty of Engineering

Association Memberships

  • 日本バイオインフォマティクス学会   日本蛋白質科学会   生物物理学会   情報計算化学生物学会   人工知能学会   

Published Papers

Books etc

  • 分子シミュレーションによるHCVポリメラーゼの薬剤耐性変異解析, 消化器・肝臓内科 第6巻第6号 特集 II.新規技術の肝臓病研究への応用
    中村周吾 (Single work)科学評論社 2019/12
  • バイオインフォマティクスと分子動力学シミュレーション, 先端医療シリーズ49「消化器疾患の最新医療」
    内田義人; 中村周吾; 持田 智 (Joint work)先端医療技術研究所 2018/09
  • タンパク質立体構造予測 -de novoモデリング-, 遺伝子医学MOOK 14「次世代創薬テクノロジー 実践:インシリコ創薬の最前線」, 竹田-志鷹, 梅山編, 49-54
    メディカルドゥ 2009
  • バイオインフォマティクス・コンピューティング, Bryan Bergeron著, 清水, 中村監訳
    オーム社 2004
  • 分子シミュレーションの並列計算法, 化学フロンティア8「生体系のコンピュータ・シミュレーション」, 岡崎, 岡本編, 50-62
    化学同人 2002
  • OLD AND NEW VIEWS OF PROTEIN FOLDING
    Excerpta Medica 1999
  • Improved Diffusion Equation Method for Large Molecules
    Perspectives on Proten Engineering 1995
  • Vibration analysis of transfer RNAs using normal mode calculation
    Computer Aided Innovation of New Materials 1993

Conference Activities & Talks

  • Overview of machine learning/deep learning methods and their application to the life sciences  [Invited]
    Shugo Nakamura
    BPCNPNPPP4学会合同年会
  • Machine Learning, Deep Learning and Life Sciences  [Invited]
    Shugo Nakamura
    The Basics of Bioinformatics 8  2021/10  Public discourse
  • Machine Learning, Deep Learning and Life Sciences  [Invited]
    Shugo Nakamura
    The Basics of Bioinformatics VII  2020/10  Public discourse
  • 肝炎研究へのバイオインフォマティクスによるアプローチ例  [Invited]
    中村 周吾
    日本肝臓学会大会・ランチョンセミナーC  2019/05
  • 生命科学データのデータマイニングと分子シミュレーション ~タンパク質凝集性解析とNSAIDs・トレハロース相互作用解析~  [Invited]
    中村 周吾
    第161回日本獣医学会学術集会  2018/09
  • アミノ酸配列からのタンパク質立体構造予測と4次構造予測  [Invited]
    中村 周吾
    第84回日本生化学会大会  2011/09
  • Bilab in CASP9 -モノマーおよび複合体構造予測-  [Invited]
    中村 周吾
    IPAB公開セミナー  2011/02
  • Bilab in CASP - de novo structure prediction, model quality assessment, and function prediction -  [Invited]
    中村 周吾
    Asian workshop for protein structure prediction  2009/09
  • Bilab in CASP8 -モデル品質予測とリガンド結合部位予測を中心に-  [Invited]
    中村 周吾
    日本バイオインフォマティクス学会第9回創薬インフォマティクス研究会  2009/01
  • Bilab in CASP7  [Invited]
    中村 周吾
    GSICシンポジウム  2006/12
  • Structural Propensity of Protein Fragments and Tertiary Structure Prediction of Proteins  [Invited]
    中村 周吾
    EABS&BSJ2006  2006/11
  • tRNAとアミノアシルtRNA合成酵素の相互作用  [Invited]
    中村 周吾
    CCSEワークショップ  2005/01
  • Bilab in CASP6  [Invited]
    中村 周吾
    IPABセミナー  2005/01
  • Recent advances in structure prediction and folding simulation of biomolecules by using computers  [Invited]
    中村 周吾
    IBC2004  2004/12

MISC

Research Grants & Projects

  • Japan Society for the Promotion of Science:Grants-in-Aid for Scientific Research
    Date (from‐to) : 2009 -2011 
    Author : NAKAMURA Shugo
     
    I have applied protein structure prediction method and molecular dynamics simulation to amino acid sequences of various intrinsically disordered regions/proteins(IDRs/IDPs). I found that these amino acid sequences include structural information as the same degree of loop regions of ordered proteins and that tertiary structures of some IDPs after complex formation are even predictable without information of partner proteins.
  • Japan Society for the Promotion of Science:Grants-in-Aid for Scientific Research
    Date (from‐to) : 2008 -2010 
    Author : SHIMIZU Kentaro
     
    We developed a new method for defining the degree of disorder of protein structures. The results of this analysis were stored in our protein disorder database. We also analyzed the relation between the disorder regions and functional sites of proteins.
  • 日本学術振興会:科学研究費助成事業
    Date (from‐to) : 2008 -2010 
    Author : 清水 謙太郎; 中村 周吾; 角越 和也
     
    タンパク質間相互作用は様々な生命現象の鍵を握る重要な反応であるが、生化学的解析や立体構造解析には複雑な手順・高額な装置・研究者の熟練等が必要であり、膨大な数の相互作用の全てをそれらの手法で解析するのは不可能である。本研究課題では、タンパク質間相互作用について、以下の4つのアプローチから予測・解析手法の開発を行う。(1)タンパク質-タンパク質間相互作用予測および相互作用ネットワーク予測、(2)タンパク質-タンパク質、リガンド、糖鎖、DNA間相互作用部位予測、(3)タンパク質-タンパク質間ドッキング予測(複合体構造予測)、(4)タンパク質-タンパク質、リガンド、糖鎖、DNA間の物理的な相互作用解析。本年度は、まず、ネットワーク構造の既知部分や他の類似のネットワークを鋳型とする(ネットワークを学習の直接的な対象とさせる)相互作用予測法を新たに開発し、前年度開発した手法と組み合わせて、相互作用ネットワーク予測システムを完成させる。開発したシステムをもとに、ゲノムワイドな予測を行い、ネットワークの特性、生物種間の違いなどを解析した。また、タンパク質-タンパク質の相互作用部位予測に加えて、タンパク質-糖鎖、タンパク質-DNA相互作用部位予測の手法を開発した。これらの相互作用部位(結合部位)の配列・構造上の特徴を調査し、機械学習SVMを用いて、これらの相互作用部位を統一に予測する手法を開発した。さらに、構造情報が利用できる場合は、予測精度を向上させるための構造特徴の抽出法についても検討を行った。タンパク質-タンパク質間ドッキング予測については、複合体構造の精密化と結合時の構造変化に対応したフレキシブルドッキングを実現している。開発したソフトウェアは、順次、ネットワーク上で公開している。
  • Japan Society for the Promotion of Science:Grants-in-Aid for Scientific Research
    Date (from‐to) : 2007 -2008 
    Author : NAKAMURA Shugo
     
    本研究では、アミノ酸配列情報および構造情報の局所部分の一致の数に着目して、タンパク質間の類似度をネットワークのように定義する方法を、新たに構造未知のタンパク質に適用することで、アミノ酸配列だけからタンパク質の機能予測を行う新しい方法の開発を行った。まず、局所構造の両端のα炭素原子間の距離をその局所構造の「端間距離」と定義し、予測2次構造情報と配列プロファイル情報を入力とし、予測端間距離を出力する、サポートベクタ回帰をベースとしたツールを開発した。これを、さまざまな立体構造を含むタンパク質群に適用したところ、ループ長が短いところから長いところまで、予測端間距離と実際の端間距離がよく相関することが明らかになった。とくにループ領域については、これまでβターンなど、端間距離が短いものについては、アミノ酸配列と立体構造との関係性についてさまざまな研究がなされていたが、端間距離が長いものについては研究例が少なく、本研究によって、端間距離が長くなるようなアミノ酸配列傾向がとらえられたことは、局所配列が局所構造を制限し、結果として、タンパク質のフォールディングにおいて、立体構造全体の構造空間がかなり大きく制限されている可能性を示唆する興味深い結果である。また同様の解析を、複合体形成によってディスオーダーからオーダーへ転移することが知られているタンパク質領域に適用したところ、オーダー領域ほどではないが、ランダムよりもよい予測が可能であることが明らかとなった。この局所構造の端間距離予測ツールと、配列一致検出ツール、および2次構造予測ツールを組み合わせたタンパク質機能予測ツールを開発し、その性能を確認することができた。
  • 日本学術振興会:科学研究費助成事業
    Date (from‐to) : 2006 -2007 
    Author : 清水 謙多郎; 中村 周吾; 寺田 透; 角越 和也
     
    与えられた2つのタンパク質が相互作用するかどうかを、アミノ酸配列情報のみから機械学習サポートベクタマシン(SVM)を用いて学習・予測する手法を開発した。配列特徴としては、(1)アミノ酸の隣接ペアの出現頻度、(2)(1)の3つ組の出現頻度、(3)アミノ酸の物理化学特性に基づく分類の隣接ペアの出現頻度、(4)(3)の3つ組の出現頻度の4通りを試したところ、(2)が最も良い結果を示した。タンパク質間相互作用部位予測については、昨年度に引き続き、タンパク質のアミノ酸配列情報のみを用いて予測する手法と、タンパク質のアミノ酸配列情報と構造情報の両方を用いて予測する手法の2つを開発したが、本年度はとくに後者について、SVR(Support Vector Regression)を用いて、各残基の周辺の相互作用残基数を予測する手法を新たに開発し、従来よりも高い精度で予測できることを示した。本年度は、また、タンパク質-リガンド結合部位予測の手法を開発した。これは、タンパク質表面にメタン分子を格子状にプローブさせ、タンパク質分子とのvan der Waals相互作用エネルギーを計算するというものである。Pocket FinderやQ-site Finderなど現在広く用いられている手法より高い精度で予測でき、とくにunbound予測における予測精度の向上が大きいという結果を得た。ドッキングシミュレーションについては、新たな直交関数系を導入し、予測精度の改善を試みた。また、高精度の相互作用解析を行うため、ab initio分子動力学(MD)とマルチカノニカルMDを統合した手法を新たに開発し、相互作用部位における化学反応の動的な解析を可能にする基盤技術を開発した。
  • Japan Society for the Promotion of Science:Grants-in-Aid for Scientific Research
    Date (from‐to) : 2005 -2007 
    Author : SHIMIZU Kentaro; NAKAMURA Shugo; TERADA Tohru
     
    Comparative modeling is a powerful method that easily predicts a considerably accurate structure of a protein by using a template structure having a similar amino-acid sequence to the target protein. However, in the region where the amino acid sequence is different between the target and the template, the predicted structure remains unreliable. In such a case, the model has to be refined. In this study, we explored the possibility of a molecular dynamics-based method, using the human SAP Src Homology 2 (SH2) domain as the modeling target. The multicanonical method was used to alleviate the multiple-minima problem and the generalised Born/surface area model was used to reduce the computational cost. In addition, position restraints were imposed on the atoms in the reliable regions to avoid unnecessary conformational sampling. We found that the most populated conformational clusters in the ensemble of the model agreed well with one of the two major clusters in the ensemble of the reference simulation starting from the crystal structure. This demonstrates that the current refinement method can significantly improve the accuracy of an unreliable region in a comparative model. In this study, we also developed the method for protein structure assessment. Most protein structure prediction programs generate a set of structures of various qualities (candidates). It is necessary to select some models that are expected to have native structures from the candidates. Our method evaluates quality of a protein structure from many aspects of protein structures. This method scores each amino acid at each position in the sequences based on its degree of correlation to structural environment. Structural environment is defined based on protein local secondary structure, the area of the residue buried in the protein and inaccessible to solvent, and the fraction of side-chain area that is covered by polar atoms like water molecule.
  • 日本学術振興会:科学研究費助成事業
    Date (from‐to) : 2005 -2005 
    Author : 清水 謙多郎; 中村 周吾; 寺田 透
     
    精度の高いタンパク質間相互作用部位予測と、ドッキングによる複合体構造予測の開発を行った。タンパク質間相互作用部位を予測については、SVMを用いた予測手法の開発を行い、とくに、学習パラメータ(コストパラメータとガウスカーネルのパラメータの2つ)を、クロスバリデーション法を利用し、AUCが最大になるよう最適化を行った。また、情報理論を用いたフィルタリングを新たに開発し、false positive予測を低減した。さらに、ウィンドウサイズと予測精度の関係を解析し、7残基のウィンドウが多くのタンパク質で最も良い精度を実現することを明らかにした。以上の工夫により、ニューラルネットワークを用いて行ったOfranらの結果より、高い予測精度を実現した。ドッキングによる複合体構造予測については、球面調和関数を用いて新規に設計した正規直交基底関数での級数展開による高速内積計算を使ったアルゴリズムを開発した。本手法のスコア関数の枠組みは非常に柔軟で、分子形状の相補性や各種ペアポテンシャル、静電相互作用などを表現することが可能である。また、本手法では、スカラー場を上記正規直交基底関数で展開することにより、スコア関数の計算に必要な内積計算を高速に行うとともに、配座空間の探索に必要な座標変換操作も高速に行えることを示した。本研究では、展開係数によるスカラー場の表現能力が、中心からの距離rの増加に従って大幅に劣化するという、従来の球面調和関数を基底関数とする方式の問題点を解決するため、rによる減衰のない、修正Legendre多項式を組み合わせた基底関数を用いた。現在、すでにいつかの複合体のデモリングを行い、例えば、1AKZ(223残基)と1UGI_A(84残基)のunbound dockingでは、従来のFTDockの手法と同程度の精度の複合体モデリングを約400倍の速度で実行することができている。
  • Japan Society for the Promotion of Science:Grants-in-Aid for Scientific Research
    Date (from‐to) : 2004 -2005 
    Author : NAKAMURA Shugo
     
    This research is about the analysis of the stability of nucleic acids hairpin structures by large scale structure sampling using multicanonical molecular dynamics simulation and local enhanced sampling (LES). Target molecules are dGC(GAA)GC and its mutants at tri-loop region. Starting from unfold structure, folding event was found in the trajectories of a multicanonical molecular dynamics simulation, and this folding/unfolding pathway was analyzed in detail. Sorin et al. proposed two folding pathways, zipping and compaction, for RNA tetra-loop hairpins. According to the analysis in this research, the folding pathway for dGC(GAA)GC was compaction-type. Structure sampling using LES was also applied to stable dGC(GNA)GC (N=A,G,T,C) and unstable dGC(GAG)GC and dGC(GAC)GC. Similar folding pathways were observed in dGC(GNA)GC trajectories : first, A5 stacks on the stem (G6), then G3 stacks on the stem (C2), and finally, N4 stacks on G3. For dGC(GNA)GC, structures were converged to near-native hairpin in 10 ns simulation. For dGC(GAG)GC and dGC(GAC)GC, structures were not converged, that corresponds to the fact that these molecules cannot form stable hairpin structures. These analysis may be able to extend to the stability analysis of other nucleic acid molecules.
  • 日本学術振興会:科学研究費助成事業
    Date (from‐to) : 2004 -2005 
    Author : 清水 謙多郎; 中村 周吾; 寺田 透
     
    本研究では、分散メモリ型システムを用いて巨大なメモリ領域を利用することができる、共有メモリプログラミングモデルにもとづく新しい並列プログラミング環境DSA(Distributed Shared Array)を開発する。DSAは、分散システムの上に、巨大なメモリ領域を仮想的に構築する。データの実体は、それぞれの計算機のメモリやディスクに分散して置かれるが、すべての計算機が、こうした物理的なデータの分散を意識しないで、グローバルなメモリ領域を共有できるようにすることにより、並列計算を行うプログラムの開発を容易にする。1台の計算機のメモリやディスクに格納しきれない巨大なデータも、この仮想的なメモリに置いて複数の計算機から共通に操作することができる。科学技術計算でよく用いられるベクトルや行列をこの巨大なメモリに格納して操作することにより、巨大なベクトルや行列を扱うプログラムも、分散システムの上でこれまでより簡単に開発できるようになり、しかも高速に実行できるようになる。データの実体は分散していても、利用者には、複数の計算機間で共有できるグローバルな配列が存在しているように見える。このような配列を「分散共有配列(DSA)」と呼んでいる。本研究では、DSAを、遺伝子クラスタリング、配列のマルチプルアラインメント、分子動力学計算など、生命情報科学の実際のアプリケーションに対して適用し、クラスタ型計算機上で性能評価を行い、分散するデータを効率的に操作・管理できること、MPIのプログラムと比較して、ノード数が増大してもスケーラブルな性能が得られることを確認し、本システムの有効性を実証した。その結果、数十台規模のクラスタシステムにおいて、高いスケーラビリティを実現した。
  • 日本学術振興会:科学研究費助成事業
    Date (from‐to) : 2004 -2004 
    Author : 清水 謙多郎; 中村 周吾; 寺田 透
     
    本研究では、(1)ホモロジーモデリングとフラグメントアセンブリ方式によるアビニシオ法を統合して、従来のホモロジーモデリングの問題の解決を図り、主鎖骨格レベルでの予測精度の向上を図るとともに、(2)精度の高い物理ポテンシャルと効率的な構造探索手法を用いた分子動力学計算に基づくアビニシオ法により、高精度のモデリングを実現する。(1)については、例えば、構造既知のテンプレートがC末端の26残基を除いて存在する130残基のタンパク質(PDB ID:1VM0)に対して、ホモロジーモデリング(Modeller)を用いてモデリングを行った領域(LEU104よりN末寄りの部分)に加え、申請者らのアビニシオ法を用いて生成した領域(LEU104以降の部分)を加えることにより、全体としてネイティブ構造と非常に近い構造を出力することができた。(2)については、平坦なエネルギー分布を生成することによりエネルギー障壁を越えて構造空間を効率的に探索することが期待できるマルチカノニカル分子動力学法を用いた。ターゲットとして、FNIII_<10>(PDB ID:1FNA)を用い、Modellerによって得られた予測構造(ネイティブ構造とのRMSDが3.0Å)をマルチカノニカル分子動力学法で精密化することを試みている。これにより、生成した構造の68%で予測精度の向上を達成し、そのうち、ネイティブ構造とのRMSDが0.7Åの構造を得ることができた。また、立体構造が多く決定されているSH2ドメインのうち、とくにXlp SAP(PDB ID:1D4W)の構造を予測する問題を取り上げ、本件についてもネイティブ構造に非常に近い構造を得ている。高精度モデリングは、詳細な機能の解析、薬剤設計などで重要と考えられるが、多数のタンパク質に適用できる技術が確立されているわけではなく、今後、さらなる研究が必要と考えられる。
  • 日本学術振興会:科学研究費助成事業
    Date (from‐to) : 2003 -2003 
    Author : 清水 謙多郎; 中村 周吾
     
    本研究では、科学技術計算の応用に対し、物理的に分散するメモリ領域を統合し巨大な共有メモリが存在するかのように利用できるようにするとともに、メモリアクセスの効率化のために、データのレプリケーションおよびマイグレーションを自動的に行い、データー貫性について利用者が明示的な指定を含めてアプリケーションに適した方式が選択できるようなシステムを構築する。今年度の成果は以下の通りである。 1.昨年度に引き続き、広範なアプリケーションに対する適用を考え、システムとして提供すべきデータ共有の機構およびプログラミングインタフェースを検討した。例えば、集約演算を多用する分子軌道計算、局所参照性の強い分子動力学計算、共有メモリ領域に対して独立したメモリアクセスが行われる傾向にあるMRCI法など、アプリケーションプログラムの特性は様々であり、それらに適応できるファイル共有、メモリ共有の機構を検討した。 2.動的なプロセスの生成およびそれに適応したデータ領域の割当て、データ共有を支援するための同期機構、データ一貫性制御の機構を実現し、さらにそれをもとにした集約演算、行列演算の機構を実現した。 3.資源管理システムの開発に着手した。動的なデータのレプリケーションおよびマイグレーションの機構を開発するとともに、それらの自動化の方針について検討した。 4.地理的に分散する計算資源および情報資源の活用法、Globusとの統合的な利用、システムの拡張性などについて検討した。
  • 日本学術振興会:科学研究費助成事業
    Date (from‐to) : 2003 -2003 
    Author : 清水 謙多郎; 寺田 透; 中村 周吾
     
    今年度は、フラグメントアセンブリ方式によるab initio法の予測精度の改善と、ホモロジーモデリングとの統合化を行った。 1.予測構造を評価する統計ポテンシャルについて、今年度新たに、二次構造パッキングのポテンシャルを導入することにより、βシートの予測精度を大幅に向上させることができた。類似配列をもたない。25個のタンパク質(残基数40〜135、α:7個,β:6個,α/β:12個)のうち、ネイティブ構造とのRMSDが6.5Å未満のものは14個であった。 2.構造クラスタリング手法については、URMSを距離指標に用いることにより、従来のRMSDを距離指標とするクラスタリングに対して、25個のタンパク質のうち20個のタンパク質で、より精度の高い予測構造を得ることができた。 3.構造既知のタンパク質をより有効に生かすために、フラグメントアセンブリ方式において、部分的な構造をあてはめるフラグメントの長さを可変にすることにより、フラグメントに合致するよい構造があれば、できるだけ広い部分をテンプレートとして利用できるようにした。フラグメントの長さを5残基から始めてスコアが最大になるように増加させていく手法は、従来の9残基固定のフラグメント長の方式に比べて、精度の高い予測を行うことできること、構造が既知で類似のタンパク質がある場合は、その構造をテンプレートとして利用する手段となることを確認した。 4.構造予測システムが生成する多数のモデル構造のうち、構造が保存されている部分はネイティブの構造に近いという知見を得ており、そのことを利用して、構造が保存されている部分の構造特徴を制約条件として繰り返し予測を行う手法を開発した。この手法は、類似のタンパク質構造をテンプレートして予測する際にも利用することができる。
  • 日本学術振興会:科学研究費助成事業
    Date (from‐to) : 2002 -2002 
    Author : 清水 謙多郎; 中村 周吾
     
    本研究では、さまざまな並列・分散システムのハードウェア基盤に対し、分散する様々な計算機資源を有効に利用し、利用者がハードウェア基盤の多様性を意識しないで分散するデータの共有を効率的に行うことのできるコンピューティング環境を実現するソフトウェア(ミドルウェア)を開発する。本ソフトウェアは、(1)大域的なデータの管理を行い、データを利用者の指定やシステムの自動的な割当てによって配置する資源管理システム、(2)共有メモリに基づくプログラミングモデルを提供する並列プログラミング環境、(3)その上に実現される大域的配列(行列)操作ライブラリから構成される。本年度は、大域的な共有データ領域を実現するための機構およびプログラミングインタフェース(ライブラリ)の開発を行い、システムの骨格部分を完成させた。共有データアクセスための操作をライブラリ呼出しとして指定することにより、データの実体が存在する物理的位置やレプリケーション、入出力転送方式、ファイルシステムの構成などを利用者が意識することなく、データのアクセスおよび共有が行えるようにした。具体的には、広範なアプリケーションに対する適用を考え、システムとして提供すべきデータ共有の機構およびプログラミングインタフェースを検討した。また、データ共有を支援するための同期機構、データ一貫性制御の機構を実現し、さらにそれをもとにした集約演算、行列演算の機構を実現した。さらに、ディスク装置(ファイル)レベルの大域なデータ管理を実現し、効率的なデータアクセスを実現するための並列入出力の機構を開発した。開発したシステムを、遺伝子クラスタリング、配列のマルチプルアラインメント、分子動力学計算など、生命情報科学の具体的なアプリケーションに対して適用し、高速化に対するアプリケーションレベルからの検討を行った。
  • 日本学術振興会:科学研究費助成事業
    Date (from‐to) : 2002 -2002 
    Author : 清水 謙多郎; 中村 周吾
     
    本研究では、昨年度に引き続き、構造データベースから抽出した局所構造情報に基づく、構造既知のタンパク質とホモロジーがない場合にも適用可能なab initio構造予測の手法およびシステムを開発する。本年度は、予測精度のさらなる向上を目指し、全体構造を評価する統計ポテンシャルの検討を行うとともに、得られた全体構造に対してクラスタリングを適用して予測構造を絞り込む手法を開発した。その結果、数十残基程度の小さなタンパク質で、ネイティブ構造とのRMSDが数Åの精度の良い予測結果を得ることができた。手法の改良については、部分配列がとり得る局所構造の効果的な抽出が予測精度の向上に不可欠であるとの判断により、各部分配列と類似性の高い配列の中心の残基がとる主鎖二面角の分布を構造データベース(PDB)の情報をもとに解析し、より高い確率でネイティブ構造の二面角付近をサンプリングできるような二面角の確率分布の生成を行った。類似性の尺度として、アミノ酸どうしの配列類似度と二次構造の類似度の両方を考慮する方式を開発した。配列類似度には、BLOSUMとHSSPによるマルチプルアライメントを組み合わせた指標を使用し、二次構造の類似度については、PHIPREDによる予測結果との比較結果を用いた。その結果、配列類似度と二次構造の類似度を同程度に考慮した方式がネイティブに近い構造を抽出できるが、その両者の最適な重み付けは、タンパク質によってかなり違いがあるという結論を得た。全体構造の評価については、残基間距離、ある残基の周囲に存在する残基数、回転半径など、昨年度までに取り入れた統計ポテンシャルに加えて、二次構造パッキングのポテンシャルを導入することにより、βシートの予測精度を大幅に向上させることができた。
  • 日本学術振興会:科学研究費助成事業
    Date (from‐to) : 2001 -2002 
    Author : 中村 周吾
     
    平成14年度は、前年度までに性能を向上させたエネルギー・1次・2次微分の並列計算システムを用いて、GlnRSとの結合定数が野生型の30倍であるGln-tRNAアプタマーと野生型Gln-tRNAのダイナミクス解析を行った。またこれまでの二面角系基準振動モード解析計算に加えて、並列分子動力学計算により、アプタマーと野生型それぞれのフリー状態および複合体形成状態のダイナミクスを解析した。Gln-tRNA分子では、フリー状態でループの内側でスタックしていると思われるアンチコドンループの塩基が複合体構造中ではループの外に出ているので、フリー状態の立体構造がX線結晶解析により得られているPhe-tRNAのアンチコドンループを参照構造として、Gln-tRNAのアプタマーおよび野生型のフリー状態の立体構造をモデリングした。これらの構造およびGlnRSとの複合体構造に対して水分子を陽に含んだ系において並列分子動力学計算を行い、得られたトラジェクトリを主成分解析によって解析した。これにより、基準振動モード解析で得られていた大きな低周波運動が分子動力学計算でも見られることを確認し、さらにアプタマーと野生型においてフリー状態のダイナミクスと複合体形成に伴う構造変化の関係・相違を解析することができた。さらにElastic Network Modelによるダイナミクス解析システムを開発し、これまでのシステムに加えて大規模なtRNA-ARS複合体のダイナミクスを簡便に見積もることができるようになった。これらのシステムを統合的に用いて、Gln系以外の数個のtRNA-ARS複合体について、フリー状態と複合体形成状態のダイナミクスの相違を解析するための初期の結果を得た。また、これまでの成果であるGln系のtRNA-ARS複合体の二面角系基準振動モード解析結果をまとめた論文が、Chemical Physics Letter誌で印刷中である。
  • 日本学術振興会:科学研究費助成事業
    Date (from‐to) : 2001 -2001 
    Author : 清水 謙多郎; 中村 周吾
     
    本研究の目的は、さまざまな並列・分散システムのハードウェア基盤に対し、分散するメモリ資源を有効に利用し、利用者がハードウェア基盤の多様性を意識しないで分散するデータの共有を効率的に行うことのできるコンピューティング環境を開発することにある。本年度は、その基礎となる分散共有配列の機構を開発した。これは、ネットワ-クにまたがる巨大な配列を仮想的に構築し、分散するデータを統一的かつ効率的に共有し操作することができるようにするというものである。科学技術計算では、巨大な配列を扱うアプリケーションは非常に多く、本年度は、とくに遺伝子クラスタリング、分子動力学法、配列のマルチプルアラインメントの3つのアプリケーションに対して、開発した分散共有配列の機構を適用した。1台の計算機のメモリには格納しきれない巨大なデータを、本システムを用いることにより初めて扱うことができるようになることを実際に示した。システムの開発については、本年度は骨格となる部分を完成させ、大域的なメモリ共有を実現するための操作インタフェースおよびメモリ資源の分散配置、位置づけの機構を実現した。また、データの転送の単位を明示する機構、データの転送と計算のオーバラップ処理を可能にする、同期オブジェクトによるデータ非同期読出し/書込み機構により、プログラミングを容易化し、効率を向上させることができることを示した。本システムは、クラスタ型並列計算機上に実装し、その上に上記のアプリケーションを実現した。従来のMPIによって記述されたプログラムも変更することなく、本システムの上で動作させることができることを確認した。
  • 日本学術振興会:科学研究費助成事業
    Date (from‐to) : 2001 -2001 
    Author : 清水 謙多郎; 中村 周吾
     
    本研究の目的は、構造既知のタンパク質とホモロジーがない場合にもて起用できるab initio立体構造予測手法を開発することにある。本手法の概要は以下の通りである。まず、構造未知のアミノ酸配列(ターゲットのアミノ酸配列)に対して、連続9残基の部分配列に区切り、その部分配列がとり得る局所構造をそれぞれに当てはめ、全体構造を構築する。部分配列および局所構造はオーバラップして組み合わせることで、多様な構造を候補として選び出す。次に、選び出した多数の構造群に対して、全体構造の「タンパク質らしさ」を表現する統計ポテンシャルを計算し、その最小化を行って予測構造を求める。 本年度は、部分配列がとり得る局所構造を効果的に抽出する手法として、配列のホモロジーと二次構造の類似性の両方を考慮した類似配列のとる局所構造を抽出する方式が効果的であることを示し、どちらの類似性をどれだけ重視するかを決める「重み」および類似と判断する「閾値」の最適な値を求めた。 また、構造データベース(PDB)の情報を網羅的に解析することより、部分配列と局所構造との関係については、本手法で切り出す部分配列の長さが9残基のとき、ネイティブな構造をもっとも高い確率で抽出できることを示した。全体構造を評価する統計ポテンシャル関数については、回転半径に関するポテンシャルがとくにサイズの大きなタンパク質で効果的であることを示した。また、二次構造分類プログラムDSSPで用いている水素結合のポテンシャルを全体構造の評価に導入することで、昨年度までは困難だったβシート構造の再現が可能になった。ただし、αヘリックス、βシートが混在する大きなタンパク質で高い予測精度を達成するまでには至っておらず、次年度は、二次構造のパッキングに関するポテンシャルを導入するなど、統計ポテンシャルのさらなる改善を図る必要がある。
  • Japan Society for the Promotion of Science:Grants-in-Aid for Scientific Research
    Date (from‐to) : 1999 -2001 
    Author : SHIMIZU Kentaro; NAKAURA Shugo
     
    We designed and implemented a new parallel programming environment called Parsley, which provides fine-grained scheduling services based on the structures of application programs. In Parsley, application programs are divided into subtasks that can run serially or in parallel. It provides a programming interface that allows a user to define subtasks and to easily specify precedence constraints among them. Parsley uses these constraints to schedule subtasks at run time. The scheduling' policy. is automatically improved to reflect the hardware environment and resource usage. The basic 'scheduling policy is an incremental scheduling algorithm based on the critical path method. In this algorithm, subtask priorities are dynamically determined by using the execution time of each subtask, as monitored by the resource management facilities of Parsley. We developed a parallel molecular dynamics (MD) simulation program on the Parsley system and' executed it on three scalable multiprocessor systems. We found that Parsley is efficient for large-scale MD simulation and that load balancing facilities of Parsley can be adopted to the scalable multiprocessor systems of different architectures. The MD simulation on Parsley is 3.5 times faster than the conventional parallel algorithm. The Parsley's automatic improvement of scheduling policies further enhances processor utilization by 35 to 55 %. In addition, Parsley is useful in the heterogeneous environment (e.g. a network of different workstations and clusters) as well as the homogeneous environment. Users need not be aware of the individual performance of the computers and networks, because of the dynamic processor allocation facilities of Parsley.
  • 日本学術振興会:科学研究費助成事業
    Date (from‐to) : 2000 -2000 
    Author : 清水 謙多郎; 中村 周吾
     
    本年度は、構造データベースから抽出したタンパク質の局所構造情報に基づく、ab initio立体構造予測手法の開発を行った。本手法では、まず、構造未知のアミノ酸配列(ターゲットのアミノ酸配列)に対して、連続10残基前後の部分配列に区切り、その部分配列がとり得る局所構造をそれぞれに当てはめ、全体構造を構築する。部分配列および局所構造はオーバラップして組み合わせることで、多様な構造を候補として選び出す。次に、選び出した多数の構造群に対して、全体構造の「タンパク質らしさ」を表現する統計ポテンシャルを計算し,その最小化を行って予測構造を求める。本手法では、部分配列がとり得る局所構造をどう選び出すかが、全体構造の探索を絞り込む上で非常に重要である。そこで、切り出した部分配列と類似性の高い配列の中心の残基がとる主鎖二面角の分布を構造データベースの情報をもとに解析し、より高い確率で正解の二面角付近をサンプリングできるような二面角の確率分布の生成を試みた。部分配列の「類似度」には、(1)ハミング距離、(2)PAM、(3)BLOSUM、(4)HSSPによるマルチプルアライメント(類似構造をとる配列群をアライメントしたもの)の4つの尺度を適用し、これらの類似度をもとに、予測構造の主鎖二面角分布を作成した。All-αのタンパク質SinIとSinRについて構造予測を行ったところ、類似度としてBLOSUMを用いたときが最も良い結果を示し、正解構造とのRMSDがそれぞれ1.6Å、4.6Åという高い精度を達成することができた。局所構造を考慮した類似度と、α、βが混在した構造に対応できるような統計ポテンシャルの検討は、今後の課題である。
  • Japan Society for the Promotion of Science:Grants-in-Aid for Scientific Research
    Date (from‐to) : 1998 -2000 
    Author : SHIMIZU Kentaro; NAKAMURA Shugo
     
    We designed and implemented a new parallel programming environment called Parsley, which provides fine-grained scheduling services based on the structures of application programs. In Parsley, application programs are divided into subtasks that can run serially or in parallel. It provides a programming interface that allows a user to define subtasks and to easily specify precedence constraints among them. Parsley uses these constraints to schedule subtasks at run time. In this research project, we developed the scheduling policy and mechanism for Parsley and applied them to parallel molecular dynamics simulation program on distributed memory multiprocessor systems. The scheduling policy is automatically improved to reflect the hardware environment and resource usage. The basic policy is an incremental scheduling algorithm based on the critical path method. In this algorithm, subtask priorities are dynamically determined by using the execution time of each subtask, as monitored by the resource management facilities of Parsley. This policy improves processor utilization by 35 to 55 % compared with the FIFO scheduling policy. In addition, Parsley is useful in the heterogeneous environment (e.g. a network of different workstations and clusters) as well as the homogeneous environment. Users need not be aware of the individual performance of the computers and networks, because of the dynamic processor allocation facilities of Parsley. We have developed several resource management policies for Parsley on heterogeneous environment and evaluated the performance for molecular dynamics simulation.
  • 日本学術振興会:科学研究費助成事業
    Date (from‐to) : 1998 -1998 
    Author : 池口 満徳; 中村 周吾; 清水 謙多郎
     
    本研究では,蛋白質の安定性・折れたたみ機構において,特に水や変性剤のもたらす溶媒効果に焦点をあて,コンピュータシミュレーションにより,その分子メカニズムを解明することを目的とした.そのために,(1)これからのスーパーコンピュータの潮流である超並列スーパーコンピュータ用の分子シミュレーションソフトウエアの開発,(2)溶媒効果,とくに,統計力学的扱いが要求される疎水効果理論の構築,(3)変性剤を導入した分子シミュレーションによる変性剤効果の解明を行った. 本研究では,通信最適化や負荷分散を効率的に行えるプログラミング環境Parsleyを開発し,それを生体高分子シミュレーション(XYZ系:MARBLE,二面角系:NORMA)に応用した.XYZ系,二面角系とも,本研究により新たな並列化方式が開発された.また,分子動力学ソフトウエアMARBLEは新たに開発したもので,長距離クーロン相互作用をカットオフなしに扱うことのできるFast Multipole Methodなど,近年の分子シミュレーションの最新技術を導入したものとなっている. 以上のシミュレーション技術を用い,疎水効果の物理的起源を検討した.疎水効果の起源では,従来,相対立する水の構造化説と排除体積効果説が提唱されていた.本研究では,以上の2つの対立する説を統合的に理解する理論を構築し,疎水効果の起源を明らかにした. さらに,以上の理論を変性剤(尿素)を導入した系に適用し,変性剤が疎水効果をどう変化させるかを解析した.疎水効果の自由エネルギーは,空孔生成項と溶質-溶媒の分散力項からなるが,尿素は,空孔生成項に対しては疎水効果を強め,分散力項では疎水効果を弱めることがわかった.全体として尿素の効果は,2つの項が微妙なバランスを持って疎水効果に影響していることがわかった.
  • 生体高分子シミュレーションの並列アルゴリズムの開発
  • 生体高分子のダイナミクス解析
  • 生体高分子の高次構造予測に関する研究
  • Development of parallel algorithm for simulation on biomolecules
  • Analysis of the dynamics of biomolecules
  • Study on Structure prediction of Biomolecules