研究者総覧

中村 周吾 (ナカムラ シュウゴ)

  • 情報連携学部情報連携学科 教授
  • 情報連携学研究科情報連携学専攻 教授
  • 情報連携学学術実業連携機構 研究員
Last Updated :2024/04/23

研究者情報

学位

  • 修士(農学)(東京大学)
  • 博士(農学)(東京大学)

科研費研究者番号

  • 90272442

J-Global ID

研究キーワード

  • 生命情報科学   生物情報工学   計算機科学   information science   

研究分野

  • 情報通信 / 生命、健康、医療情報学 / 生命情報科学
  • 情報通信 / 知能情報学 / 機械学習
  • 情報通信 / 統計科学 / データサイエンス

経歴

  • 2017年04月 - 現在  東洋大学情報連携学部教授
  • 2016年04月 - 2017年03月  東京大学大学院農学生命科学研究科准教授
  • 2002年02月 - 2017年03月  Associate Professor, The Univ. of Tokyo
  • 2012年04月 - 2016年03月  東京大学大学院情報学環准教授
  • 2002年02月 - 2012年03月  東京大学大学院農学生命科学研究科准教授
  • 1995年08月 - 2002年01月  東京大学大学院農学系研究科助手
  • 1995年08月 - 2002年01月  Assitant Professor, The Univ. of Tokyo

学歴

  • 1991年04月 - 1995年07月   東京大学   大学院農学系研究科   応用生命工学専攻
  •         - 1995年   東京大学   Graduate School, Division of Agricultural Science
  • 1989年04月 - 1991年03月   東京大学   工学部   計数工学科
  •         - 1991年   東京大学   Faculty of Engineering

所属学協会

  • 日本バイオインフォマティクス学会   日本蛋白質科学会   生物物理学会   情報計算化学生物学会   人工知能学会   

研究活動情報

論文

書籍

  • 分子シミュレーションによるHCVポリメラーゼの薬剤耐性変異解析, 消化器・肝臓内科 第6巻第6号 特集 II.新規技術の肝臓病研究への応用
    中村周吾 (担当:単著範囲:)科学評論社 2019年12月
  • バイオインフォマティクスと分子動力学シミュレーション, 先端医療シリーズ49「消化器疾患の最新医療」
    内田義人; 中村周吾; 持田 智 (担当:共著範囲:)先端医療技術研究所 2018年09月
  • タンパク質立体構造予測 -de novoモデリング-, 遺伝子医学MOOK 14「次世代創薬テクノロジー 実践:インシリコ創薬の最前線」, 竹田-志鷹, 梅山編, 49-54
    メディカルドゥ 2009年
  • バイオインフォマティクス・コンピューティング, Bryan Bergeron著, 清水, 中村監訳
    オーム社 2004年
  • 分子シミュレーションの並列計算法, 化学フロンティア8「生体系のコンピュータ・シミュレーション」, 岡崎, 岡本編, 50-62
    化学同人 2002年
  • OLD AND NEW VIEWS OF PROTEIN FOLDING
    Excerpta Medica 1999年
  • Improved Diffusion Equation Method for Large Molecules
    Perspectives on Proten Engineering 1995年
  • Vibration analysis of transfer RNAs using normal mode calculation
    Computer Aided Innovation of New Materials 1993年

講演・口頭発表等

  • 機械学習法・深層学習の手法概要と生命科学分野への応用  [招待講演]
    中村周吾
    BPCNPNPPP4学会合同年会
  • 機械学習・深層学習と生命科学  [招待講演]
    中村周吾
    計算生命科学の基礎8 2021年10月 公開講演,セミナー,チュートリアル,講習,講義等
  • 機械学習・深層学習と生命科学  [招待講演]
    中村周吾
    計算生命科学の基礎VII 2020年10月 公開講演,セミナー,チュートリアル,講習,講義等
  • 肝炎研究へのバイオインフォマティクスによるアプローチ例  [招待講演]
    中村 周吾
    日本肝臓学会大会・ランチョンセミナーC 2019年05月
  • 生命科学データのデータマイニングと分子シミュレーション ~タンパク質凝集性解析とNSAIDs・トレハロース相互作用解析~  [招待講演]
    中村 周吾
    第161回日本獣医学会学術集会 2018年09月
  • アミノ酸配列からのタンパク質立体構造予測と4次構造予測  [招待講演]
    中村 周吾
    第84回日本生化学会大会 2011年09月
  • Bilab in CASP9 -モノマーおよび複合体構造予測-  [招待講演]
    中村 周吾
    IPAB公開セミナー 2011年02月
  • Bilab in CASP - de novo structure prediction, model quality assessment, and function prediction -  [招待講演]
    中村 周吾
    Asian workshop for protein structure prediction 2009年09月
  • Bilab in CASP8 -モデル品質予測とリガンド結合部位予測を中心に-  [招待講演]
    中村 周吾
    日本バイオインフォマティクス学会第9回創薬インフォマティクス研究会 2009年01月
  • Bilab in CASP7  [招待講演]
    中村 周吾
    GSICシンポジウム 2006年12月
  • Structural Propensity of Protein Fragments and Tertiary Structure Prediction of Proteins  [招待講演]
    中村 周吾
    EABS&BSJ2006 2006年11月
  • tRNAとアミノアシルtRNA合成酵素の相互作用  [招待講演]
    中村 周吾
    CCSEワークショップ 2005年01月
  • Bilab in CASP6  [招待講演]
    中村 周吾
    IPABセミナー 2005年01月
  • Recent advances in structure prediction and folding simulation of biomolecules by using computers  [招待講演]
    中村 周吾
    IBC2004 2004年12月

MISC

共同研究・競争的資金等の研究課題

  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2009年 -2011年 
    代表者 : 中村 周吾
     
    アミノ酸配列を入力とした立体構造予測法および分子動力学シミュレーションによる構造サンプリングを多数のディスオーダー領域・ディスオーダータンパク質に適用した結果、これらのアミノ酸配列は局所的には球状タンパク質のループ部とほぼ同じ程度に立体構造とりやすさの情報を内在していること、いくつかのディスオーダータンパク質については複合体形成時の相手となるタンパク質の情報がなくても、全体構造を予測できることを明らかにした。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2008年 -2010年 
    代表者 : 清水 謙多郎; 中村 周吾
     
    PDBに登録されている各タンパク質構造に対し、disorderの「程度」を評価する基準を求め、データベースとしてまとめた。また、disorder 領域と機能部位との関係について解析を行った。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2008年 -2010年 
    代表者 : 清水 謙太郎; 中村 周吾; 角越 和也
     
    タンパク質間相互作用は様々な生命現象の鍵を握る重要な反応であるが、生化学的解析や立体構造解析には複雑な手順・高額な装置・研究者の熟練等が必要であり、膨大な数の相互作用の全てをそれらの手法で解析するのは不可能である。本研究課題では、タンパク質間相互作用について、以下の4つのアプローチから予測・解析手法の開発を行う。(1)タンパク質-タンパク質間相互作用予測および相互作用ネットワーク予測、(2)タンパク質-タンパク質、リガンド、糖鎖、DNA間相互作用部位予測、(3)タンパク質-タンパク質間ドッキング予測(複合体構造予測)、(4)タンパク質-タンパク質、リガンド、糖鎖、DNA間の物理的な相互作用解析。本年度は、まず、ネットワーク構造の既知部分や他の類似のネットワークを鋳型とする(ネットワークを学習の直接的な対象とさせる)相互作用予測法を新たに開発し、前年度開発した手法と組み合わせて、相互作用ネットワーク予測システムを完成させる。開発したシステムをもとに、ゲノムワイドな予測を行い、ネットワークの特性、生物種間の違いなどを解析した。また、タンパク質-タンパク質の相互作用部位予測に加えて、タンパク質-糖鎖、タンパク質-DNA相互作用部位予測の手法を開発した。これらの相互作用部位(結合部位)の配列・構造上の特徴を調査し、機械学習SVMを用いて、これらの相互作用部位を統一に予測する手法を開発した。さらに、構造情報が利用できる場合は、予測精度を向上させるための構造特徴の抽出法についても検討を行った。タンパク質-タンパク質間ドッキング予測については、複合体構造の精密化と結合時の構造変化に対応したフレキシブルドッキングを実現している。開発したソフトウェアは、順次、ネットワーク上で公開している。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2007年 -2008年 
    代表者 : 中村 周吾
     
    本研究では、アミノ酸配列情報および構造情報の局所部分の一致の数に着目して、タンパク質間の類似度をネットワークのように定義する方法を、新たに構造未知のタンパク質に適用することで、アミノ酸配列だけからタンパク質の機能予測を行う新しい方法の開発を行った。まず、局所構造の両端のα炭素原子間の距離をその局所構造の「端間距離」と定義し、予測2次構造情報と配列プロファイル情報を入力とし、予測端間距離を出力する、サポートベクタ回帰をベースとしたツールを開発した。これを、さまざまな立体構造を含むタンパク質群に適用したところ、ループ長が短いところから長いところまで、予測端間距離と実際の端間距離がよく相関することが明らかになった。とくにループ領域については、これまでβターンなど、端間距離が短いものについては、アミノ酸配列と立体構造との関係性についてさまざまな研究がなされていたが、端間距離が長いものについては研究例が少なく、本研究によって、端間距離が長くなるようなアミノ酸配列傾向がとらえられたことは、局所配列が局所構造を制限し、結果として、タンパク質のフォールディングにおいて、立体構造全体の構造空間がかなり大きく制限されている可能性を示唆する興味深い結果である。また同様の解析を、複合体形成によってディスオーダーからオーダーへ転移することが知られているタンパク質領域に適用したところ、オーダー領域ほどではないが、ランダムよりもよい予測が可能であることが明らかとなった。この局所構造の端間距離予測ツールと、配列一致検出ツール、および2次構造予測ツールを組み合わせたタンパク質機能予測ツールを開発し、その性能を確認することができた。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2006年 -2007年 
    代表者 : 清水 謙多郎; 中村 周吾; 寺田 透; 角越 和也
     
    与えられた2つのタンパク質が相互作用するかどうかを、アミノ酸配列情報のみから機械学習サポートベクタマシン(SVM)を用いて学習・予測する手法を開発した。配列特徴としては、(1)アミノ酸の隣接ペアの出現頻度、(2)(1)の3つ組の出現頻度、(3)アミノ酸の物理化学特性に基づく分類の隣接ペアの出現頻度、(4)(3)の3つ組の出現頻度の4通りを試したところ、(2)が最も良い結果を示した。タンパク質間相互作用部位予測については、昨年度に引き続き、タンパク質のアミノ酸配列情報のみを用いて予測する手法と、タンパク質のアミノ酸配列情報と構造情報の両方を用いて予測する手法の2つを開発したが、本年度はとくに後者について、SVR(Support Vector Regression)を用いて、各残基の周辺の相互作用残基数を予測する手法を新たに開発し、従来よりも高い精度で予測できることを示した。本年度は、また、タンパク質-リガンド結合部位予測の手法を開発した。これは、タンパク質表面にメタン分子を格子状にプローブさせ、タンパク質分子とのvan der Waals相互作用エネルギーを計算するというものである。Pocket FinderやQ-site Finderなど現在広く用いられている手法より高い精度で予測でき、とくにunbound予測における予測精度の向上が大きいという結果を得た。ドッキングシミュレーションについては、新たな直交関数系を導入し、予測精度の改善を試みた。また、高精度の相互作用解析を行うため、ab initio分子動力学(MD)とマルチカノニカルMDを統合した手法を新たに開発し、相互作用部位における化学反応の動的な解析を可能にする基盤技術を開発した。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2005年 -2007年 
    代表者 : 清水 謙多郎; 中村 周吾; 寺田 透
     
    タンパク質の詳細な機能の解析、酵素、薬剤設計などの応用には、全原子レベルの精度の高い構造予測(モデリング)が重要である。本研究では、ホモロジーモデリングなど、既存の構造予測手法で得られた構造に対して、重要な部位について重点的に予測精度を向上させることが目的とする高精度タンパク質構造モデリングシステムを開発した。本研究で開発した構造モデリング手法は、(1)局所構造情報を利用した側鎖モデリング、(2)溶媒効果を取り入れたマルチカノニカル分子動力学計算による効率的かつ高精度なモデル構造の生成、(3)生成した多数の候補構造から予測構造を絞り込むための構造クラスタリング、(4)予測構造の妥当性の詳細な評価の4段階から構成される。ループ部の構造や側鎖の構造を精確に予測することができるようにするとともに、構造評価プログラムの結果をもとに、繰り返し構造の精密化を試みることを可能にした。本年度はまた、(2)の手法について、とくに以下のような結果を得た。立体構造が多く決定されているSH2ドメインの一つであるhuman p56 lck(PDB ID:1LKK)の構造をもとに、同じくSH2ドメインの、Xlp SAPの構造の予測を行った。SH2ドメインは100アミノ酸残基程度からなり燐酸化チロシンを含んだペプチドを認識する機能を持つが、ペプチドを認識するループ部分がホモログ間で大きく変化している。とくにXlp SAPは、human p56lckと比較して、ペプチド認識ループに10残基もの挿入配列があるため、既存の比較モデリングのみでは構造予測は困難である。我々は、マルチカノニカル分子動力学計算を用いて、高精度モデリングを試み、結晶構造(PDB ID:1D4W)に非常に近い構造群を得ることができた。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2005年 -2005年 
    代表者 : 清水 謙多郎; 中村 周吾; 寺田 透
     
    精度の高いタンパク質間相互作用部位予測と、ドッキングによる複合体構造予測の開発を行った。タンパク質間相互作用部位を予測については、SVMを用いた予測手法の開発を行い、とくに、学習パラメータ(コストパラメータとガウスカーネルのパラメータの2つ)を、クロスバリデーション法を利用し、AUCが最大になるよう最適化を行った。また、情報理論を用いたフィルタリングを新たに開発し、false positive予測を低減した。さらに、ウィンドウサイズと予測精度の関係を解析し、7残基のウィンドウが多くのタンパク質で最も良い精度を実現することを明らかにした。以上の工夫により、ニューラルネットワークを用いて行ったOfranらの結果より、高い予測精度を実現した。ドッキングによる複合体構造予測については、球面調和関数を用いて新規に設計した正規直交基底関数での級数展開による高速内積計算を使ったアルゴリズムを開発した。本手法のスコア関数の枠組みは非常に柔軟で、分子形状の相補性や各種ペアポテンシャル、静電相互作用などを表現することが可能である。また、本手法では、スカラー場を上記正規直交基底関数で展開することにより、スコア関数の計算に必要な内積計算を高速に行うとともに、配座空間の探索に必要な座標変換操作も高速に行えることを示した。本研究では、展開係数によるスカラー場の表現能力が、中心からの距離rの増加に従って大幅に劣化するという、従来の球面調和関数を基底関数とする方式の問題点を解決するため、rによる減衰のない、修正Legendre多項式を組み合わせた基底関数を用いた。現在、すでにいつかの複合体のデモリングを行い、例えば、1AKZ(223残基)と1UGI_A(84残基)のunbound dockingでは、従来のFTDockの手法と同程度の精度の複合体モデリングを約400倍の速度で実行することができている。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2004年 -2005年 
    代表者 : 中村 周吾
     
    dGC(GAA)GCおよびループ部の3塩基を置換したDNAミニヘアピン分子について、マルチカノニカル分子動力学法およびLocal Enhanced Sampling(LES)による網羅的な構造サンプリングを行い、核酸ヘアピン構造の安定性の配列依存性を解析した。マルチカノニカル分子動力学法では、GAAループについてアンフォールド状態からフォールド状態への遷移がみられたので、ヘアピン構造形成と崩壊の過程を詳細に解析した。その結果、12塩基から成るRNA4ループヘアピン分子について天然構造から通常の分子動力学シミュレーションによって崩壊を解析したSorinらの研究結果では、ヘアピンの形成・崩壊のパスウェイとして、zipping/unzippingとcompaction/expansionの2種類が提案されているが、dGC(GAA)GCの場合は、compactionによるヘアピンの形成であると結論付けた。また、1,2,6,7番目の塩基対を保持したうえで、ループ部に対してLESによるサンプリングを行った。対象は、安定なdGC(GNA)GC(N=A, G, T, Cの4通り)および不安定なdGC(GAG)GC, dGC(GAC)GCとし、約10nsのシミュレーションを各配列につき数回行った。その結果、安定なdGC(GNA)GCについて天然構造と類似の構造が得られた。また不安定なGACについては、一定の構造に収束しなかった。GAAのrefolding過程を詳細に解析したところ、N=A, G, T, Cによらず、5番目→3番目→4番目の順に塩基がステムの上にスタックする共通のパスウェイが観察され、塩基配列の違いによるヘアピン構造のとりやすさの違いのメカニズムの一端を明らかにすることができた。以上により、計算機シミュレーションにより核酸ヘアピン構造の安定性の配列依存性を解析する基盤を確立した。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2004年 -2005年 
    代表者 : 清水 謙多郎; 中村 周吾; 寺田 透
     
    本研究では、分散メモリ型システムを用いて巨大なメモリ領域を利用することができる、共有メモリプログラミングモデルにもとづく新しい並列プログラミング環境DSA(Distributed Shared Array)を開発する。DSAは、分散システムの上に、巨大なメモリ領域を仮想的に構築する。データの実体は、それぞれの計算機のメモリやディスクに分散して置かれるが、すべての計算機が、こうした物理的なデータの分散を意識しないで、グローバルなメモリ領域を共有できるようにすることにより、並列計算を行うプログラムの開発を容易にする。1台の計算機のメモリやディスクに格納しきれない巨大なデータも、この仮想的なメモリに置いて複数の計算機から共通に操作することができる。科学技術計算でよく用いられるベクトルや行列をこの巨大なメモリに格納して操作することにより、巨大なベクトルや行列を扱うプログラムも、分散システムの上でこれまでより簡単に開発できるようになり、しかも高速に実行できるようになる。データの実体は分散していても、利用者には、複数の計算機間で共有できるグローバルな配列が存在しているように見える。このような配列を「分散共有配列(DSA)」と呼んでいる。本研究では、DSAを、遺伝子クラスタリング、配列のマルチプルアラインメント、分子動力学計算など、生命情報科学の実際のアプリケーションに対して適用し、クラスタ型計算機上で性能評価を行い、分散するデータを効率的に操作・管理できること、MPIのプログラムと比較して、ノード数が増大してもスケーラブルな性能が得られることを確認し、本システムの有効性を実証した。その結果、数十台規模のクラスタシステムにおいて、高いスケーラビリティを実現した。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2004年 -2004年 
    代表者 : 清水 謙多郎; 中村 周吾; 寺田 透
     
    本研究では、(1)ホモロジーモデリングとフラグメントアセンブリ方式によるアビニシオ法を統合して、従来のホモロジーモデリングの問題の解決を図り、主鎖骨格レベルでの予測精度の向上を図るとともに、(2)精度の高い物理ポテンシャルと効率的な構造探索手法を用いた分子動力学計算に基づくアビニシオ法により、高精度のモデリングを実現する。(1)については、例えば、構造既知のテンプレートがC末端の26残基を除いて存在する130残基のタンパク質(PDB ID:1VM0)に対して、ホモロジーモデリング(Modeller)を用いてモデリングを行った領域(LEU104よりN末寄りの部分)に加え、申請者らのアビニシオ法を用いて生成した領域(LEU104以降の部分)を加えることにより、全体としてネイティブ構造と非常に近い構造を出力することができた。(2)については、平坦なエネルギー分布を生成することによりエネルギー障壁を越えて構造空間を効率的に探索することが期待できるマルチカノニカル分子動力学法を用いた。ターゲットとして、FNIII_<10>(PDB ID:1FNA)を用い、Modellerによって得られた予測構造(ネイティブ構造とのRMSDが3.0Å)をマルチカノニカル分子動力学法で精密化することを試みている。これにより、生成した構造の68%で予測精度の向上を達成し、そのうち、ネイティブ構造とのRMSDが0.7Åの構造を得ることができた。また、立体構造が多く決定されているSH2ドメインのうち、とくにXlp SAP(PDB ID:1D4W)の構造を予測する問題を取り上げ、本件についてもネイティブ構造に非常に近い構造を得ている。高精度モデリングは、詳細な機能の解析、薬剤設計などで重要と考えられるが、多数のタンパク質に適用できる技術が確立されているわけではなく、今後、さらなる研究が必要と考えられる。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2003年 -2003年 
    代表者 : 清水 謙多郎; 中村 周吾
     
    本研究では、科学技術計算の応用に対し、物理的に分散するメモリ領域を統合し巨大な共有メモリが存在するかのように利用できるようにするとともに、メモリアクセスの効率化のために、データのレプリケーションおよびマイグレーションを自動的に行い、データー貫性について利用者が明示的な指定を含めてアプリケーションに適した方式が選択できるようなシステムを構築する。今年度の成果は以下の通りである。 1.昨年度に引き続き、広範なアプリケーションに対する適用を考え、システムとして提供すべきデータ共有の機構およびプログラミングインタフェースを検討した。例えば、集約演算を多用する分子軌道計算、局所参照性の強い分子動力学計算、共有メモリ領域に対して独立したメモリアクセスが行われる傾向にあるMRCI法など、アプリケーションプログラムの特性は様々であり、それらに適応できるファイル共有、メモリ共有の機構を検討した。 2.動的なプロセスの生成およびそれに適応したデータ領域の割当て、データ共有を支援するための同期機構、データ一貫性制御の機構を実現し、さらにそれをもとにした集約演算、行列演算の機構を実現した。 3.資源管理システムの開発に着手した。動的なデータのレプリケーションおよびマイグレーションの機構を開発するとともに、それらの自動化の方針について検討した。 4.地理的に分散する計算資源および情報資源の活用法、Globusとの統合的な利用、システムの拡張性などについて検討した。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2003年 -2003年 
    代表者 : 清水 謙多郎; 寺田 透; 中村 周吾
     
    今年度は、フラグメントアセンブリ方式によるab initio法の予測精度の改善と、ホモロジーモデリングとの統合化を行った。 1.予測構造を評価する統計ポテンシャルについて、今年度新たに、二次構造パッキングのポテンシャルを導入することにより、βシートの予測精度を大幅に向上させることができた。類似配列をもたない。25個のタンパク質(残基数40〜135、α:7個,β:6個,α/β:12個)のうち、ネイティブ構造とのRMSDが6.5Å未満のものは14個であった。 2.構造クラスタリング手法については、URMSを距離指標に用いることにより、従来のRMSDを距離指標とするクラスタリングに対して、25個のタンパク質のうち20個のタンパク質で、より精度の高い予測構造を得ることができた。 3.構造既知のタンパク質をより有効に生かすために、フラグメントアセンブリ方式において、部分的な構造をあてはめるフラグメントの長さを可変にすることにより、フラグメントに合致するよい構造があれば、できるだけ広い部分をテンプレートとして利用できるようにした。フラグメントの長さを5残基から始めてスコアが最大になるように増加させていく手法は、従来の9残基固定のフラグメント長の方式に比べて、精度の高い予測を行うことできること、構造が既知で類似のタンパク質がある場合は、その構造をテンプレートとして利用する手段となることを確認した。 4.構造予測システムが生成する多数のモデル構造のうち、構造が保存されている部分はネイティブの構造に近いという知見を得ており、そのことを利用して、構造が保存されている部分の構造特徴を制約条件として繰り返し予測を行う手法を開発した。この手法は、類似のタンパク質構造をテンプレートして予測する際にも利用することができる。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2002年 -2002年 
    代表者 : 清水 謙多郎; 中村 周吾
     
    本研究では、さまざまな並列・分散システムのハードウェア基盤に対し、分散する様々な計算機資源を有効に利用し、利用者がハードウェア基盤の多様性を意識しないで分散するデータの共有を効率的に行うことのできるコンピューティング環境を実現するソフトウェア(ミドルウェア)を開発する。本ソフトウェアは、(1)大域的なデータの管理を行い、データを利用者の指定やシステムの自動的な割当てによって配置する資源管理システム、(2)共有メモリに基づくプログラミングモデルを提供する並列プログラミング環境、(3)その上に実現される大域的配列(行列)操作ライブラリから構成される。本年度は、大域的な共有データ領域を実現するための機構およびプログラミングインタフェース(ライブラリ)の開発を行い、システムの骨格部分を完成させた。共有データアクセスための操作をライブラリ呼出しとして指定することにより、データの実体が存在する物理的位置やレプリケーション、入出力転送方式、ファイルシステムの構成などを利用者が意識することなく、データのアクセスおよび共有が行えるようにした。具体的には、広範なアプリケーションに対する適用を考え、システムとして提供すべきデータ共有の機構およびプログラミングインタフェースを検討した。また、データ共有を支援するための同期機構、データ一貫性制御の機構を実現し、さらにそれをもとにした集約演算、行列演算の機構を実現した。さらに、ディスク装置(ファイル)レベルの大域なデータ管理を実現し、効率的なデータアクセスを実現するための並列入出力の機構を開発した。開発したシステムを、遺伝子クラスタリング、配列のマルチプルアラインメント、分子動力学計算など、生命情報科学の具体的なアプリケーションに対して適用し、高速化に対するアプリケーションレベルからの検討を行った。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2002年 -2002年 
    代表者 : 清水 謙多郎; 中村 周吾
     
    本研究では、昨年度に引き続き、構造データベースから抽出した局所構造情報に基づく、構造既知のタンパク質とホモロジーがない場合にも適用可能なab initio構造予測の手法およびシステムを開発する。本年度は、予測精度のさらなる向上を目指し、全体構造を評価する統計ポテンシャルの検討を行うとともに、得られた全体構造に対してクラスタリングを適用して予測構造を絞り込む手法を開発した。その結果、数十残基程度の小さなタンパク質で、ネイティブ構造とのRMSDが数Åの精度の良い予測結果を得ることができた。手法の改良については、部分配列がとり得る局所構造の効果的な抽出が予測精度の向上に不可欠であるとの判断により、各部分配列と類似性の高い配列の中心の残基がとる主鎖二面角の分布を構造データベース(PDB)の情報をもとに解析し、より高い確率でネイティブ構造の二面角付近をサンプリングできるような二面角の確率分布の生成を行った。類似性の尺度として、アミノ酸どうしの配列類似度と二次構造の類似度の両方を考慮する方式を開発した。配列類似度には、BLOSUMとHSSPによるマルチプルアライメントを組み合わせた指標を使用し、二次構造の類似度については、PHIPREDによる予測結果との比較結果を用いた。その結果、配列類似度と二次構造の類似度を同程度に考慮した方式がネイティブに近い構造を抽出できるが、その両者の最適な重み付けは、タンパク質によってかなり違いがあるという結論を得た。全体構造の評価については、残基間距離、ある残基の周囲に存在する残基数、回転半径など、昨年度までに取り入れた統計ポテンシャルに加えて、二次構造パッキングのポテンシャルを導入することにより、βシートの予測精度を大幅に向上させることができた。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2001年 -2002年 
    代表者 : 中村 周吾
     
    平成14年度は、前年度までに性能を向上させたエネルギー・1次・2次微分の並列計算システムを用いて、GlnRSとの結合定数が野生型の30倍であるGln-tRNAアプタマーと野生型Gln-tRNAのダイナミクス解析を行った。またこれまでの二面角系基準振動モード解析計算に加えて、並列分子動力学計算により、アプタマーと野生型それぞれのフリー状態および複合体形成状態のダイナミクスを解析した。Gln-tRNA分子では、フリー状態でループの内側でスタックしていると思われるアンチコドンループの塩基が複合体構造中ではループの外に出ているので、フリー状態の立体構造がX線結晶解析により得られているPhe-tRNAのアンチコドンループを参照構造として、Gln-tRNAのアプタマーおよび野生型のフリー状態の立体構造をモデリングした。これらの構造およびGlnRSとの複合体構造に対して水分子を陽に含んだ系において並列分子動力学計算を行い、得られたトラジェクトリを主成分解析によって解析した。これにより、基準振動モード解析で得られていた大きな低周波運動が分子動力学計算でも見られることを確認し、さらにアプタマーと野生型においてフリー状態のダイナミクスと複合体形成に伴う構造変化の関係・相違を解析することができた。さらにElastic Network Modelによるダイナミクス解析システムを開発し、これまでのシステムに加えて大規模なtRNA-ARS複合体のダイナミクスを簡便に見積もることができるようになった。これらのシステムを統合的に用いて、Gln系以外の数個のtRNA-ARS複合体について、フリー状態と複合体形成状態のダイナミクスの相違を解析するための初期の結果を得た。また、これまでの成果であるGln系のtRNA-ARS複合体の二面角系基準振動モード解析結果をまとめた論文が、Chemical Physics Letter誌で印刷中である。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2001年 -2001年 
    代表者 : 清水 謙多郎; 中村 周吾
     
    本研究の目的は、さまざまな並列・分散システムのハードウェア基盤に対し、分散するメモリ資源を有効に利用し、利用者がハードウェア基盤の多様性を意識しないで分散するデータの共有を効率的に行うことのできるコンピューティング環境を開発することにある。本年度は、その基礎となる分散共有配列の機構を開発した。これは、ネットワ-クにまたがる巨大な配列を仮想的に構築し、分散するデータを統一的かつ効率的に共有し操作することができるようにするというものである。科学技術計算では、巨大な配列を扱うアプリケーションは非常に多く、本年度は、とくに遺伝子クラスタリング、分子動力学法、配列のマルチプルアラインメントの3つのアプリケーションに対して、開発した分散共有配列の機構を適用した。1台の計算機のメモリには格納しきれない巨大なデータを、本システムを用いることにより初めて扱うことができるようになることを実際に示した。システムの開発については、本年度は骨格となる部分を完成させ、大域的なメモリ共有を実現するための操作インタフェースおよびメモリ資源の分散配置、位置づけの機構を実現した。また、データの転送の単位を明示する機構、データの転送と計算のオーバラップ処理を可能にする、同期オブジェクトによるデータ非同期読出し/書込み機構により、プログラミングを容易化し、効率を向上させることができることを示した。本システムは、クラスタ型並列計算機上に実装し、その上に上記のアプリケーションを実現した。従来のMPIによって記述されたプログラムも変更することなく、本システムの上で動作させることができることを確認した。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2001年 -2001年 
    代表者 : 清水 謙多郎; 中村 周吾
     
    本研究の目的は、構造既知のタンパク質とホモロジーがない場合にもて起用できるab initio立体構造予測手法を開発することにある。本手法の概要は以下の通りである。まず、構造未知のアミノ酸配列(ターゲットのアミノ酸配列)に対して、連続9残基の部分配列に区切り、その部分配列がとり得る局所構造をそれぞれに当てはめ、全体構造を構築する。部分配列および局所構造はオーバラップして組み合わせることで、多様な構造を候補として選び出す。次に、選び出した多数の構造群に対して、全体構造の「タンパク質らしさ」を表現する統計ポテンシャルを計算し、その最小化を行って予測構造を求める。 本年度は、部分配列がとり得る局所構造を効果的に抽出する手法として、配列のホモロジーと二次構造の類似性の両方を考慮した類似配列のとる局所構造を抽出する方式が効果的であることを示し、どちらの類似性をどれだけ重視するかを決める「重み」および類似と判断する「閾値」の最適な値を求めた。 また、構造データベース(PDB)の情報を網羅的に解析することより、部分配列と局所構造との関係については、本手法で切り出す部分配列の長さが9残基のとき、ネイティブな構造をもっとも高い確率で抽出できることを示した。全体構造を評価する統計ポテンシャル関数については、回転半径に関するポテンシャルがとくにサイズの大きなタンパク質で効果的であることを示した。また、二次構造分類プログラムDSSPで用いている水素結合のポテンシャルを全体構造の評価に導入することで、昨年度までは困難だったβシート構造の再現が可能になった。ただし、αヘリックス、βシートが混在する大きなタンパク質で高い予測精度を達成するまでには至っておらず、次年度は、二次構造のパッキングに関するポテンシャルを導入するなど、統計ポテンシャルのさらなる改善を図る必要がある。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 1999年 -2001年 
    代表者 : 清水 謙多郎; 中村 周吾; 池口 満徳
     
    本研究では、動的資源管理機能を備えた大規模並列システムのための並列プログラミング環境Parsleyを開発し、計算化学の諸問題に適用して、その有用性を実証した。Parsleyでは、アプリケーションプログラムは並列処理可能な部分問題(サプタスクと呼ぶ)に分割され、それらを単位としてプロセッサが割り当てられ実行される。サブタスク間には、実行の先行制約が依存関係として定義され、それとともにサブタスクグラフが形成される。システムはそのサブタスクグラフの内容に従ってプロセッサの割り当て(スケジューリング)を行う。サブタスクの定義は、物理的なハードウェア構成とは独立であり、また、サブタスク間の通信も実行時にプロセッサ間の通信(MPIの通信命令)に変換される。このように、基盤となるハードウェア環境およびアプリケーションに適応した並列化を実現することを目指している。分子動力学シミュレーション(MD)をParsley上に実現し、BPTI+水系(原子数16735)を対象に日立SR2201(プロセッサ数125台)上で実行したところ、Parsley上のMDで、従来の空間分割法のMDに比べて3.49倍の性能向上を達成した。また、Lysozyme+水系(原子数19754)では、日立SR2201(プロセッサ数175台)上で、3.8倍の性能向上を達成した。さらに、本研究では、タスクグラフに繰返し構造がある場合、タスクの実行の履歴をもとに、スケジューリング方式を自動改善する機構を開発した。基本的な方針は、定期的にスケジューリングを行い、その都度、遅れている処理ほど優先的にプロセッサを割り当てるとともに、タスクの実行時間に基づいて、その先のタスクグラフを再構築するというものである。分子動力学法にこの機構を適用し、クラスタ型並列計算機上で性能評価を行った結果、プロセッサ台数が16台のとき、プロセッサ使用率を55%向上させることができ、実行時間を9.6%短縮するという結果を得ることができた。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2000年 -2000年 
    代表者 : 清水 謙多郎; 中村 周吾
     
    本年度は、構造データベースから抽出したタンパク質の局所構造情報に基づく、ab initio立体構造予測手法の開発を行った。本手法では、まず、構造未知のアミノ酸配列(ターゲットのアミノ酸配列)に対して、連続10残基前後の部分配列に区切り、その部分配列がとり得る局所構造をそれぞれに当てはめ、全体構造を構築する。部分配列および局所構造はオーバラップして組み合わせることで、多様な構造を候補として選び出す。次に、選び出した多数の構造群に対して、全体構造の「タンパク質らしさ」を表現する統計ポテンシャルを計算し,その最小化を行って予測構造を求める。本手法では、部分配列がとり得る局所構造をどう選び出すかが、全体構造の探索を絞り込む上で非常に重要である。そこで、切り出した部分配列と類似性の高い配列の中心の残基がとる主鎖二面角の分布を構造データベースの情報をもとに解析し、より高い確率で正解の二面角付近をサンプリングできるような二面角の確率分布の生成を試みた。部分配列の「類似度」には、(1)ハミング距離、(2)PAM、(3)BLOSUM、(4)HSSPによるマルチプルアライメント(類似構造をとる配列群をアライメントしたもの)の4つの尺度を適用し、これらの類似度をもとに、予測構造の主鎖二面角分布を作成した。All-αのタンパク質SinIとSinRについて構造予測を行ったところ、類似度としてBLOSUMを用いたときが最も良い結果を示し、正解構造とのRMSDがそれぞれ1.6Å、4.6Åという高い精度を達成することができた。局所構造を考慮した類似度と、α、βが混在した構造に対応できるような統計ポテンシャルの検討は、今後の課題である。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 1998年 -2000年 
    代表者 : 清水 謙多郎; 中村 周吾; 池口 満徳
     
    本研究では、並列計算を基本ソフトウェアのレベルから支援するためシステムParsleyと、その上で動作する分子動力学計算の並列プログラムの開発を行った。Parsleyでは、アプリケーションプログラムは並列処理可能な部分問題(サブタスクと呼ぶ)に分割され、それらを単位としてプロセッサが割り当てられ実行される。サブタスク間には、実行の先行制約が依存関係として定義され、それとともにサブタスクグラフが形成される。システムはそのサブタスクの内容に従ってプロセッサの割り当て(スケジューリング)を行う。サブタスクの定義は、物理的なハードウェア構成とは独立であり、また、サブタスク間の通信も実行時にプロセッサ間の通信(MPIの通信命令)に変換される。分子動力学計算のプログラムを、Parsleyを用いて実現し、日立SR2201(プロセッサ数125台)上で実行して、従来の空間分割法と実行時間を比較したところ、空間分割法に比べて3.8倍の高速化を達成した。また、COMPAQ DS20クラスタ(プロセッサ数16台)では、10倍以上の高速化を達成した。このような性能を得るのに、プログラムの変更は、まったく必要とせず、Parsleyの動的なスケジューリング機能が、ハードウェア環境に十分適応できることを示すことができた。さらに、上記の計算機やワークステーションから構成される異種分散環境においても、プログラムの変更なしに、プロセッサを有効に利用し、高い性能が得ることができることを示した。本研究では、タスク間の依存関係に繰り返し構造がある場合、過去の実行履歴をもとにタスクの優先度を自動的に調整する、新しい機構を開発した。この機構により、プロセッサの利用率を通常の動的なプロセッサ割当てに比べて、35〜55%向上させることができた。本研究で開発したシステムのソースプログラムは一般に公開している。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 1998年 -1998年 
    代表者 : 池口 満徳; 中村 周吾; 清水 謙多郎
     
    本研究では,蛋白質の安定性・折れたたみ機構において,特に水や変性剤のもたらす溶媒効果に焦点をあて,コンピュータシミュレーションにより,その分子メカニズムを解明することを目的とした.そのために,(1)これからのスーパーコンピュータの潮流である超並列スーパーコンピュータ用の分子シミュレーションソフトウエアの開発,(2)溶媒効果,とくに,統計力学的扱いが要求される疎水効果理論の構築,(3)変性剤を導入した分子シミュレーションによる変性剤効果の解明を行った. 本研究では,通信最適化や負荷分散を効率的に行えるプログラミング環境Parsleyを開発し,それを生体高分子シミュレーション(XYZ系:MARBLE,二面角系:NORMA)に応用した.XYZ系,二面角系とも,本研究により新たな並列化方式が開発された.また,分子動力学ソフトウエアMARBLEは新たに開発したもので,長距離クーロン相互作用をカットオフなしに扱うことのできるFast Multipole Methodなど,近年の分子シミュレーションの最新技術を導入したものとなっている. 以上のシミュレーション技術を用い,疎水効果の物理的起源を検討した.疎水効果の起源では,従来,相対立する水の構造化説と排除体積効果説が提唱されていた.本研究では,以上の2つの対立する説を統合的に理解する理論を構築し,疎水効果の起源を明らかにした. さらに,以上の理論を変性剤(尿素)を導入した系に適用し,変性剤が疎水効果をどう変化させるかを解析した.疎水効果の自由エネルギーは,空孔生成項と溶質-溶媒の分散力項からなるが,尿素は,空孔生成項に対しては疎水効果を強め,分散力項では疎水効果を弱めることがわかった.全体として尿素の効果は,2つの項が微妙なバランスを持って疎水効果に影響していることがわかった.
  • 生体高分子シミュレーションの並列アルゴリズムの開発
  • 生体高分子のダイナミクス解析
  • 生体高分子の高次構造予測に関する研究
  • Development of parallel algorithm for simulation on biomolecules
  • Analysis of the dynamics of biomolecules
  • Study on Structure prediction of Biomolecules

その他のリンク

researchmap