クローズアップ実験法

2024年2月号 Vol.42 No.3 詳細ページ
タンパク質立体構造予測AI「富岳」版OpenFold 〜スパコンの多ノード性を活かしたハイスループット解析の実現
奥野恭史,德久淳師,大山洋介,田渕晶大
366

タンパク質立体構造予測AI 
「富岳」版OpenFold
スパコンの多ノード性を活かした
ハイスループット解析の実現
奥野恭史,德久淳師,大山洋介,田渕晶大

何ができるようになった?
CPU ベース大規模並列計算機であるスーパーコンピューター 「富岳」にタンパク質立体構造予測
AI システムである AlphaFold2(OpenFold)を実装した 1).大規模なアミノ酸配列に対し,多ノー
ド性を活かした計算を実現することで,推論においてスループット性を向上した.大規模なゲノム情
報から立体構造を高速に予測することが可能となり創薬プロセスの革新に寄与する.

必要な機器・試薬・テクニックは?
「富岳」版 OpenFold は URL(https://github.com/RIKEN-RCCS/OpenFold-for-Fugaku)
にて公開されており,CPU ベースの並列計算機上で大規模計算を実施できる.

優勝し,2022 年には,AF2 により予測した約 2 億の構

はじめに

造データベース 5)が公開された.AF2 による推定構造

これまで,アミノ酸配列からタンパク質の三次元構

には不確かさも含まれるであろうが,生体分子の全原

造を予測するために,優秀な研究者たちの弛まない努

子モデルを与える有用な構造情報の 1 つとして活用さ

力が約半世紀にわたり注がれてきた.タンパク質立体

れている.

構造予測を行う者にとって,2018 年に開かれたタンパ

本稿では,AF2 の無償プログラムである,OpenFold6)

ク質の立体構造予測の国際大会 CASP(community

をスーパーコンピューター「富岳」7)に実装することで,

wide experiment on the Critical Assessment of tech-

ゲノム解析で得られるような大規模なアミノ酸配列に

2)

niques for protein Structure Prediction) 13 の結果

対してもハイスループットにタンパク質立体構造が予

は AI の威力を垣間見る驚くべきものであった.新規の

測できる「富岳」版 OpenFold について紹介する.CPU

構造トポロジーも含む構造予測を競うTopology 部門に

ベースの大規模並列計算機上で推論を大規模に行うこ

3)

おいて,DeepMind 社 が開発したアミノ酸配列から

とを可能とする「富岳」版 OpenFold は研究者の利便

立体構造予測を行う AI,AlphaFold が,2 位以下に大

性を高めることが期待できる .ソフトウェアは U R L

差をつけ優勝したのだ.2020 年には改良版の A lp h a -

(https://github.com/RIKEN-RCCS/OpenFold-

Fold2(AF2)4)がリリースされ,CASP14 においても

for-Fugaku)にて公開している.開発の概要をお伝え

Acceleration of AlphaFold2, protein structure prediction AI, utilizing the supercomputer“Fugaku”
Yasushi Okuno 1)2)/Atsushi Tokuhisa 1)/Yosuke Oyama 3)/Akihiro Tabuchi 3):RIKEN Center for Computational Science 1)/
(理化学研究所計算科学研究セン
Graduate School of Medicine, Kyoto University 2)/Computing Laboratory, Fujitsu Limited 3)
ター 1)/ 京都大学大学院医学研究科 2)/ 富士通株式会社コンピューティング研究所 3))

実験医学 Vol. 42 No. 3(2 月号)2024

465
会員でない方はこちら

羊土社会員についてはこちらをご確認ください.