概論
異分野融合とデータ活用で感染症制御に挑む
Challenging to control infectious diseases with interdisciplinary approach
and data utilization
川上英良,岩見真吾
Eiryo Kawakami 1)2)/Shingo Iwami 3):Medical Data
Mathematical Reasoning Team, Advanced Data Science Project(ADSP),RIKEN
Information R&D and Strategy Headquarters 1)/Department of
Artificial Intelligence Medicine, Graduate School of Medicine, Chiba
University 2)/interdisciplinary Biology
Laboratory(iBLab),Division of Natural Science, Graduate School of
Science, Nagoya
University 3)〔理化学研究所情報統合本部先端データサイエンスプロジェクト医療データ数理推論チーム 1)/千葉大学大学院医学研究院人工知能(AI)医学 2)/名古屋大学大学院理学研究科理学専攻生命理学領域異分野融合生物学研究室3)〕
COVID-19のパンデミックはさまざまな医療,社会の課題を浮き彫りにした.感染症に起因する医療,社会の問題に対して,数多くの研究プロジェクトが立ち上がり,従来の研究領域の枠を超えた研究開発が急速に進みつつある.本特集では,感染症の最先端の研究事例を「異分野融合」と「データ活用」をキーワードとして紹介し,パンデミックの制圧とレジリエントな医療,社会基盤の構築に向けた展開を議論したい.
はじめに
人類の歴史は感染症とともにあり,はしか,黒死病,天然痘,スペイン風邪といったさまざまな感染症と闘い,数多くの犠牲者を出しながら乗り越えてきた.近代に入って,ワクチンや抗生物質といった予防・治療法の進歩が著しく,1980年には世界保健機関(WHO)により天然痘の根絶宣言が出されるなど,人類は感染症を克服したかに思えた.しかし,その後もエボラ出血熱やエイズ,重症急性呼吸器症候群といった新興感染症の流行がしばしば発生し,感染症は世界の死因の上位に入り続けている1).また,2019年12月に発生した重症急性呼吸器症候群コロナウイルス-2(SARS-CoV-2)による呼吸器感染症COVID-19は,世界的大流行(パンデミック)へと発展し,2022年5月時点で5億人以上の感染者と600万人以上の死者を出してなお2),沈静化の目処が立っていない.加えて,2022年には,原因不明の小児急性肝炎やサル痘なども流行の兆しを見せている.
1感染症制御の難しさ
COVID-19のパンデミックは感染症に対するさまざまな医療,社会の課題と脆弱性を浮き彫りにした.医療面においては,ワクチンや治療薬の国内での開発が,研究開発投資の不足や,研究者の層の薄さ,分野間連携の不足などの要因により大きく遅れている.感染症は他の疾患と異なり,流行時以外は検体や情報がほとんど得られず,基礎研究やワクチン,治療薬開発が進みにくい.また,感染症を引き起こす病原体の多様性と宿主との複雑な相互作用も,ワクチン,治療薬開発を困難にしている要因である.ヒトの病原体(ウイルス,細菌,真菌,原虫,蠕虫など)は約1,400種が知られており3),その数は増え続けている.病原体が感染する細胞や臓器には一定の特異性があるものの4),サイトカインなどを通じてさまざまな臓器障害を引き起こす5).したがって,流行が起こってから,特定の病原体や症状に対してワクチンや治療薬の開発を開始するのでは,流行の拡大に追いつかない.社会面においても,PCR検査やワクチン接種の体制整備,感染の急激な拡大に対応した医療資源の確保,などが課題となっている.感染症への対応として,罹った人を治療するだけでなく,社会全体として感染者数と死亡者数を最小化し,感染制御と社会活動・経済維持のバランスをとるという考え方が重要になる.
2感染症研究における異分野融合とデータ活用
感染症に対する医療,社会の課題に対して,文部科学省は2021年度に2つの戦略目標・研究開発目標を発表している.戦略的創造研究推進事業(JST)の戦略目標「『総合知』で築くポストコロナ社会の技術基盤」においては,パンデミックなどによる変化に対応する社会基盤を構築するに当たって,異分野融合研究とデータ活用の重要性が指摘されている6).また,革新的先端研究開発支援事業(AMED)の研究開発目標「感染症創薬科学の新潮流」においても,ワクチンや治療薬開発における日本の大幅な遅れをとり戻し,創薬研究を加速するために,感染症学や微生物学に限定されないさまざまな分野の若手研究者の参画と国内外の産学連携を通じた異分野融合研究が重要であると論じている7).感染症が引き起こすさまざまな健康被害,社会課題に対処するためには,病原体や病状・病態のみを対象とした研究だけでは不十分であり,分野を越えた知を結集し,研究手法やリソースを有効利用することが求められている.
本特集では,感染症研究におけるデータ科学と異分野連携に焦点を当て,先端的な研究事例を紹介する.近年,次世代シークエンサー(NGS)の普及を背景として,さまざまな生物種の遺伝子配列が網羅的に得られるようになってきた.感染症研究においても,ウイルスや細菌の遺伝子配列が世界中で解析され,公共データベース上で公開されている.伊東の稿では,公共シークエンスデータに基づいて,ウイルスの流行ダイナミクスや進化に迫る研究を紹介する.感染症の重症度や臨床経過の違いに宿主であるヒトの遺伝的背景の違いも影響していることが報告されている.南宮・岡田の稿では大規模なゲノムワイド関連解析(GWAS)による感染症感受性遺伝子の同定について研究グループ「コロナ制圧タスクフォース」の最新の研究成果を紹介する.遺伝子配列データに加えて,感染症の臨床情報の収集と共有も進んでいる.変異株の出現やワクチン接種などによって刻々と変化する感染症の臨床像を把握し,適切な公衆衛生対策,治療選択,治療薬開発につなげるためには,感染症発生初期からすみやかに臨床情報を収集し,取りまとめることが重要となる.大曲の稿では,日本において臨床情報の迅速な収集と共有を目的に立ち上げられたCOVID-19 REGISTRY JAPAN(COVIREGI-JP)を紹介し,臨床情報収集の課題と発展の方向性を議論する.データベースに蓄積されるデータ以外にも,インターネットやスマートデバイスの普及によって,SNSや検索ログといった情報空間から得られるデータを分析することで感染症流行を予測したり,人々の行動パターンを把握したりする研究が着目されている.石川の稿では,情報疫学またはインフォベイランスとよばれる研究手法と感染症データへの適用事例を紹介する.集積した感染症データの分析方法として,従来の統計的な手法に加えて,病原体の増殖サイクルの数理モデルを用いた定量的データ分析手法が用いられるようになっている.病原体や宿主応答に関する知見を集約した数理モデルを用いることで,データから情報を効率的に引き出し,解釈することができる.数理モデルの疫学研究および罹患者隔離ガイドライン設計への応用を江島の稿で,感染症治療薬の評価と臨床試験設計への応用を岩波の稿で紹介する.最後に田中・松本・奥野の稿では,感染症創薬における人工知能(AI)やシミュレーション技術の活用をとり上げる.感染症に対する薬剤開発は,流行に対応して基礎から応用・臨床までのプロセスを迅速に進める必要があるのに加えて,変異株への出現にも対応しなければならない.AIやシミュレーション技術を用いた治療薬開発の迅速化を,新型コロナウイルスの治療薬開発を例に紹介する.
3感染症研究のさらなる発展に向けて
本特集でとり上げた事例以外にも,幅広い分野の研究者が感染症研究に参入している.戦略目標「『総合知』で築くポストコロナ社会の技術基盤」のもとに発足した戦略的創造研究推進事業(CREST)「異分野融合による新型コロナウイルスをはじめとした感染症との共生に資する技術基盤の創出」8)では,高感度ウイルス検出・除去技術,自動検査システム,飛沫感染リスク評価システムといった先端的な工学技術に基づく研究開発が行われている.パンデミックによる医療資源の逼迫によって,在宅療養を余儀なくされるケースも出てきており,日常的な健康状態のセルフモニタリングの必要性が高まっていることも,これらの研究開発の原動力となっている.
また,COVID-19を含む急性感染症では,重症化してしまうと全身性の炎症応答,血栓症などにより治療が困難になることが多いため,重篤な変化の予兆を早期検知して制御することがきわめて重要になる.このような疾患の早期予測の例としては,深層学習を用いた70万人分の臨床時系列データに基づく急性腎障害の事前予測が有名である9).ただし,深層学習には膨大な学習データが必要となるため,感染症流行の初期には適用が困難であるという課題もある.近年,疾患の発症や重症化といった,急激で不可逆な変化を予測するフレームワークとして近年着目されているのが動的ネットワークバイオマーカー(dynamic network biomarker:DNB)理論である.DNBは,複数のバイオマーカーや検査項目の相互関係をネットワークとして表現し,ネットワークの異常な応答を検出する手法であり,インフルエンザウイルス感染の重症化を少数症例のデータに基づいて予測できることが示されている10).発症や重症化の事前予測と先制的介入は,今後の感染症研究の重要な方向性となるだろう.
今後注目されるアプローチの1つに,数理モデル駆動型とデータ駆動型の融合もあげられる.例えば,深層学習では直接生データを用いた分析よりも,生データから特徴量を加工・抽出した分析(特徴量工学)の方が高精度になることが一般的に知られている.数理モデルは時系列データと相性がよいことより,コンピューターシミュレーションと併せることで生物学的に意味のある特徴量の抽出が容易になる.特徴量を深層学習に使えば,少数のデータによる学習の効率化が期待できる.
おわりに
このように,COVID-19のパンデミックを契機として,感染症研究においてもデータ科学の導入と異分野連携が急速に進みつつある.他分野から,新たな発想や研究手法が導入されることで,感染症研究が発展し,パンデミックの制圧と新たな感染症に対してレジリエントな医療,社会基盤の構築につながることを期待したい.
文献
- 「The top 10 causes of death」
- 「WHO Coronavirus(COVID-19)Dashboard」
- Microbiology by numbers. Nat Rev Microbiol, 9:628, doi:10.1038/nrmicro2644(2011)
- McCall LI, et al:PLoS Pathog, 12:e1005519, doi:10.1371/journal.ppat.1005519(2016)
- Fajgenbaum DC & June CH:N Engl J Med, 383:2255-2273, doi:10.1056/NEJMra2026131(2020)
- 「『総合知』で築くポストコロナ社会の技術基盤【JST】」
- 「感染症創薬科学の新潮流【AMED】」
- 「[コロナ基盤] 2020年度採択課題」
- Tomašev N, et al:Nature, 572:116-119, doi:10.1038/s41586-019-1390-1(2019)
- Liu X, et al:Natl Sci Rev, 6:775-785, doi:10.1093/nsr/nwy162(2019)
本記事のDOI:10.18958/7061-00001-0000199-00
著者プロフィール
川上英良:2007年,東京大学医学部医学科卒業後,初期研修を経ず大学院進学.’11年,東京大学大学院医学系研究科(河岡義裕研究室)にて博士(医学)を取得.’13年より理化学研究所北野宏明ラボにてシステム生物学の研究に従事し,’19年より現職.臨床・基礎医学の課題に対しシステム生物学と機械学習を駆使した研究を展開するデータ駆動型医学研究の第一人者.科学技術・学術政策研究所『ナイスステップな研究者2019』選定.
岩見真吾:2005年,大阪府立大学工学部数理工学科卒業,’07年,同大学院工学研究科電子・数物系専攻博士前期課程修了.その後,静岡大学創造科学技術大学院自然科学系教育部環境・エネルギーシステム専攻に編入し,1年間短縮して’09年博士(理学)を取得.’09年以降,日本学術振興会・特別研究員PD,科学技術振興機構さきがけ研究者を経て,’11年九州大学理学研究院生物科学部門准教授に着任.’15年には仏国のINSERMにVisiting Professorとして滞在.’20年より現職,名古屋大学大学院理学研究科理学専攻生命理学領域教授.数理モデルとコンピュータシミュレーションを駆使し,異分野にまたがる生物学研究を進めている.