クローズアップ実験法

2024年10月号 Vol.42 No.16 詳細ページ
ChIP-Atlas 3.0:世界最大のエピゲノムデータ解析インフラ
鄒 兆南,沖 真弥
374

ChIP-Atlas 3.0:
世界最大のエピゲノムデータ
解析インフラ
鄒 兆南,沖 真弥

何ができるようになった?
論文で報告されたすべての ChIP-seq,ATAC-seq,Bisulfite-seq データ(計約 40 万件)を閲覧
できる.また,それらをフル活用したオンライン解析ツールも提供されており,遺伝子の転写制御機
構を理解するためのデータマイニングができる.

必要な機器・試薬・テクニックは?
Mac,Windows,Linux などのパソコンをインターネット接続すれば,誰でも無料で利用できる.
操作のほとんどがマウスクリックで済むため,シークエンス解析のスキルも必要ない.

はじめに

最近のバージョン 3.0 では,ゲノムの三次元構造(Hi-C,

多細胞生物は細胞種によって異なる遺伝子セットを

eQTL)・疾患ゲノム(GWAS SNPs)などの機能注釈

発現している.この多様な遺伝子発現制御機構を探る

情報をさらに統合するとともに,新たな解析機能(Diff

ため ,転写因子などの DNA 結合タンパク質を解析す

Analysis)を実装した 4).

る ChIP-seq 法が広く利用され,その公開データが大
量に蓄積されてきた.情報学の知識を有しない研究者
でもこの「宝の山」を有効活用できるように,われわ

原理

れは 2015 年より論文などで報告されているすべての

前述のように,論文などで報告されたほぼすべて(約

ChIP-seq データ(約 25 万件,2024 年 7 月現在)を網

40 万件)のChIP-seq,ATAC-seq,Bisulfite-seq 実験

羅的に収集・解析したデータベース ChIP-Atlas を開発

データが NCBI SRA などの公共レポジトリに登録され

しており 1),その使い方について本誌 2019 年 10 月号に

ている.われわれはそこにアーカイブされている塩基

2)

寄稿している .その後の ChIP-Atlas はさらに進化を

配列の生データ(約 15 兆 reads)をすべてダウンロー

遂げており,バージョン 2.0 ではATAC-seq とBisulfite-

ドし,スパコンを用いてリファレンスゲノムへのマッ

seq データの追加により ,所与のゲノム領域へのタン

ピングとピークコールを行った後,解析済みデータを

パク質結合だけでなく ,オープンクロマチン情報や

ウェブサイトから公開している(図 1A)
.これら数十

3)

DNA メチル化状態も理解できるようになった .また

万件にも及ぶビッグデータをもとに,ChIP-Atlas の

ChIP-Atlas 3.0: The world s largest epigenome data infrastructure
Zhaonan Zou / Shinya Oki:Institute of Resource Development and Analysis, Kumamoto University(熊本大学生命資源研
究・支援センター)
2554

実験医学 Vol. 42 No. 16(10 月号)2024
会員でない方はこちら

羊土社会員についてはこちらをご確認ください.