AIによって科学を加速する試みは「AI for Science」と呼ばれ、科学の世界に大きな変化をもたらしつつあります。理研は、AI時代における科学研究の新たなインフラを構築しようと、研究分野に特化したAIを開発するプログラムを立ち上げました。この「科学研究基盤モデル開発プログラム(AGIS:Advanced General Intelligence for Science Program )」を率いるのが、泰地 真弘人 プログラムディレクターです。
タンパク質立体構造予測AIが与えたインパクト
生成AIが社会に急速に普及した背景には、「基盤モデル」という考え方がある。2021年にスタンフォード大学の研究者らが提唱したこの考え方は、大量のデータを用いてAIのベースとなる巨大なモデルを構築し、それをさまざまな用途に応用するというものだ。ChatGPTなどの生成AIが用いる「大規模言語モデル(LLM)」は基盤モデルの代表例で、大量の文章データを学習させた結果、文章生成や推論をする能力を得た。タンパク質の構造変化のシミュレーションを高速に行うことに特化したスーパーコンピュータ「MDGRAPE-4A」の開発に携わった泰地 プログラムディレクターは、タンパク質に特化したAIに注目している。
「私たちの体の重要な構成要素であるタンパク質を形づくるアミノ酸配列とその立体構造の関係を大量に学習させ、実現したのがAlphaFold2などのタンパク質の立体構造予測AIで、2024年のノーベル化学賞でも話題になリました。2022年にリリースされたMeta社のESMFoldは、タンパク質言語モデルESM-2をベースに開発されたものですが、AlphaFold2に近い性能を高速に実現することに成功し、基盤モデルの潜在力を私たちに示しました」
言葉の組み合わせによって無限の文章が生まれるように、タンパク質も20種類のアミノ酸の配列から多様な機能を実現している。人間には捉えきれない複雑な法則をAIが見つけ出し、まだ構造が解析されていないタンパク質の構造予測や新機能の設計が可能になると期待されている。
そして、タンパク質の基盤モデルで起きたことは、膨大なデータを扱う生命医科学や材料科学などの分野でも起こり得る。泰地 プログラムディレクターは、「さまざまな科学の分野で巨大な基盤モデルをつくる必要がある」と訴える。
異分野をつなぎ、イノベーションを生む
実際、世界では特定の科学データを大量に学習させた「科学研究向けAI」をつくる動きが進んでいる。日本も対応を急ぐ必要がある。「理研では、多様な分野の研究現場から毎日大量の科学データが得られ、かたやそれらのデータを扱うことができるスパコンなどの計算資源もあります。それをうまくつなぐことに日本の勝ち筋があるはずです」
AGISのロゴとともに
このロゴは、AIが原案の生成を担い、実際のロゴへの実装を人が行った。この過程もまた、AI for Scienceで目指していることを体現している。
泰地 プログラムディレクターはプロジェクトの立ち上げに動いた。そして2024年4月、分野を超えた連携を推進する「最先端研究プラットフォーム連携(TRIP)事業」の一環として、AGISがスタートした。「AGISの役割は、仮説生成やモデル化といった、科学の中心プロセスにAIを関与させ、 科学を加速することです。そのために理研の研究者をAIに振り向かせ、AI開発やAIを利用した科学研究を進めていくことが重要です」
この方針のもと、四つのプロジェクトに取り組んでいる。細胞や個体の振る舞いを予測する「生命・医科学分野」、新たな高分子などを探求する「材料・物性分野」の二つのモデル開発に加え、ロボットによる自動実験などを担う「共通基盤開発・整備」、これらを強力な処理能力のコンピュータで支える「計算基盤開拓」だ。
モデル開発には、データを生み出す「現場の研究者」と、コンピュータやAIを操る「情報の専門家」の結びつきが不可欠だ。泰地 プログラムディレクターは、実験物理学に始まり、創薬や生物学にも通じるシミュレーションなどを通じて、専用計算機の開発や機械学習にも関わってきた。その経験があるからこそ、両者をつなぐ重要性を深く理解している。
「理研の一番の特徴は、隣のラボに異なる分野の専門家がいることです。AGISではこの総合力を生かし、分野を超えた連携を推進しています」
2026年3月には最新鋭のスーパーコンピュータを導入。同年6月には、その名称を「理究(りきゅう)」と発表し、今まさにデータを生み出す現場の研究者と情報の専門家が連携を加速する土壌が整った。
- 2026年6月19日お知らせ「AI for Science開発用スーパーコンピュータの名称を「理究(りきゅう)」に決定」
AIが欲しがるデータを探れ
AIの性能を向上させるには、質の高いデータが大量に必要だ。LLMが学習する文章データは近い将来、使い尽くされるとも言われる。一方、科学のデータは今後も実験・観測・シミュレーションなどを通じて生み出され続ける。ただ、AIをより賢くするための学習に適したデータは圧倒的に不足している。
「科学者は特定の現象を解明するためにデータを集めてきました。しかし、AIが『欲しがる』データは違うかもしれません。期待通りの結果ではなかったデータも含め、網羅的に集める仕組みが重要になります」
そこでAGISが重視しているのが、ロボットによる実験の自動化と、異なる種類のデータの形式(モダリティ)を同時に取得する「マルチモーダル」なアプローチだ。例えば、細胞実験を実施し、遺伝子の働きやタンパク質がつくられる過程のデータ、顕微鏡の画像・動画データなどを同時に取得し、関連付けてAIに学ばせる。そうすることで、人間には捉えられなかった本質や隠れたつながりを発見できるようになる。
導入した研究開発用実験自動化システムの一つ
人間が原料をセットすれば、液体の分注や攪拌を自動で行い、温度や時間などを制御しながら反応を進め、さらには実験結果を解析できるデータの形にしてくれる化学実験ロボット。AIのための大量の系統的データ取得や、AIを使った全自動の新規材料探索などに活用していく。
誰もが恩恵を受けられる「オープン」な世界へ
理研がAI for Scienceに力を入れる背景には、強い使命感もある。泰地 プログラムディレクターが危惧するのは「科学のクローズド化」だ。海外の巨大IT企業が豊富な資金力を背景に科学向けAIの開発に乗り出しており、このままでは科学の重要な知見が一部の企業に独占されかねない。「科学は本来、オープンな環境での自由な議論を通じて発展してきました。この環境は今後も残ってほしいですね」
AI for Scienceは、すでに国際競争と国際連携の両面で世界の潮流として動き始めている。AIを活用した科学技術戦略として、2025年には米国で「ジェネシス・ミッション」が開始された。AGISビジョンとも多くが共通する、科学研究とAIを融合させる大規模なプロジェクトである。2026年6月には、日本政府と米国政府の間でジェネシス・ミッションでの連携を進めることが合意された。理研はその連携の中核を担うべく計画を立案中で、共同でオープンな科学基盤の構築を目指していく。一部の者がAIを独占せず、誰もが恩恵を受けられる未来へ。AGISが推し進める理研の「AI for Science」は、その実現に向けた大きな挑戦である。
関連リンク
- AGIS 科学研究基盤モデル開発プログラム
- 2026年6月5日お知らせ「AI for Scienceにおける日米戦略的パートナーシップ発表に関する五神 真 理事長メッセージ」
- 2025年7月28日お知らせ「AI for Science開発用スーパーコンピュータのシステムが決定」
- 『RIKEN NEWS』2020年7月号(研究最前線)「専用計算機が創薬の新時代を拓く」
この記事の評価を5段階でご回答ください
