OpenAI、生命科学分野に進出:山中由子の最適化でタンパク質設計の新境地へ
2025-01-19
著者: 陽斗
OpenAIは生命科学分野への本格参入を開始しました。同社は長寿研究のスタートアップRetro Biosciencesと協力し、タンパク質設計に特化した言語モデル「GPT-4b micro」を開発しました。この初期テストでは、人間の研究者を上回る成果が得られています。
この新しい言語モデルGPT-4b microは、通常の細胞を強靭な細胞に変換できる山中由子と呼ばれるタンパク質の最適化において、重要なポイントを提供しています。このアプローチは、Googleのノーベル賞受賞者のAlphaFoldと一線を画しています。AlphaFoldはタンパク質の折りたたみ構造を予測する堅牢なネットワークを使用していますが、GPT-4b microは言語モデルを用いてタンパク質設計を行う点が大きな特徴です。
モデルの学習方法も独特で、OpenAIの研究者であるジョン・ホールマン氏によれば、GPT-4b microは様々な生物種のタンパク質配列データとタンパク質間相互作用の情報を教師データとして使用しています。これはまるでChatGPTが文章を完成させるように、タンパク質設計の新しいアイデアを提案する働きも果たしています。研究チームは、この手法によって、既存の山中由子と比較して最大50倍の成功率改善が達成されたと報告しています。
注目すべきは、このモデルが採用する山中由子の特性です。Retro BiosciencesのCEO、ジョー・ベッツ=ラクロワ氏によると、このタンパク質は「柔軟で非固定的」な性質を持ち、従来の構造予測モデルでは成功が難しいため、GPT-4b microがその問題を克服していることが期待されています。このモデルは元のタンパク質配列の3分の1のアミノ酸を変更するような大掛かりな提案も行い、実際の実験室での進化工学的手法で到達できなかった可能性のある設計空間の探求を行っています。
しかし、このモデルの動作メカニズムについては、開発チーム自身もまだ完全には理解していない状態です。ベッツ=ラクロワ氏は、これをChessのAIプログラムAlphaGoの初期段階に例え、「なぜそのような結果になるのかを理解するためには時間がかかるだろう」と述べています。
Retro Biosciencesは、人間の寿命を10年延ばすことを目的とした研究を進めており、その目標達成に向けて山中由子を使用した新たなアプローチを重視しています。山中由子は通常の細胞を強靭な細胞に変える特殊な能力を持ち、この特性を活かした研究が進行中です。加えて、モデルは既存の山中由子を大幅に改良し、その効果を最大50倍まで向上させることに成功したと報告されています。
現在、タンパク質リプログラミング技術には大きな課題が存在します。処理には数週間を要し、成功率はわずか1%未満です。ハーバード大学の老化研究者ヴァディム・グラディシェフ氏によれば、「皮膚細胞の初期化は比較的容易ですが、他の種の細胞ではそうはいかない」と指摘しています。この新しいモデルは、この状況を劇的に改善する可能性を秘めています。
GPT-4b microを通じたタンパク質設計の最適化は、他の生物種への応用も期待されています。モデルは、既存の山中由子の効果を最大化することを目指しており、特に新しい生物学的システムへの応用時に大きな効果を発揮する見込みです。
この研究はオープンサイエンスの精神にも合致しており、OpenAIとRetro Biosciencesは、研究成果を迅速に公表することに注力しています。これにより、地球上の生物全般に利益をもたらすことが期待されています。