製薬業界の研究開発
Dotmatics を活用した
AI 対応データ基盤の構築
製薬業界の研究開発
Dotmatics を活用した
AI 対応データ基盤の構築
技術や実験機器の進歩により、研究者はこれまでにない規模でデータ を収集・処理できるようになった。
例えば、医薬品の開発やテストにおいて、各段階で新
薬の候補それぞれがテラバイト規模のデータを生成す る。 これらの膨大なデータセットは通常、意味のあ るインサイトを導き出すためにはそれぞれ独自の高度 な分析手法や計算ツールを必要としており、複数の技
術を活用して収集される。
この「ビッグデータ」は大きな可能性を秘めている
方で、数多くの課題も抱えている。研究者はデータを 簡単に収集し、その品質を信頼できる必要がある。ま
た、最終的にそのデータを活用し、インサイトを得て イノベーションを推進するためには、データを安全に 保存・共有する方法が必要である。
製薬 R&D において、研究者はますます人工知能 (AI)や機械学習(ML)を活用して膨大なデータ セットを解析しようとしている。実際、大手製薬会社 の経営幹部の3割以上が AI 技術を活用していると報 告している。 AI/ML 技術は膨大なデータポイントを 迅速に処理し、データ内に隠されたパターンやインサ イトを照らし出す強力な懐中電灯のように機能し、研 究者がこれまで見えなかったものを発見し理解するこ とを可能にする。
予測型および処方型の AI 技術には、学習データに依 存するという注意点がある。データは大量である上 に、信頼性があり、機械が利用できる状態である必要 がある。多くの企業にとって、データの問題が AI 導 入の成功を妨げている。そのため、大規模なデータ収 集と AI モデル改良のサポートができるインフラを導 入することが、AI 主導の R&D を進める最初のステッ プである。これは企業が従来とは異なる方法でデータ を管理する必要があることを意味し、これが多くの場 合、大きな障害となる。
多様なチーム、特に異なる技術や異質なデータを扱う チーム全体で、高品質で適切にラベル付けされた AI 対応データを収集・管理するためには、拡張性があ り、柔軟で、オープンな R&D データプラットフォーム が必要となる。
本書では、製薬業界における最近の AI トレンドを検 討し、企業が自社の R&D データを AI 対応にするため の最適な準備方法を探る。
製薬業界は、より良い治療法、迅速な開発、コスト削減など、大きな希 望を持って AI に賭けている。それぞれを詳しく見ていこう。
より良い治療法
企業は AI を活用して生物学や化学の手法を改善し、 成功率を高め、より安価で迅速な発見プロセスを実現 している。AI を活用することで、研究者はこれまで にない速度で数十億のデータポイントを処理し、 データ間の新しい関連性や隠れたパターンを発見する ための高度なアルゴリズムを利用できる。例えば、初 期の発見段階では、研究者が AI を活用して新しい化 合物やターゲットをより迅速に特定し優先順位を付け ること、薬の有効性や副作用の予測、既存の治療法に 新たな用途を見つけることなどができる。後の開発段 階では、AI を用いて、開発中の治療法を支えるため に必要な膨大な文書やデータの管理、また、個別化 医療のための患者と治療の適合性の評価が行われるこ とが考えられる。
迅速な開発
AI は R&D プロセスを改善し、加速させることがで きる。MIT Technology Review によると、「新薬を ゼロから開発する際の基本的なステップはあまり変 わっていない」という。例えば、低分子医薬品の設計 において、研究者は依然としてターゲットの特定と検 証、リードの発見と最適化、薬の開発などのステッ プを進めなければならない。AI はこれらのステップ を排除するのではなく、非効率性を改善し、研究者 が長年使用してきた計算ツールよりもさらに効率を向 上させることができる。MIT のレビューによれば、AI 開発者は、創薬ワークフローにおける三つの主要な 失敗ポイント、すなわちターゲット選定、化合物設 計、そして患者別プロファイリングに焦点を当ててい る。3
膨大な量の薬剤や分子データを活用して複雑な AI モ
デルを構築することで、研究者は初期発見段階の作業 を実験室からコンピュータに移し、成功の可能性が最 も高い候補にを絞り込むことができる。ある推定によ れば、AI を活用することで、通常4~5年かかる探索 研究フェーズを1年未満に短縮できるという。55-6
市場投入までの薬の統計
従来パラダイムの推定値
費用:26億 67億ドル
期間:10年未満 高い失敗率
費用:20 40%、 またはそれ以上の削減
期間:数年分短縮 失敗率の低減
AI によるコスト削減は大きく、その節約はより多くの 治療選択肢につながる可能性がある。Insider Intelligence は、コスト削減が70%に達する可能性が あると予測しており、大きな見返りが期待されてい る。7 Morgan Stanley のアナリストによると、前臨床 開発における20~40%のコスト削減は、4~8種類の 新規分子の開発を成功させるための資金源になると見 積もっている。8 彼らは、10年間で「AI や ML の活用 により、初期段階の薬物開発の成功率がささやかに改 善されることで、50以上の新規治療法と500億ドル以 上の機会が生まれる」と信じている。
製薬業界における AI の影響拡大の証
AI への着実な投資は、既に市場に影響を与えている: AI ファーストのアプローチを採用す
るバイオテクノロジー企業は 、150 以上の低分子薬物を発見し、15以上 が臨床試験に入っている。6
米国食品医薬品局(FDA)は 、AI/ML を活用した低分子医
薬品やバイオ医薬品の申請が急増しており、2021年だけで 100件以上の申請があったと報告している。11
協力的な取り組みが AI に基づくイノベーションを促進している。従来は小規模で孤立し、独自データ を保護してきた科学コミュニティが、現在では協力してインサイトを共有し、データを安全に活用して モデルの改善を図っている。例:
AlphaFold とは、公開されているタンパク質構造デー タを用いて、数十年にわたる課題であるタンパク質の フォールディング予測を解決するニューラルネット ワークプログラムである。これは、タンパク質の機能 や疾病メカニズムの理解、新薬の設計、合成タンパク 質の開発を推進するのに役立つ。12,13
DeepTracer-Refine とは、AlphaFold の予測を改善 し、ドメイン間のフォールディング領域の問題を克服 する自動化された改良ツールである。14
AI 革新者は成果を出し始めている。例:
Exscientia は、AI を活用して迅速に薬を臨床試験に 持ち込んだ最初の企業の一つであり、その成功によ り、サノフィのような大手製薬会社が AI 革新者との パートナーシップをますます進めている。17-19
AbSci Corporation は、2023年初めに、AI を使用し て検証されたデ・ノヴォ抗体の開発に成功したと発表 した。同社は、これにより新しい治療法が臨床に到達 するまでの時間を6年から18 24ヶ月に短縮できる可 能性があると予測している。3 ,22
MELLODDY(Machine Learning Ledger Orchestration for Drug Discovery)とは、生化学的または細胞活性が 知られている低分子の世界最大のコレクションを活用 し、より正確な予測モデルを可能にし、創薬の効率を向 上させる。15 具体的には、製薬会社10社の分散された データに対して、独自情報を公開することなく、予測機 械学習モデルを強化するプロジェクトである。
FDA は、新しい AI ベースの安全評価ツールを導入し、 生物学的類似性を証明するために活用している。16
Insilico Medicine は、2023年6月に、がん治療薬
ISM3091 が第1相試験の承認を受け、慢性肺疾患治療薬
INS018_055 が特発性肺線維症患者を対象とした第2相試 験に入ったことで大きな話題を呼んだ。20, 21
INS018_055 の発見プロセス、特にAI ベースのターゲット 発見と AI 主導の設計は、2020年に開始された。20,21
技術や実験機器の進歩により、研究者はこれまでにない規模でデータ を収集・処理できるようになっている。
多くの専門家にとって、製薬 R&D における AI に関す
る話題の多くが、予測モデリングや分析など、既に馴
染みのある概念に焦点を当てているように感じられる
かもしれない。長年にわたり、研究者は実験を補完す
るために、仮想スクリ ニング、モデリングとシミュ
レ ション、物性計算などのインシリコ設計戦略を利
用してきた。これらの断片的な戦略は間違いなく有益
であるが、全体的な創薬プロセスを革命的に変えるこ
とはできなかった。その点、生成 AI はより大きな変
化への期待を生んでいる。
予測モデルがデータの処理・予測を行うのとは異な
り、生成 AI は既存データを使用し、新しいテキス ト、コ ド、図、さらには新薬の設計などを実際に生
成する。23-25 ChatGPT のような大規模言語モデル
(LLM)が多くの注目を集めているが、生成モデルに
は他にも多くの種類があり、ニュ ラルネットワ ク
(例:生成、グラフ、リカレント)や、他の機械学習
や深層学習アルゴリズム(例:ランダムフォレスト、
サポ トベクターマシン、変分オ トエンコ ダー、
強化学習、転移学習)などが含まれている。24,27
先の例で紹介した企業の多くは、生成 AI 技術をデー
タ分析、モデリングとシミュレ ション、ス パ コ
ンピュ ティングと組み合わせた高度な AI 主導の創 薬プラットフォ ムを導入している。23-26 実際、生成
AI は業界を急速に席巻しており、2023年には市場規 模が1億6,000万ドルを超えると予測されている。26
生成 AI は、既存知識を完璧に適用し、イノベ ショ ンを加速させるための次のステップである。企業はそ
れを様々な方法で応用し、非効率で反復が多い R&D
プロセスをさらに効率化している
その代表的な例がデ・ノヴォ薬剤設計であり、生成
AI はまず、低分子化合物や治療用タンパク質配列など の既存の構造データを用いて、有望な新規構造を設計
する(データベ スに既に存在する構造を評価するだ
けではない)。AI はそれらの候補について、生物活
性、潜在的な副作用、および相互作用といった重要な 特性を評価し、創薬で一般的なコストのかかる試行錯
誤を減らすことができる。23,28
生成 AI の可能性は無限に広がっているように見え る。疾患経路のマッピング、潜在的な疾患ターゲット の提案、アノテ ションなどのタスクを自動化する コ ドの生成、論文集の要約、文書やレポ トの生
成、臨床試験結果の予測など、多岐にわたる用途で利 用されている。23-25 しかし、生成 AI は驚異的な可能 性を秘めているものの、万能薬ではない。次のセク ションで説明するように、生成 AI は大量の高品質な
学習データ、信頼できるモデル、そして出力を解釈・ 応用できるデータサイエンスの専門家に依存している のである。
これらの AI の進歩は、根 本的な変化が進行中である ことを示している。
実際、専門家は今後数年間で製薬業界に大きな変革が起こる と予測している。3,22 IDC は、2026年までに、製薬会社におい て、従来の早期ベンチベース研究に代わり、「インシリコ」 ファースト戦略が主流になると予測している。9-10
これほど迅速な進展が見られる主な理由の一つは、自動化と技術の進歩により、AI モ デルの構築が容易になり、利用可能な学習デ タ(例:化学デ タ、分子デ タ、実 験デ タ、ゲノムデ タ、健康記録デ タ、科学論文など)が豊富に生成されている ためである。
AI が業界のあらゆる側面に影響を及ぼすようになることで、現状は確実に変わるだろ う。初期発見段階の研究者がどのようにしてターゲットを発見し、治療法を開発する か、規制当局がどのように承認するか、提供者が患者をどのように治療するかといっ た点まで、全てが変わる。その変化に備えることが成功への鍵となるだろう。
製薬 R&D
「人工知能(AI)と機械学習(ML)は、もはや未来の概念ではな く、私たちが生きて働く方法の一部となっている...。
AI/ML のデータ量と複雑さの拡大に最先端の計算能力と方法論の進歩 が加わることで、ステークホルダーが治療法を開発、製造、使用、評 価する方法を変革する可能性がある。
最終的に、AI/ML は、安全で効果的かつ高品質な治療法をより早く患 者に届けるのに役立つだろう。」
パトリツィア・カヴァッツォーニ医学博士(FDA 医薬品評価研究センター長)11
製薬業界における初期の AI 活用は主に低分子の開発に集中していた。低分子は、バイオ医薬
品に比べて比較的単純であり、何十年にもわたるデータが AI モデル構築の基盤となるため、
AI に適していた。17,29-30
それでも、十分な学習データの有無や AI モデルの複雑さにより、初期の低分子医薬品におけ
る AI 導入のしやすさには大きなばらつきがあった。例えば、早期スクリ ニングや物性予測 は比較的実装しやすかったが、ターゲットの予測や毒性評価は難しかった。31-32 生物学研究における AI の応用は急速に進展している。バイオ医薬品の R&D チ ムは、疾患 やターゲットの理解、エンティティの設計や最適化のために、ますます AI に依存するように なってきている。33 2022年末時点で、50~60の AI 対応バイオ医薬品が様々な開発段階にあ る。33
製薬 R&D における AI の主な機会
AI が製薬業界に 着した今、企業は R&D の様々な分野でそれを 応用し始めている(表1)。
AI を活用することで、製品ライフサイクル全体にわたるチームは、データに基づいた迅速な意思
決 を行い、リソースや予算、専門知識を最も効果的に活用できる場所に配分することが可能に なる。
表1:
製薬業界で AI が応用できる主な分野 5, 17, 33-39
従来パラダイムの推定
ターゲットの特定、選択、および優先順位付け
疾 路のマッピ
新規ターゲットの特
3D タ パク質の構造予
エピトー 選
データに基づいたターゲット選 (マルチオミク
ス、フェノタイ
SAR(構造活性相関)予と表現、論文や特許な
医薬品ターゲットモデリ グと分子シミュレー ショ
結合部位修飾の分析
スクリーニング、デザイン、最適化、および優先順位 付け
高度な 合物スクリーニ グ(例 デュアルバイ
ディ グ 合物 索 バイオ医薬品レパートリーの最適 学特性予
生物活性予
オフターゲット効果予
ADMET/T x と PK/PDの予
免疫原性とヒト の予
物理 学的特性予測(例 溶解性、凝集性
候補の優先順位
最適な合成 路選 ドラッグ・リ ジショニ グ分
デ・ノヴォ・デザイ
特許確認
AI 活用による製薬業界の研究開発 10
開発
結晶構造予
安 性と保存期間のモデリ
バイオ医薬品の開発可能性評価(例 粘度、凝
集、分解)
治験管理
データに基づいた治 デザイ
エ ド イ ト評
者の募集と選 ・層別
投与量 アドヒアラの最適ス(
治療順守)モニタリ データの収集、管理、分析
市販後の監視
ケース処理、評価、提出 製
ロ ス設計とスケールアッ
高度な ロ ス制 ロ スのモニタリ グと医療事故の
資産とサ ライチェー の管 トレ ドモニタリ グ(例
苦情処理、部門
告)
製薬 R&D における
戦略、技術、専門知識 データにおける課題 AI モデルに関する懸念
AI を既存の R&D ワークフローに統合しようとする企業は、自社 で行うにせよ、パートナーの助けを借りるにせよ、AI をどこで、
なぜ、どのように使用するのかについて明確なビジョンを持つ必 要がある。
デロイトによると、最も価値のあるビジネスケ スを
特定することが、企業の AI イニシアチブに影響を与
える最大の課題である(次にデ タに関する課題や、
AI を上手く組織に統合することが続く)。 しかし、
R&D 全体で AI が果たす役割が大きくなることで戦
略的計画は複雑になり、大きな障壁となる。専門家の 中には、異なるプログラムや探索ステージのうち半
ダ ス程度の具体的なユ スケ スに焦点を当てるこ
とを勧める者もいる。 また、優先順位が決まり、計
画が動き出すと、AI モデルの学習に時間を要するた
め、リターンが得られるまでに予想以上に時間がかか
ることが多く、忍耐力が重要になる。
技術的な課題は、製薬業界で AI を活用する際のもう
つの重要な課題である。AI の革新は、企業が従来
とは異なる方法でデ タやワークフローを管理するこ
とを求めることが多い。既存のレガシー技術インフラ では、AI を活用するために必要な統合のレベルやデ タの流動性に対応できないことが多い。41 実際、デロ イトの調査によると、バイオ製薬および医療技術企業 の約30%が、デ タの質やサイロ化されたデ タシス テム、レガシ システムの統合などの問題が AI イニ シアチブに悪影響を与えていると述べている。
AI の導入におけるもう一つの重要な課題は、スキルの ギャップである。長らく映画の中で見る研究者は、白 衣を着た年配の人物が蛍光色の液体が並べられた実験 台に向かっている姿として描かれてきたが、今の現実 は全く異なる。データサイエンスは科学データと同じ ぐらい重要であり、企業がこの二つの世界をどれだけ 橋渡しできるかが、AI イニシアチブの成功に大きく 影響する。しかし、多くの企業が、製薬業界の専門知 識と優れた
AI スキルを持つ人材を見つけるのが依然 として難しいと報告している。40
データがなければ AI は存在しない。AI モデルは実世界のデータ を基に構築され、そのデータは豊富で質が高く、機械がすぐに利 用可能な状態であることが必要である。
医薬品発見の過程に AI を導入する際には、データの バイアス、整合性、プライバシーとセキュリティ、出 所、関連性、再現性、再利用可能性、代表性に関する 問題が最も重要な課題である。35 AI を活用したい企 業は、適切なデータ管理プロセスを確立しなければな らない。なぜなら、以下に述べるように、AI は十分な 量の機械利用可能データに依存するからである。
十分なデータ:AI には良質で大量のデータが必要で ある。専門家の中には、機械学習モデルを信頼性のあ るものにするためには、約2~3年分の過去の学習デー タが必要であると考える者もいる。42 しかし、良質な データを入手することは難しい場合がある。公開デー タは不十分であることが多く、企業は自社の実験デー タや専門知識に依存せざるを得ない。特に、合併や買 収を経て成長し、データやシステムを統合してこな かった企業にとって、これは非常に困難である。AI を 活用したい企業は、まず、ミスのないデータ取得を容 易にし、かつ異なるチームやパートナーによって生成 される大量で多様なデータを処理できるデータ管理 ツールとワークフロープロセスを導入する必要があ る。
機械利用可能なデータ:学習データとして、あるいは AI モデル内で使用されるために収集された実験データ は、機械がすぐに利用可能な状態である必要がある。
企業は、適切なデータラベリングやアノテーション を優先するプロセスを推進し、データにアクセス可能 で相互運用可能なインフラを導入しなければならな い。機械対応に加えて、データは信頼性が高く、信用 できるものでなければならない。実験 R&D のワーク フローには、取得されるデータの正確性と整合性を確 認するためのチェック昨日が組み込まれているべきで ある。これにより、AI モデルに入力されるデータと出 力されるデータの品質が保証される。
「正確で適用可能な AI モデ ルを生成するための主な課題 は、利用可能な実験データは 不均一で、ノイズが多く、ま ばらであることであり、従っ て、適切なデータキュレ ションとデータ収集が最も重 要である。」 41
創薬レビューに関する専門家の意見
全てのデータと同様に、全ての AI モデルも等しく作ら れているわけではない。
AI が創薬や開発においてますます主流となるにつれ、AI モデルの品質、信頼性、そして 限界に関する疑問は避けられないものとなるだろう。35
AI モデルの目的に対して、機会学習に使用されるデータの品質と量は十分か?
AI モデルはどのように既存の品質問題を避け、情報の正確性や信頼性を歪めないようにするのか?
モデルの特異性の程度に対して、問われている質問が複雑ではないか?
結果には二次評価や精査が必要か?
規制当局は、AI の勢いに追いつくため、患者に届く医
薬品の安全性と有効性を確保しながら、AI 主導のイ
ノベ ションを支援する規制枠組みの策定を開始して いる。アメリカでは、FDA(食品医薬品局)が業界、
学界、患者擁護団体を含む主要なステ クホルダーと 協力し、進行中または計画中の AI 活用に関する知見 を集め、今後の規制に役立てる予定である。
同局は最近、「医薬品・バイオ医薬品の開発における 人工知能(AI)と機械学習(ML)の使用」と「医薬 品製造における人工知能」という2つの重要な論文を 発表した。 34-35
ヨ ロッパでは、欧州医薬品庁(EMA)が、医薬品ラ イフサイクルにおける AI の使用に関するリフレク ション・ペ パーを発表し、AI/ML の安全かつ効果的 な使用のためのガイダンスを提供することを目指して いる。44
「AI/ML アルゴリズムは、基 盤となるデータソ スに存在 するエラーや既存のバイアス
を増幅する可能性があり、そ の結果がテスト環境外で外挿 されると、一般化可能性や倫 理的な問題への懸念が生じ る。」
FDAの論文「医薬品・バイオ医薬品開 発における人工知能(AI)と機械学習 (ML)の使用」
AI/ML の使用に関する主な懸念事項は以下の通り である:
透明性、信頼性、説明性 研究者は、自身が使用しているモデルの適用性を理 解し、それらが正確で関連性のある適切なデータで 十分に学習されていると信頼できる必要がある。し かし、FDA の論文で指摘されているように、AI モ デルの複雑さがその説明可能性を困難にし、また、 所有権に関する懸念が特定の詳細の開示を妨げる可 能性がある。35
バイアスの回避
AI モデルは学習データの質に依存しており、バイア スを回避するためには適切で多様なデータが必要で ある。欧州医薬品庁による AI の医薬品ライフサイ クルへの使用に関するリフレクション・ペーパーは 「AI/ML モデルはデータに基づいており、学習デー タからその重みを抽出するため、人間のバイアスが 組み込まれる可能性がある。44 バランスの取れた学 習データセットを取得するために、希少なデータを 過剰にサンプリングする必要性を考慮し、差別化に 繋がる全ての関連根拠を考慮するべきである」と述 べている。
パフォーマンスと信頼性 明確で自信のある答えは魅力的かもしれないが、学 習データの出所、モデルのパフォ マンスや信頼 性・不確実性に関する情報、ある程度の追跡可能性 や監査可能性がなければ意味がない。AI ツールの開 発者は、しっかり整理された学習データに意味的な 関係を構築し、ユ ザーが自信を持って結果を測定 できるような解釈可能な指標を提供することを目指 すべきであり、ユ ザーが予測を盲目的に受け入れ るべきではない。
特異性
特異性のない膨大なデータセットで学習された一般 化モデルは、専門分野で間違いなく苦戦を強いられ る。例えば、新薬の発見において、予測アルゴリズ ムがタンパク質と薬物の結合について低分子で学習 された場合、その結合予測の信頼性は、入力分子が 学習セットの分子とどれだけ構造的に類似している かに依存する。このような場合、不確実性の指標は ユ ザーにモデルの限界を知らせることで、透明性 を向上させることに役立つ。
数年前から進行しているデータ主導の R&D への根本的 なシフトを加速させるため、企業は AI に目を向け始め ている。43 多くの企業が、より迅速で費用対効果の高い イノベーションの実現を目指し、AI イニシアチブに数 千万ドルを投じている40
残念ながら、多くの企業が、自社データが AI 活用に適していないという厳しい 現実に直面している。データへのアクセスの悪さ、サイロ化されたデータ、標 準化の欠如、非効率なアノテーション、疑わしいデータの信頼性、追跡可能性 の限界、不適切なレガシーデータ技術インフラなど、根本的な原因は多岐にわ たる。40
この問題は非常に広範囲に及んでいる。最近の調査では、バイオ医薬品や医療 技術の R&D リ ダーの約30%が、データの問題が AI イニシアチブに悪影響 を与えていることを認めている。特に、質の低いデータやサイロ化されたデー タシステムが最大の懸念事項として挙げられている。
このような問題に直面している企業は、データ管理システムとプロセスが改善 されるまで、AI の恩恵を享受することは困難であろう。
Dotmatics がこの問題の解決を支援する。
AI 活用による製薬業界の研究開発 16
Dotmatics Luma™ は、研究者や管理者が大量のデータを統 合・分析し、より良い意思決定を行うための革新的な科学デー タプラットフォームである。
Luma は、すぐに利用可能なローコードの SaaS プラットフォームを提供しており、全 ての関連データをインテリジェントなデータ構造に柔軟に集約する。これにより、クリー ンで信頼性の高いデータ分析が可能になり、メタ分析や AI/ML ベースのアルゴリズムの 道を開く。
Luma は、企業が R&D インフラやデータを AI 対応に備える際に直面する、以下の一般 的な障害を回避する手助けをする:
多様なデータプロデューサー
Luma は、ELN、実験機器、動物実験、臨床試 験、材料登録、その他の科学システムなど、豊
富なソースからデータを取り込むことができ、
データ管理の反復作業を可能な限り自動化す る。
科学的アプリケーション の 多様性
Luma はローコードのアプリケ ション構築機
能を提供するため、組織全体でニーズが多様で あっても、共通のデザインパターンとデータモ
デルを共有するアプリケ ションを簡単に構築 できる。
データ の 量 とデータサ イ ロ
Luma は、多種多様な科学データの膨大な量と 複雑さに対応する。物理モデルと論理モデルを 分離するアジャイルなデータモデリングアプ ローチにより、科学研究にありがちなデータサ イロを解消する。Luma を用いることで、企業 はガバナンスフレームワーク内でデータのモデ リング、保存、処理、抽出を行うことができ る。
機器の孤立化
Luma は、出力が暗号化されている場合やファイ ルベースでない場合でも、様々な機器からの データ出力を管理する。記述的メタデータや実
験結果を解析し、同じ機器クラス内の機器デー タを調和させる。
データ の アクセス性と使いやすさ
Luma は、データを段階的に強化、相関付け、文 脈化し、より高度なデータ処理と強化活動に向 けて準備するデータバリュ チェーンを通じ て、R&D データの価値を最大化する。また、
API ファーストのアプローチにより、必要な時 に必要な方法でデータのオンデマンドアクセス をサポートする。
Dotmatics Luma 上に構築された
R&D インフラとデータ基盤によ り、企業は AI 導入の準備が整う のである。
強固なデータインフラなしでは、AI 導入は実現できない。
Dotmatics は、企業の全ての R&D データを一元化し、研究者が R&D データを生成・分析する際に使用する主要なアプリケーショ ンと統合することができる。
化学、生物学、材料科学など、様々な科学分野で活動する200万人以上の研究者が、以下の
点で Dotmatics を信頼している:
標準化された柔軟なプロトコールテンプレート、フォームベースの入力、 データのクロスチェック、サインオフ機能を備えた電子実験ノート(ELN) による、自動化された機器データ収集、データベースやアプリケーションの 統合、エラーのないデータ入力などを通じて、クリーンで信頼性の高い研究 データを取得する。
研究者があらゆる専門ツールを使って生成した化学、生物学、 的特性データのほか、外部パートナーが生成したデータやパブ インで利用可能なデータなど、実験ファブリックを構成する全ての データをシームレスに統合することで、データサイロを取り除く。
独自のデータ形式から脱却し、データを標準化、品質管理(
と品質保証(QA)の自動化、時間のかかるエラーの起こりやすい データ整理の排除により、AI に必要なモデル品質の機械対応デー タを提供する。
表2は、Dotmatics が実験データをAIに対応させるための 主な方法を示している。
表2:実験 データ を AI に対応させ る ため の 主な ス テップ
Dotmatics は、実験 R&D データが以下の状態になることを保証する:
データ収集 自動機器データ収集、データベース統合、ELN を介したエラー防止データ入力など、す べてのデータプロデューサーからクリーンで迅速なデータ収集を実現する。
ラベル付け 詳細なメタデータと命名規則により、特定のユーザー、化合物、配列、プロジェクト、 CRO などとの相関を容易にする。
標準化 標準化されたデータモデルにより、独自のデータ形式から脱却し、品質管理(QC)と 品質保証(QA)の自動化を進め、詳細な科学分析に必要なモデル品質データを提供す る。
一元化 科学的に認識されたマスターリポジトリは、分離された(多くの場合は専門分野ごと の)データサイロを排除し、組織とそのパートナ 全体の全てのユーザーと共同研究者 のための単一の信頼できる情報源を作り出す。
相互運用性 裏方のシステムやアプリケ ション間だけでなく、研究協力ツールを通じて、異なる チ ムがコミュニケ ションを取り、データとインサイトを共有し、プロジェクトを前 進させることができるエンドユーザー間でのシ ムレスなデータ交換を実現する。
アクセス性と追
跡性
関連性のある
科学検索、レポート、ダッシュボ ド、閲覧可能な実験などを通じて、データの迅速か つ追跡可能なアクセスを常時提供する。
複数の(多くの場合、チ ム横断的な)分析から得られたデータポイントを重ねた記録 による反復的なデータレイヤリングにより、文脈を正確に反映した全体像を提供する。
セキュア 詳細な認証とアクセス制御により、静止時・転送時のデータを保護し、プライバシーを 脅かすことなく、異なるユーザー、共同研究者、CRO が同じプラットフォ ムで作業 (および同じプラットフォ ム内でデータ交換)することを可能する。
既存の創薬プログラムに AI を導入することは、図1に示されてい るように、通常、複数のステップを踏むことになる。
AI 導入に不可欠な最初のステップは、データのクリーン化である。単純に聞こえるかもし れないが、実際には多くの製薬会社が多種多様なデータを山のように抱えている。例え ば、50ペタバイトもの膨大なデータが存在するが、それらはソフトウェア、機器、スプ レッドシートなど、相互にうまく連携できない様々な場所に保存されている。 データが整理されると、レポートの作成やアドホッククエリの実行が可能になり、研究者 はより簡単に分析を進め、理解を深めることができる。次のステップはインタラクティブ な可視化であり、研究者は自身の創薬データ内のパターンを視覚的に確認できるようにな る。
ここから、予測モデリングや処方分析など、AI の真の可能性に踏み込むことになる。例え ば、ある遺伝子変異を持つ患者が、特定の医薬品に対しては良好な反応を示す可能性が高 いことを AI が発見できれば、個別化された治療計画を立てることができる。これにより、
患者の治療効果が大幅に改善され、副作用が減少する可能性がある。予測モデリングと処 方分析が、これらを可能にする。
後期段階
最終的に自動意思決定の段階に到達することで、AI を最大限に活用できる。この段階で AI は、創薬データ内のパターン、トレンド、相関関係の自律的な識別、予測の生成、潜在 的な新薬候補の提供、実験デザインの最適化、さらには調査すべき新しい仮説の提案など を可能にする。
R&D データ基盤のサポートに Dotmatics Luma を選ぶ企 業は、生成 AI によるクエリ構築オプションの生成や、実 験のテストや手順を強化するための予測的・適応的 AI の 使用など、AI の力を活用する準備が整っている。
図1
創薬プログラムに AI を導入するには、まず AI に対応できるようにデータ管理システムやプロセスを整備するこ とから始める必要がある。
プラットフォーム
AI 対応データ
初期採用 R&D データ内のパターンを確認 レポート アドホッククエリ インタラクティブな可視化
中盤
AI 主導の R&D 予測モデリング 処方分析
最終段階
自動意思決定 自律的なパターン認識 予測の生成 仮説の提案
Dotmaticsは、AI 対応の科学データプラットフォームである Luma はもちろん、お客様と密接に連携し、AI を活用することで R&D の イノベーションをいかに加速できるかをしっかり見極める。
AI がお客様のワークフローと意思決定を改善しているケースは以下の通りである:
AI ベースの自動フローサイトメトリーのゲーティング
Dotmatics は、フローサイトメトリーソフトウェア OMIQ 内で利用可能な ML アルゴリ ズムの学習をクラウドソーシングで行っている。フローサイトメトリーは、レ ザーを 用いて大量の細胞を複数のパラメーターで迅速に評価するラボ技術であり、科学研究、
臨床分析、治療開発に広く応用されている。
このプロセスでは、膨大な量の生データを実用的なインサイトに変換する必要がある。
これまでは、アナリストがデータポイントの周りにゲートを引き、関心または懸念のあ る細胞を特定し、関心のある細胞集団に徐々に焦点を合わせていくプロセスが手作業で
行われていた。
このようなプロセスを自動化するために、オープンデータを用いてソフトウェアを学習
させる「オートゲ ティング」と呼ばれる ML 主導の技術を Dotmatics は構築した。
これにより、さらに迅速で、コストを抑えた、より重要な医療革新が可能になる。
AI による薬剤候補レビューの可視化
Dotmatics Vortex は、R&D の意思決定を支援するデータ可視化・分析プログラムであ
る。AI/ML を活用することで、スプレッドシートやテ ブルに表示されるデータを分か りやすく視覚化し、医薬品候補のレビューを容易にする。例えば、AI/ML を使用して化 学空間をフォールディングし、成功と失敗の領域を迅速に強調することができる。
AI 主導のタンパク質分析
Protein Metrics は、質量分析計やクロマトグラフィ 機器などで得られたデータを活用 して、タンパク質配列を迅速に特定・報告できるようにする。このプログラムは、AI/ ML の活用に絞ってタンパク質の検索、特定、スコアリングなどの作業をサポートす る。
Dotmatics と共に AI の旅を 進めましょう
Dotmatics がどのように AI の旅をサポートでき るか、デモをご覧ください。
詳しくはこちら
AI
D
ug D
covery. Boston Consulting Group. March 29, 2022. https://www.bcg.com/publications/2022/adopting ai-inpharmaceutical-discover
Why Artificial Intelligence Could Speed Drug D
overy. Morgan Stanley Research. September 9, 2022. https://www.morganstanley.com/ideas/ai-drug discover
Big pharma is using AI and machine learning in drug discovery and development to save lives. Insider Intelligence. April 15, 2022. https://www.insiderintelligence.com/insights/ai-machine learning-in-drug-discovery-development
Shegewi, M. , Allocato, A. , Dunbrack, L. , et. al. DC FutureScape: Worldwide Healthcare Industry 2023 redictions. ctober 2022. https://www.idc.com/getdoc.jsp?containerId S4858
Galer, S. Life Sciences Trends 2023: Clinical Research T
. SA . March 1, 2023. https://blogs.sap.com/2023/03/01/life-sciences-trends-2023-clinical-research-trials-atyour-local-pharmacy FDA Releases Two Discussion apers to Spur Conversation about Artificial Intelligence and Machine Learning in Drug Development and Manufacturing. FDA Voices. May 10, 2022. https:// www.fda.gov/n ws v nts/fda voic s/fda r l as s two discussion pap rs spur conv rsation about artificial int llig nc and machin AlphaFold rotein Structure Database Developed. DeepMind and EMBL-EBI. Accessed August 31, 2023. https://alphafold.ebi.ac.uk/
n, W.D.
News. anuary 30, 0 0. https://www.bbc.com/news/technology 131 46
Exscientia and Sanofi establish strategic research collaboration to develop AI-driven pipeline of precision-engineered medicines. Sano
eld, A. The first fully A.I.-generated drug enters clinical trials in human p
Generative AI has the potential to revolutionise drug discovery. GlobalData Healthcare. Pharmaceutical Technology. August 3, 0 3. https://www.pharmaceutical-technology.com/ comment/generative ai-revolutionise-drug-discovery
untz, . Raising the efficiency floor and innovation ceiling with generative AI in drug discovery. Drug Discovery and Development. une 9, 0 3. https://www.drugdiscover trends.com/ generative ai-drug-discover /
y 17, 2022. https://www.nature.com/articles/d43 4 -022-00104-
Lowe, D. AI and Drug Discovery: Attacking the Right Problems. Science. 2021. https:// www.science.org/content/blog-post/ai-and-drug-discovery
Huang, D.Z., Barber, C., Bahmanyar S.S. The challenges of generaliz
Honcha , N. 9 Publicly aded Biotechs Utilizing A -based Resea ch Platfo ms. Biopha ma end.com. June 9, 0 3. https://www.biopharmatrend.com/post/601-recent-iposamong-ai-driven-platforms-for-drug-discovery and-biotech
C aven, J. A in d ug manufactu ing: Stakeholde s call fo ha monization, fu the guidance. Regulato y Focus. May 9, 0 3. https: www.raps.org news-and-articles news-articles 2023 5 aiin-drug-manufacturing-stakeholders-call-for-ha
Chun, M. How A tificial ntelligence is Revolutionizing D ug Discove y. Ha va d Law Bill of Health Blog. Ma ch 0, 0 3. https://blog.petrieflom.law.harvard.edu/2023/03/20/how-artificial intelligence-is-revolutionizing-drug-discovery
Kudumala, A., Ressle , R., Mi anda, W. Scaling up A ac oss the life sciences value chain: Enhancing R&D, c eating efficiencies, and inc easing impact. Deloitte nsights. Novembe 4, 0 0. https:// www2.de oitte.com/us/en/insights/industry/ ife-sciences/ai-and-pharma.htm
Huygen, W. How leading companies scale A . Five key p inciples to build an A p oduction platfo m. owa ds Data Science. July 4, 0 0. https://towardsdatascience.com/how-leading-companiesscale-ai-4626189faed
Walch, K. he nc easing Use Of A n he Pha maceutical ndust y. Fo bes. Decembe 6, 0 0. https://www.forbes.com/sites/cognitiveworld/2020/12/26/the-increasing-use-of-ai-in-thepharmaceutical-industry
Wiles, J. What’s New in A tificial ntelligence f om the 0 Ga tne Hype Cycle. Ga tne . Septembe 1 , 0 . https://www.gartn r.com/ n/articl s/what-s-n w-in-artificial-int llig ncfrom-th -2022-gartn r-hyp -cycl
Reflection pape on the use of A tificial ntelligence (A ) in the medicinal p oduct lifecycle. Eu opean Medicines Agency. July 13, 0 3. https://www.ema.europa.eu/en/documents/scientific guideline/dra t-re ection-paper-use-artificial-intelligence-ai-medicinal-product-li ecycle en.pd
Fo d, J., Blai , A., Naaz, B., Ove man, J. Biopha ma leade s p io itize R&D, technological t ansfo mation, and global ma ket p esence. Deloitte. August 3, 0 0. https // .deloitte. om/ global/en/our-thinking/insights/industry/life-s ien es/pharma euti al-industry-trends.html