当社、株式会社Rhelixa(本社:東京都中央区、代表取締役CEO:仲木 竜、以下「当社」)は、この度、日本人集団に特化した高精度のエピジェネティック・クロック*1の開発に成功し、関連研究論文が応用数学及び数学一般分野の専門誌であるMathematics誌に採択されました。本研究では、従来の手法を上回る精度でDNAメチル化*2パターンを利用した生物学的年齢予測を実現し、日本人集団における健康リスク評価をはじめとした老化予防分野での応用が期待されます。本研究は、塘由惟氏(現:慶應義塾大学医学部医療政策・管理学教室共同研究員、元:慶應義塾大学医学部助教)の協力のもと実施されました。
【研究概要】
本研究は、新たな転移学習手法であるTransfer Elastic Net*3(以下「TENet」)を新たに考案し、日本人集団に特化したエピジェネティック・クロックを開発しました。[千岸1] [MOU2] TENetは、既存のモデルから得たパラメータを利用することで、少数のサンプルで高精度な予測モデルを構築できる手法です。これにより、日本人に適した年齢評価モデルを開発し、高い生物学的年齢評価精度を実現しました。
【研究の背景】
エピジェネティック・クロックはDNAメチル化パターンに基づき生物学的年齢を予測する技術です。既存のエピジェネティック・クロックの多くは多人種データで訓練された予測モデルであり、特定の人種に適用する際にバイアスが生じることがあります。本研究では、日本人集団に特化したモデルの必要性から、効率よく特定の集団に特化したモデルを訓練できる新たな統計的手法を開発し、日本人向けのエピジェネティック・クロックを構築することを目的としました。
【研究内容と成果】
本研究では、Transfer Elastic Net(TENet)という新しい転移学習技術を提案し、日本人集団に特化したエピジェネティック・クロックを開発しました。TENetは、Elastic Net (ENet)で訓練された既存モデルから得たパラメータ情報を活用し、少数のサンプルでも精度の高いクロックを構築することが可能です。本研究では、このTENetを用い、日本人143名のDNAメチル化データから、Horvath、Hannum、PhenoAgeクロックを構築しました。特に、主成分分析法(PCA)を用いて技術的ノイズを削減した、信頼性の高いPCクロックモデル(PC-Horvath、PC-Hannum、PC-PhenoAge)を構築し、構築に使用していない50名の日本人データ(評価セット)に適用することでENetおよびTENetとの比較を行いました。解析結果から、TENetを用いたクロックは、ENetや既存のクロックと比較し、予測誤差が小さく、バイアスが大幅に減少しました(図1)。また、TENetは既存のモデルと高い類似性を保ちながら、日本人集団に適したパラメータ推定を実現しました。これにより、日本人に特化した高精度のエピジェネティック・クロックが構築され、寿命、健康・疾患リスクの評価が可能となり、老化予防分野での応用が期待されます。
【今後の展開】
本研究で開発されたTENet手法で構築したモデルは、日本人集団における生物学的年齢評価において高い精度を示しました。一方で、寿命診断や健康・疾患リスク評価などの臨床応用には、多様な属性を持つ日本人被験者を対象とした臨床介入試験が不可欠です。これらの試験を通じて、本研究で構築されたモデルの有用性に関するデータを蓄積することで、個別化医療や予防医療の分野でのさらなる展開が期待されます。
【掲載論文】
【題名】Transfer Elastic Net for Developing Epigenetic Clocks for the Japanese Population
【著者名】塘 由惟, 仲木 竜
【掲載誌】Mathematics
【掲載日】2024/8/30
*1: エピジェネティック・クロック:
DNAメチル化パターンに基づき、生物学的年齢を予測するモデル。
*2: DNAメチル化
DNAメチル化とは、DNA分子のシトシン塩基にメチル基が付加される化学的な修飾のことを指します。この修飾は、特にCpGサイトと呼ばれる特定の配列で頻繁に見られます。これまでの研究から、DNAメチル化は環境・加齢などで変化することが知られており、近年がんをはじめとしたさまざまな疾患の発症に大きく関与することが明らかになっています。
*3: Elastic Net (ENet):
Elastic Net は、回帰モデルの訓練手法の一種で、スパースな(疎な[MOU3] )モデル表現を得ることができます。データが高次元かつ相関の強い変数がある場合に有効です。
*4: 転移学習:
転移学習は、過去の統計・機械学習モデルの学習で獲得した情報を、新たなモデルの学習時に活用する技術の枠組みです。類似したデータにおけるモデルの学習に効果的で、少量のデータで高精度な予測を実現することができます。