■研究の概要:
千葉大学国際高等研究基幹の南川舞准教授は、農研機構果樹茶業研究部門の國久美由紀上級研究員らの研究グループ、東京大学大学院農学生命科学研究科の岩田洋佳教授らの研究グループとの共同研究により、
異なるゲノム解析システムから取得されたゲノム網羅的なDNAの違いのデータを統合する技術を開発しました。本技術により、過去に取得したデータも活用できるようになり、芽生えの段階におけるリンゴの多くの果実特性の予測精度が向上しました。
さらに、
糖度や食感のようないくつかの果実特性については、近親交配の程度の情報も考慮することで、予測のさらなる高精度化が可能であることを示しました。
この成果により、消費者や生産者の多様なニーズに的確に対応するリンゴの品種改良の高度化・効率化につながることが期待されます。
本研究成果は、2024年7月8日に、学術誌Horticulture Researchでオンライン公開されました。
■研究の背景:
果樹は一般的に種子が発芽してから開花・結実するまでの期間が長く、交雑育種(品種改良)に長い年月を要します。また、穀物や野菜に比べて個体サイズが大きいために多数の個体を選抜対象にできず、新品種の育成が容易ではありません。しかしこうした果樹育種の障壁を、近年注目されているゲノム情報を利用した育種法であるゲノミック選抜(Genomic Selection:GS)(注1)やゲノムワイド関連解析(Genome-Wide Association Study:GWAS)(注2)などの技術で、取り除ける可能性があります。
近年、次世代シーケンサー(注3)の普及により、多数の品種間におけるゲノム網羅的なDNAの違い(一塩基多型:SNPs)(注4)を検出するためのゲノム解析システムは飛躍的に進歩しています。 これまでGSやGWASでは、一つのシステムから得られたSNPs情報を使用することが主流であり、使用中のシステムが古くなった場合には、最新のシステムで解析し直す必要がありました。しかし、選抜時に廃棄された個体のDNAを再び得ることはできないため、過去のシステムで解析をした果樹育種の選抜用の集団を解析し直すことは困難でした。
研究グループは、異なるシステムにより得られたSNPs情報を上手く統合して活用する枠組みが必要だと考え本研究では、世界的にポピュラーな果樹の一つであるリンゴを対象に、Infinium(注5)とGRAS-Di(注6)システムによりそれぞれ得られたSNPs情報の統合方法を検討し、大規模なデータの穴埋めを実施して統合したデータを用いた場合のゲノミック予測(Genomic Prediction:GP)やGWASの精度を評価しました。また、リンゴの交雑育種では少数の優れた起源品種や代表品種(例:ふじ)が、交雑用の親として繰り返し用いられてきており、近親交配が進んでいることが予想されます。近親交配の程度が大きくなると、樹勢や収量が低下することが知られています。このことから、近親交配の程度の情報も考慮した場合のGPやGWASの精度についても評価しました。
■研究の成果:
農研機構果樹茶業研究部門の盛岡研究拠点で栽培されているリンゴ品種群と交雑育種集団(計2,407個体)を解析に用いました。Infiniumは今後サービスが終了し使用が困難になることが予定されているため、将来GRAS-Diに移行することを仮定し、解析計画を立てました。Infiniumではリンゴ品種群と交雑集団2について、GRAS-Diではリンゴ品種群と交雑集団1について、DNAの違い(SNPs)のデータを取得しました(図1)。 GRAS-Diデータしかない交雑集団1の果実特性を予測するために、交雑集団2のInfiniumデータを利用できるよう、Beagleという既存のデータの穴埋めプログラムと自作のプログラムとの組合せによる改良版プログラムを用いて補完し、データの穴埋めを行いました。
3種類の異なる情報と統計モデルのセットを用いて、図1の交雑集団1におけるリンゴの糖度と、粉質化の程度に関するGP精度を比較しました(図2)。その結果、GRAS-DiとInfiniumのそれぞれのシステムによって得られたSNPsデータを統合することで、GRAS-Diによって得られたSNPsのみを用いた場合よりもGP精度が向上することが多くの果実特性で明らかとなりました(図2では糖度と粉質化程度を例として挙げています)。いくつかの果実特性については、近親交配の程度の情報も考慮することで、GP精度がさらに向上しました。
次に、3種類の異なる情報のセットを用いて、GWASによる原因遺伝子領域の検出力を比較しました(図3)。結果、GRAS-DiとInfiniumのそれぞれのシステムによって得られたSNPsデータを統合することで、システム単体によって得られたSNPsのみを用いた場合よりも、GWASの検出力が向上することが多くの果実特性で明らかとなりました(図3では糖度を例として挙げています)。GRAS-DiとInfiniumの統合データを使用した場合のみ、閾値である波線を超えるピークが検出されています。波線を超えた位置にあるSNPsは、糖度と統計的に有意な関連があることを示しています。
■今後の展望:
本研究により、
異なるシステムから取得されたSNPsを組み合わせることで、将来ゲノム解析システムが変化していっても、過去のシステムで解析した個体のデータを活用できます。
今回の調査で、
過去のデータを統合することにより、芽生えの段階での、将来できるリンゴの果実特性の予測を高精度化できることが明らかになりました。
また、
GWASによる原因遺伝子領域の検出力も向上しました。
開発した技術や方法論は、ナシやカンキツなどの他の果樹への応用も可能です。
今後は、3つ以上のシステムから取得された膨大なSNPs情報を統合する場合に備えて、その統合に用いるプログラムのさらなる高速化・高精度化を目指していく予定です。
■用語解説
注1)ゲノミック選抜(Genomic Selection:GS)
:DNAの違いの情報をもとに、個体の遺伝的能力を予測して選抜する方法。DNAの違いと果実特性のデータについて、多数の品種・系統をトレーニングデータとして両者間に見られる関係を数式によってモデル化し、その「ゲノミック予測(Genomic Prediction:GP)モデル」に基づいて、個体の遺伝的能力を予測する。芽生えの段階で将来できる果実の特性を予測することが可能。
注2)ゲノムワイド関連解析(Genome-Wide Association Study:GWAS)
:多数の品種・系統におけるDNAの違いと果実特性の関係を数式によってモデル化し、果実特性と関連するDNAの違いを統計的に検出する手法。果実特性に関連するDNAの違いが明らかになれば、そのDNAの違いの近傍を探索することで、果実特性を制御する候補遺伝子を同定することができる。
注3)次世代シーケンサー
: 一度に大量のDNA配列を解読することができる装置。
注4)一塩基多型(Single Nucleotide Polymorphisms:SNPs)
:DNAはデオキシリボ核酸という物質であり、アデニン(A)、チミン(T)、グアニン(G)、シトシン(C)の4種類の塩基で構成されている。品種間におけるその塩基の違いを一塩基多型と呼んでいる。
注5)Infiniumシステム
:イルミナ株式会社が提供する一塩基多型検出システム。
注6)GRAS-Di (Genotyping by Random Amplicon Sequencing-Direct)システム
:トヨタ自動車株式会社が開発した一塩基多型検出システム。
■研究プロジェクトについて
本研究は、以下の事業の支援を受けて実施されました。
•科学研究費助成事業(JP22K20577, JP23K13928)
•農林水産省委託プロジェクト研究「令和5年度農林水産研究の推進(委託プロジェクト研究)みどりの品種開発加速化プロジェクト」(JPJ012037)
•内閣府戦略的イノベーション創造プログラム (SIP)「スマートバイオ産業・農業基盤技術」(管理法人:農研機構生研支援センター)
•農林水産省委託プロジェクト研究「ゲノム情報を活用した農産物の次世代生産基盤技術の開発」
■論文情報
タイトル:Genomic prediction and genome-wide association study using combined genotypic data from different genotyping systems: Application to apple fruit quality traits.
著者:Mai F. Minamikawa, Miyuki Kunihisa, Shigeki Moriya, Tokurou Shimizu, Minoru Inamori, Hiroyoshi Iwata
雑誌名:Horticulture Research