Dinesh Thekkoot博士、Genesus Inc

機械学習(ML)は、過去数年間話題の言葉となっています。 MLは、結果を予測するためのアルゴリズムの研究専用の人工知能(AI)のサブフィールドです。 故意または無意識のうちに、私たちは日々の生活においてMLに大きく依存しています。

Siri、Alexa、Google Nowなどのバーチャルパーソナルアシスタント、ソーシャルメディアでのパーソナライズされたニュースフィード、Facebookフィードで表示される友人の提案、電子メールスパム、マルウェアのフィルタリング、GPSで表示されるトラフィック予測などがあります。 MLアルゴリズムに基づいている、私たちが定期的に使用するサービス/技術のいくつか。

MLは日々の生活において非常に重要な役割を果たしていますが、動物の飼育/生産におけるこの技術の適用はまだ始まったばかりです。 自動給餌および計量システム、デジタル画像処理、大規模遺伝子型決定などのような現代の技術の最近の発展は、農家、ブリーダー、および関連産業が動物レベルで大量のデータ(ビッグデータ)を継続的に監視および収集することを可能にした手ごろなコスト。

このビッグデータの行と列の数は非常に多いため、通常のコンピュータプログラムを使用してこれを視覚化するのは非常に困難です。 また、ほとんどの場合、このデータには欠損値、異常値、および不要なデータポイントが含まれる可能性があるため、常に「クリーン」とは限りません。

もう1つの問題は、遺伝的評価の場合の動物あたりのデータ量です。 最新のデータ分析方法は、動物一人あたりのデータの数が多くないことを前提としています。 たとえば、500の雌豚がいる場合、各雌豚にはごみの生記録がほとんどなく、成長記録がほとんどない、つまり、各雌豚の500または10データポイントを持つ15雌豚があるとします。 しかし、最新のデータ収集技術では、これらの500雌雄それぞれについて、50,000以上の遺伝子型情報、数千の授乳餌摂取記録、および毎分数千の温度や湿度などの数千の分娩室環境測定値がある。 したがって、同じ5雌豚にはそれぞれ数千(または数百万)のデータが含まれます。 この問題に対処するために多くの統計的方法が開発されてきたが、それらは極めて大量のコンピュータ資源を必要とする。 MLは、これらすべての問題に対処するための効率的な方法であることが証明されています。

データからの学習は、機械学習の基本原則であり、結果を最も正確に予測できる、大量のデータ分析モデルから選択することを目的としています。 この部分はトレーニングプロセスと呼ばれ、2種類のトレーニングがあります。

  1. 監視付きトレーニング (機械は遺伝子型と対応する表現型のような既存の例から学ぶ)そして
  2. 教師なしトレーニング (我々が遺伝子型しか持っていない状況のように、以前の例は必要としなかった)。

動物科学における機械学習の応用例

  • ゲノム予測 MLの最も初期の試みの1つは、ゲノム対応予測において試みられた。 初期の結果は、根底にある遺伝的構造が複雑である場合(優性および/または優越性によって形質が制御される場合)、ML法が伝統的な方法よりも良好に機能したことを示している(Liら(XNUMX)Front.Genet.XNUMX:XNUMX)。
  • ゲノムワイド関連研究(GWAS): 刊行物は、ML法がGWASを実施するために使用され得ることを示した。 また、ML法は、候補遺伝子への直接リンクを有するSNPのサブセットを同定することにおいてより効率的であることが示されている(Liら(XNUMX)Front.Genet.XNUMX:XNUMX)。
  • 遺伝子型の帰属 ジェノタイピング中に、品質の問題のためにすべてのマーカーがジェノタイピングされるわけではなく、補完と呼ばれるプロセスを使用して不足しているマーカージェノタイプを予測する必要があります。 ML法はこれらの欠けている遺伝子型を代入するためにより高い精度を持つことを示した(Morota et al。(2018)J. Anim。Sci。96:1540-1550)。
  • 表現型品質チェック: MLモデルは、データ内の異常値の特定に成功することが示されており、遺伝的評価の前にデータをフィルタリングおよび編集するために適用することができます(Morotaら(2018)J. Anim。Sci。96:1540-1550)。
  • 画像解析: ML法は、体重計を使用するのではなく、カメラ画像から体重を予測するために使用することができ、これは面倒で時間がかかり、動物にストレスを引き起こす。 また、これらの方法はオンラインカメラ画像からリアルタイムで死体組成を予測するために使用することができる。

Genesusでは、20年以上前の個々の飼料摂取機械、枝肉、および豚肉品質プログラムから、そして1週間に多くの選択候補の遺伝子型決定から大量のデータを生成します。 これらの大量のデータは、ビッグデータのカテゴリに分類することができ、通常の成長および生殖表現型と共に、当社の通常の遺伝子評価プログラムの不可欠な部分となっています。

現在、これらのデータをより効率的に分析するための予測MLアプローチを検討中です。 これらすべてのステップは、遺伝的改善率を高めるのに役立ち、最終的にはGenesusのお客様に利益をもたらします。

このページを共有...
LinkedInの上にシェア
LinkedIn
Facebookでシェア
Facebook
Twitterでこのことについてつぶやきます
Twitter

カテゴリ: ,

この投稿はGenesusによって作成されました