Dinesh Thekkoot PhD, Genesus Inc

Maschinelles Lernen (ML) war in den letzten Jahren ein Modewort. ML ist ein Teilgebiet der künstlichen Intelligenz (KI), das sich der Erforschung von Algorithmen zur Vorhersage von Ergebnissen widmet. Wissentlich oder unwissentlich sind wir in unserem täglichen Leben stark von ML abhängig.

Die virtuellen persönlichen Assistenten wie Siri, Alexa und Google Now, der personalisierte Newsfeed in unseren sozialen Medien, die Vorschläge von Freunden, die wir in einem Facebook-Feed sehen, die Filterung von E-Mail-Spam und Malware, die Verkehrsprognosen, die wir auf unserem GPS sehen, usw. Einige der Dienste / Technologien, die wir regelmäßig nutzen und die auf ML-Algorithmen basieren.

Obwohl ML in unserem täglichen Leben eine sehr wichtige Rolle spielt, steckt die Anwendung dieser Technologie in der Tierzucht / -produktion noch in den Kinderschuhen. Die jüngsten Entwicklungen bei modernen Technologien wie automatisierten Fütterungs- und Wiegesystemen, digitaler Bildgebung, Genotypisierung im großen Maßstab usw. haben es Landwirten, Züchtern und verwandten Industrien ermöglicht, eine große Menge von Daten (Big Data) auf der Ebene der Tiere kontinuierlich zu überwachen und zu sammeln ein angemessener Preis.

Die Anzahl der Zeilen und Spalten in diesen Big Data ist oft so groß, dass es sehr schwierig ist, dies mit normalen Computerprogrammen zu visualisieren. Außerdem sind diese Daten in den meisten Fällen nicht immer „sauber“, da sie fehlende Werte, Ausreißer und unerwünschte Datenpunkte enthalten können.

Ein weiteres Problem ist die Datenmenge pro Tier bei der genetischen Bewertung. Die meisten aktuellen Datenanalysemethoden gehen davon aus, dass die Anzahl der Daten pro Tier nicht groß ist. Angenommen, wir haben 500-Sauen, für jede Sau liegen wenige Wurf- und Wachstumsnachweise vor, dh wir haben 500-Sauen mit 10- oder 15-Datenpunkten für jede Sau. Dank der aktualisierten Datenerfassungstechnologie verfügen wir bei jeder dieser 500-Sauen möglicherweise über mehr als 50,000-Genotypinformationen, mehrere Tausend Laktationsfutteraufzeichnungen und mehrere Tausend Messungen der Abferkelraumumgebung wie Temperatur und Luftfeuchtigkeit, die alle 5-Minuten aufgezeichnet werden. Dieselben 500-Sauen haben also jeweils Tausende (oder sogar Millionen) von Daten. Viele statistische Methoden wurden entwickelt, um dieses Problem anzugehen, aber sie erfordern extrem große Mengen an Computerressourcen. ML hat sich als effiziente Methode erwiesen, um all diese Probleme anzugehen.

Das Lernen aus Daten ist das Kernprinzip des maschinellen Lernens und zielt darauf ab, aus einem großen Pool von Datenanalysemodellen auszuwählen, die die Ergebnisse am genauesten vorhersagen können. Dieser Teil wird als Trainingsprozess bezeichnet. Es gibt zwei Arten von Trainings:

  1. Betreutes Training (Maschine lernt aus vorhandenen Beispielen wie Genotypen und entsprechenden Phänotypen) und
  2. Unbeaufsichtigtes Training (Keine vorherigen Beispiele erforderlich, wie die Situation, in der wir nur Genotypen haben).

Einige der Anwendungen des maschinellen Lernens in der Tierwissenschaft:

  • Genomische Vorhersage: Einer der frühesten Versuche von ML wurde in der Genom-fähigen Vorhersage versucht. Erste Ergebnisse zeigen, dass ML-Methoden eine bessere Leistung erbringen als herkömmliche Methoden, wenn die zugrunde liegende genetische Architektur komplex ist (wenn Merkmale durch Dominanz und / oder Epistase kontrolliert werden) (Li et al. (2018) Front. Genet. 9: 237).
  • Genomweite Assoziationsstudien (GWAS): Veröffentlichungen haben gezeigt, dass ML-Methoden zur Durchführung von GWAS eingesetzt werden können. Es wurde auch gezeigt, dass ML-Methoden effizienter bei der Identifizierung einer Untergruppe von SNPs mit direkter Verknüpfung mit Kandidatengenen sind (Li et al. (2018) Front. Genet. 9: 237).
  • Genotypzuschreibung: Während der Genotypisierung werden aufgrund von Qualitätsproblemen nicht alle Marker genotypisiert, und wir müssen die fehlenden Markergenotypen mithilfe eines als Imputation bezeichneten Prozesses vorhersagen. Studien haben gezeigt, dass ML-Methoden eine höhere Genauigkeit für die Zuweisung dieser fehlenden Genotypen aufweisen (Morota et al. (2018), J. Anim. Sci. 96: 1540 – 1550).
  • Phänotyp-Qualitätsprüfung: Es hat sich gezeigt, dass ML-Modelle bei der Identifizierung von Ausreißern in den Daten erfolgreich sind und zum Filtern und Bearbeiten von Daten vor der genetischen Bewertung verwendet werden können (Morota et al. (2018), J. Anim. Sci. 96: 1540 – 1550).
  • Bildanalyse: ML-Methoden können verwendet werden, um das Körpergewicht anhand von Kamerabildern vorherzusagen, anstatt eine Waage zu verwenden. Dies ist mühsam, zeitaufwändig und belastet Tiere. Diese Verfahren können auch verwendet werden, um die Karkassenzusammensetzung aus Online-Kamerabildern in Echtzeit vorherzusagen.

Bei Genesus generieren wir große Datenmengen aus einzelnen Futteraufnahmemaschinen, Kadaver- und Schweinefleischqualitätsprogrammen, die mehr als 20 Jahre zurückreichen, und aus der Genotypisierung vieler Auswahlkandidaten pro Woche. Diese großen Datenmengen können in die Big-Data-Kategorie eingeordnet werden und waren zusammen mit unserem routinemäßigen Wachstum und unseren reproduktiven Phänotypen ein wesentlicher Bestandteil unseres regulären genetischen Evaluierungsprogramms.

Derzeit untersuchen wir prädiktive ML-Ansätze, um diese Daten effizienter zu analysieren. All diese Schritte werden zur Steigerung der genetischen Verbesserungsrate beitragen und letztendlich den Kunden von Genesus zugute kommen.

Kategorisiert in: ,

Dieser Beitrag wurde von Genesus geschrieben