Dinesh Thekkoot PhD, Genesus Inc

Machine learning (ML) è stata una parola d'ordine negli ultimi anni. ML è un sottocampo dell'intelligenza artificiale (AI) dedicato allo studio degli algoritmi per prevedere i risultati. Consapevolmente o inconsapevolmente siamo fortemente dipendenti dalla ML nella nostra vita di tutti i giorni.

Gli assistenti personali virtuali come Siri, Alexa e Google Now, il feed di notizie personalizzato nei nostri social media, i suggerimenti degli amici che vediamo in un feed di Facebook, lo spamming e il filtraggio malware, le previsioni del traffico che vediamo sul nostro GPS, ecc. alcuni dei servizi / tecnologie che utilizziamo regolarmente basati su algoritmi ML.

Anche se la ML svolge un ruolo molto importante nella nostra vita quotidiana, l'applicazione di questa tecnologia nell'allevamento / produzione di animali è ancora nell'infanzia. I recenti sviluppi in tecnologie moderne come sistemi di alimentazione e pesatura automatizzati, imaging digitale, genotipizzazione su larga scala, ecc. Hanno permesso agli agricoltori, agli allevatori e alle industrie connesse di monitorare e raccogliere continuamente una grande quantità di dati (grandi dati) a livello animale a un costo ragionevole

Il numero di righe e colonne in questi grandi dati è spesso così grande che è molto difficile visualizzarlo utilizzando normali programmi per computer. Inoltre, nella maggior parte dei casi, questi dati non sono sempre "puliti", in quanto possono contenere valori mancanti, valori anomali e punti dati indesiderati.

Un altro problema è la quantità di dati per animale nel caso della valutazione genetica. La maggior parte dei metodi di analisi dei dati attuali presuppone che il numero di pezzi di dati per animale non sia elevato. Ad esempio, supponiamo che se abbiamo scrofe 500, ogni scrofa avrà pochi record di cucciolata e pochi record di crescita, cioè abbiamo scrofe 500 con punti dati 10 o 15 per ogni scrofa. Tuttavia, la tecnologia di raccolta dati aggiornata, su ognuna di quelle scrofe 500 potremmo avere più di 50,000 pezzi di informazioni sui genotipi, diverse migliaia di registrazioni di assunzione di lattazione e diverse migliaia di misure ambientali di sala parto come temperatura e umidità registrate ogni 5 minuti. Quindi, le stesse scrofe 500 avranno ciascuna migliaia (o anche milioni) di pezzi di dati. Molti metodi statistici sono stati sviluppati per risolvere questo problema, ma richiedono quantità estremamente elevate di risorse del computer. ML ha dimostrato di essere un metodo efficace per affrontare tutti questi problemi.

L'apprendimento dai dati è il principio cardine dell'apprendimento automatico e mira a scegliere tra un ampio pool di modelli di analisi dei dati, in grado di prevedere i risultati più accuratamente. Questa parte è chiamata processo di formazione e ci sono due tipi di allenamento:

  1. Formazione supervisionata (La macchina impara da esempi esistenti come genotipi e fenotipi corrispondenti) e
  2. Allenamento senza supervisione (Non sono richiesti esempi precedenti, come la situazione in cui abbiamo solo genotipi).

Alcune delle applicazioni dell'apprendimento automatico nelle scienze animali:

  • Previsione genomica: Uno dei primi tentativi di ML è stato provato con la previsione del genoma. I risultati iniziali mostrano che i metodi ML hanno risultati migliori rispetto ai metodi tradizionali quando l'architettura genetica sottostante era complessa (quando i tratti erano controllati da dominanza e / o epistasi) (Li e al. (2018) Front. Genet. 9: 237).
  • Studi di associazione su tutto il genoma (GWAS): Le pubblicazioni hanno dimostrato che i metodi ML possono essere utilizzati per condurre GWAS. Inoltre, i metodi ML hanno dimostrato di essere più efficienti nell'identificare un sottoinsieme di SNP con un collegamento diretto ai geni candidati (Li e al. (2018) Front. Genet. 9: 237).
  • Imputazione del genotipo: Durante la genotipizzazione, non tutti i marcatori otterranno il genotipo a causa di problemi di qualità e dovremo predire i genotipi dei marcatori mancanti usando un processo chiamato imputazione. Gli studi hanno dimostrato che i metodi ML hanno maggiore accuratezza per l'imputazione di questi genotipi mancanti (Morota et al. (2018) J. Anim. Sci. 96: 1540-1550).
  • Controllo della qualità del fenotipo: I modelli ML hanno dimostrato di avere successo nell'individuare valori anomali nei dati e possono essere applicati per filtrare e modificare i dati prima della valutazione genetica (Morota et al. (2018) J. Anim. Sci. 96: 1540-1550).
  • Analisi delle immagini: I metodi ML possono essere utilizzati per prevedere il peso corporeo dalle immagini della telecamera piuttosto che usare una bilancia, che è laboriosa, richiede molto tempo e causa stress agli animali. Inoltre, questi metodi possono essere utilizzati per prevedere la composizione della carcassa dalle immagini della telecamera online in tempo reale.

A Genesus generiamo grandi quantità di dati dalle singole macchine di assunzione di mangime, carcassa e programmi di qualità del maiale che risalgono a più di 20 anni, e dalla genotipizzazione di molti candidati alla selezione a settimana. Questi ampi dati possono essere classificati nella categoria dei big data e sono stati parte integrante del nostro regolare programma di valutazione genetica, insieme alla nostra crescita di routine e ai fenotipi riproduttivi.

Attualmente, stiamo studiando approcci ML predittivi per analizzare questi dati in modo più efficiente. Tutti questi passaggi aiuteranno ad aumentare il tasso di miglioramento genetico e alla fine andranno a beneficio dei clienti Genesus.

Condividi questo...
Condividi su LinkedIn
LinkedIn
Condividi su Facebook
Facebook
Tweet su questo su Twitter
Twitter

Categorizzato in: ,

Questo post è stato scritto da Genesus