ข้อมูลขนาดใหญ่และการเรียนรู้ของเครื่องในการปรับปรุงพันธุ์สัตว์

 Dinesh Thekkoot ปริญญาเอก Genesus Inc

การเรียนรู้ด้วยเครื่องจักร (ML) เป็นคำที่โด่งดังในช่วงไม่กี่ปีที่ผ่านมา ML เป็นสาขาย่อยของปัญญาประดิษฐ์ (AI) ที่ทุ่มเทให้กับการศึกษาอัลกอริทึมในการทำนายผลลัพธ์ อย่างรู้เท่าทันหรือโดยไม่รู้ตัวเราขึ้นอยู่กับ ML อย่างมากในชีวิตประจำวันของเรา

ผู้ช่วยส่วนตัวเสมือนเช่น Siri, Alexa และ Google Now ฟีดข่าวส่วนบุคคลในโซเชียลมีเดียของเราคำแนะนำเพื่อนที่เราเห็นในฟีด Facebook สแปมอีเมลและการกรองมัลแวร์การคาดการณ์ปริมาณการจราจรที่เราเห็นบน GPS ของเราเป็นต้น บริการ / เทคโนโลยีบางอย่างที่เราใช้เป็นประจำซึ่งยึดตามอัลกอริธึม ML

แม้ว่า ML จะมีบทบาทสำคัญอย่างยิ่งในชีวิตประจำวันของเราการประยุกต์ใช้เทคโนโลยีนี้ในการปรับปรุงพันธุ์สัตว์ / การผลิตยังอยู่ในช่วงวัยทารก การพัฒนาล่าสุดในเทคโนโลยีที่ทันสมัยเช่นระบบการให้อาหารอัตโนมัติและการชั่งน้ำหนัก, การถ่ายภาพดิจิตอล, จีโนไทป์ขนาดใหญ่ ฯลฯ ทำให้เกษตรกรผู้เพาะพันธุ์และอุตสาหกรรมที่เกี่ยวข้องสามารถตรวจสอบและรวบรวมข้อมูลจำนวนมาก (ข้อมูลขนาดใหญ่) ในระดับสัตว์ที่ ค่าใช้จ่ายที่เหมาะสม

จำนวนแถวและคอลัมน์ในข้อมูลขนาดใหญ่นี้มักมีขนาดใหญ่จนเป็นการยากที่จะเห็นภาพนี้โดยใช้โปรแกรมคอมพิวเตอร์ทั่วไป นอกจากนี้ในกรณีส่วนใหญ่ข้อมูลนี้อาจไม่“ สะอาด” เสมอไปเพราะอาจมีค่าที่ขาดหายไปค่าผิดปกติและจุดข้อมูลที่ไม่ต้องการ

อีกประเด็นคือปริมาณข้อมูลต่อสัตว์ในกรณีของการประเมินทางพันธุกรรม วิธีการวิเคราะห์ข้อมูลปัจจุบันส่วนใหญ่สันนิษฐานว่าจำนวนข้อมูลต่อสัตว์ไม่ใหญ่ ตัวอย่างเช่นสมมติว่าเรามีแม่สุกร 500 แต่ละแม่สุกรจะมีระเบียนครอกน้อยและมีบันทึกการเติบโตเพียงเล็กน้อยนั่นคือเรามีแม่พันธุ์ 500 ที่มีจุดข้อมูล 10 หรือ 15 สำหรับแต่ละแม่สุกร อย่างไรก็ตามเทคโนโลยีการรวบรวมข้อมูลที่ได้รับการปรับปรุงในแม่สุกรแต่ละตัวของ 500 เราอาจมีข้อมูลทางพันธุกรรมมากกว่า 50,000 ชิ้นบันทึกการป้อนฟีดให้นมบุตรหลายพันครั้งและมาตรการวัดสภาพแวดล้อมในห้องคลอดหลายพันครั้งเช่นอุณหภูมิและความชื้นที่บันทึกไว้ทุกนาที ดังนั้นแม่สุกร 5 คนเดียวกันจะมีข้อมูลเป็นพัน (หรือหลายล้าน) วิธีการทางสถิติจำนวนมากได้รับการพัฒนาเพื่อแก้ไขปัญหานี้ แต่พวกเขาต้องการทรัพยากรคอมพิวเตอร์จำนวนมาก ML ได้รับการพิสูจน์แล้วว่าเป็นวิธีที่มีประสิทธิภาพในการแก้ไขปัญหาเหล่านี้ทั้งหมด

การเรียนรู้จากข้อมูลเป็นหลักการสำคัญของการเรียนรู้ของเครื่องและมีเป้าหมายที่จะเลือกจากรูปแบบการวิเคราะห์ข้อมูลขนาดใหญ่ซึ่งสามารถทำนายผลลัพธ์ได้อย่างแม่นยำที่สุด ส่วนนี้เรียกว่ากระบวนการฝึกอบรมและมีการฝึกอบรมสองประเภท:

การฝึกอบรมภายใต้การดูแล (เครื่องจักรเรียนรู้จากตัวอย่างที่มีอยู่เช่นจีโนไทป์และฟีโนไทป์ที่เกี่ยวข้อง) และ
การฝึกอบรมที่ไม่มีผู้ดูแล (ไม่จำเป็นต้องมีตัวอย่างก่อนหน้าเช่นสถานการณ์ที่เรามีจีโนไทป์เท่านั้น)

แอปพลิเคชั่นบางส่วนของการเรียนรู้ของเครื่องในวิทยาศาสตร์สัตว์:

การทำนายจีโนม: หนึ่งในความพยายามที่เร็วที่สุดของ ML นั้นได้ถูกพยายามในการทำนายจีโนมที่เปิดใช้งาน ผลลัพธ์เริ่มต้นแสดงให้เห็นว่าวิธี ML นั้นทำได้ดีกว่าวิธีการแบบดั้งเดิมเมื่อสถาปัตยกรรมทางพันธุกรรมพื้นฐานนั้นซับซ้อน (เมื่อลักษณะถูกควบคุมโดยการปกครองและ / หรือ epistasis) (Li et al. (2018) ด้านหน้า Genet. 9: 237)
การศึกษาความสัมพันธ์ของจีโนมกว้าง (GWAS): สิ่งตีพิมพ์แสดงให้เห็นว่าวิธีการ ML สามารถใช้ในการดำเนินการ GWAS นอกจากนี้วิธี ML ได้แสดงให้เห็นว่ามีประสิทธิภาพมากขึ้นในการระบุชุดย่อยของ SNP ที่มีการเชื่อมโยงโดยตรงไปยังยีนของผู้สมัคร (Li et al. (2018) ด้านหน้า) Genet 9: 237)
การใส่ร้ายทางพันธุกรรม: ในขณะที่จีโนไทป์ไม่ใช่ตัวทำเครื่องหมายทั้งหมดที่จะได้รับจีโนไทป์เนื่องจากปัญหาด้านคุณภาพและเราจะต้องทำนายจีโนมเครื่องหมายที่หายไปโดยใช้กระบวนการที่เรียกว่าการใส่ร้าย การศึกษาแสดงให้เห็นว่าวิธี ML มีความแม่นยำสูงกว่าในการใส่จีโนไทป์ที่หายไปเหล่านี้ (Morota และคณะ (2018) J. Anim, Sci. 96: 1540 – 1550)
การตรวจสอบคุณภาพของฟีโนไทป์: โมเดล ML แสดงให้เห็นว่าประสบความสำเร็จในการระบุค่าผิดปกติในข้อมูลและสามารถนำไปใช้กับตัวกรองและแก้ไขข้อมูลก่อนการประเมินทางพันธุกรรม (Morota และคณะ (2018) J. Anim. Sci. 96: 1540 – 1550)
การวิเคราะห์ภาพ: วิธีการ ML สามารถใช้ในการทำนายน้ำหนักของร่างกายจากภาพจากกล้องแทนที่จะใช้เครื่องชั่งน้ำหนักซึ่งใช้งานหนักใช้เวลานานและก่อให้เกิดความเครียดกับสัตว์ นอกจากนี้วิธีการเหล่านี้สามารถใช้ในการทำนายองค์ประกอบซากจากภาพกล้องออนไลน์ในเวลาจริง

ที่ Genesus เราสร้างข้อมูลจำนวนมากจากเครื่องป้อนอาหารแต่ละตัวซากและโปรแกรมคุณภาพหมูที่มีอายุมากกว่า 20 ปีและจากการคัดเลือกผู้ป่วยหลายรายต่อสัปดาห์ ข้อมูลจำนวนมากเหล่านี้สามารถจำแนกได้ภายใต้หมวดหมู่ข้อมูลขนาดใหญ่และเป็นส่วนหนึ่งของโปรแกรมการประเมินทางพันธุกรรมปกติของเราพร้อมกับการเจริญเติบโตตามปกติและฟีโนไทป์ของการสืบพันธุ์

ขณะนี้เราอยู่ในขั้นตอนการตรวจสอบแนวทางการพยากรณ์ ML สำหรับการวิเคราะห์ข้อมูลเหล่านี้ได้อย่างมีประสิทธิภาพมากขึ้น ขั้นตอนทั้งหมดเหล่านี้จะช่วยเพิ่มอัตราการปรับปรุงทางพันธุกรรมและจะเป็นประโยชน์ต่อลูกค้าของ Genesus ในที่สุด

พิมพ์จดหมายข่าว🖨

Facebook

Twitter

จัดหมวดหมู่: ข่าวเด่น, Global Tech

โพสต์นี้เขียนขึ้นโดย Genesus

กำลังโหลด

ข้อมูลขนาดใหญ่และการเรียนรู้ของเครื่องในการปรับปรุงพันธุ์สัตว์

แอปพลิเคชั่นบางส่วนของการเรียนรู้ของเครื่องในวิทยาศาสตร์สัตว์: