農業工作(zuo)促(cu)進(jin)了(le)作(zuo)物產(chan)量增(zeng)加(jia),滿足了(le)糧食(shi)需(xu)求。糧食(shi)產(chan)量提(ti)(ti)高(gao)主要歸(gui)功于(yu)品種遺(yi)傳(chuan)改良(liang)和(he)栽培(pei)管理(li)方法提(ti)(ti)升。作(zuo)物育(yu)種技(ji)術(shu)的發展主要分為四(si)個階段,目前(qian)已(yi)進(jin)入到(dao)第四(si)代的智能(neng)育(yu)種,但全球育(yu)種水(shui)平大部分停留在常規育(yu)種階段。面(mian)對人口增(zeng)長的挑戰(zhan),需(xu)要整合現代的最新技(ji)術(shu),提(ti)(ti)升育(yu)種技(ji)術(shu),進(jin)一步加(jia)快遺(yi)傳(chuan)改良(liang)進(jin)程(cheng)。
2023年12月22日(ri),由華(hua)中農業大(da)學(xue)玉米團(tuan)隊李林教(jiao)授領銜,聯合(he)國內多個研(yan)究團(tuan)隊,在(zai)Molecular Plant在(zai)線發表了(le)題(ti)為The CropGPT project: A call for a global, coordinated effort in precision design breeding driven by AI using biological big-data 的文章(zhang)。該文向全(quan)球發起了(le)開放(fang)、共(gong)享與合(he)作的智(zhi)能(neng)育種倡導——CropGPT,探(tan)討了(le)如何(he)整合(he)現有資源(包括(kuo)種質、生(sheng)物大(da)數據)及人工智(zhi)能(neng)方法、升級現有育種技術,并提出(chu)了(le)可能(neng)的運作流程及潛在(zai)理(li)論基礎。
作(zuo)物產量是(shi)一個(ge)復(fu)雜的(de)(de)(de)性(xing)(xing)狀(zhuang),涉及(ji)復(fu)雜的(de)(de)(de)基(ji)因調(diao)控網絡和(he)品種差異性(xing)(xing)。因此,系(xi)統分(fen)析(xi)基(ji)因的(de)(de)(de)調(diao)控突進(jin),引入平(ping)衡(heng)多(duo)個(ge)性(xing)(xing)狀(zhuang)的(de)(de)(de)最(zui)佳(jia)等位(wei)基(ji)因,是(shi)確(que)保或促進(jin)產量提(ti)高的(de)(de)(de)有效(xiao)途(tu)徑。隨(sui)著(zhu)測(ce)序技術(shu)的(de)(de)(de)發展(zhan),多(duo)種基(ji)因組(zu)學(xue)(xue)數(shu)據可(ke)以與蛋白質組(zu)學(xue)(xue)及(ji)代(dai)謝組(zu)學(xue)(xue)數(shu)據相(xiang)(xiang)結合,系(xi)統地研究(jiu)每個(ge)遺傳層內或不同(tong)遺傳層之間(jian)功能(neng)元件(jian)的(de)(de)(de)相(xiang)(xiang)互作(zuo)用(yong),從而產生(sheng)網絡大數(shu)據(NBD)。人(ren)工智能(neng)和(he)基(ji)因編輯等多(duo)種先進(jin)技術(shu)被用(yong)于NBD 挖掘已有報道。
Generative Pre-trained Transformers(GPT)是一種(zhong)強(qiang)大(da)的(de)(de)(de)(de)(de)(de)語(yu)言模(mo)(mo)(mo)型(xing)(xing)(xing),它們利(li)用(yong)(yong)(yong)轉換器模(mo)(mo)(mo)型(xing)(xing)(xing)(一種(zhong)基(ji)(ji)于自注(zhu)意力(li)機(ji)(ji)制(zhi)的(de)(de)(de)(de)(de)(de)神經(jing)網(wang)絡模(mo)(mo)(mo)型(xing)(xing)(xing))從(cong)廣泛的(de)(de)(de)(de)(de)(de)訓練數(shu)據(ju)中學(xue)習并(bing)生(sheng)成文本。自然(ran)語(yu)言處理(li)(NLP)可用(yong)(yong)(yong)于處理(li)多(duo)模(mo)(mo)(mo)式(shi)輸入如(ru)基(ji)(ji)因組(zu)學(xue)、環境(jing)(jing)參(can)數(shu)、田間(jian)管理(li)及其相(xiang)互作(zuo)(zuo)用(yong)(yong)(yong)。GPT/NLP 的(de)(de)(de)(de)(de)(de)繁榮為通(tong)過增強(qiang)生(sheng)物大(da)數(shu)據(ju)的(de)(de)(de)(de)(de)(de)分(fen)析(xi),進(jin)(jin)行(xing)精準的(de)(de)(de)(de)(de)(de)智(zhi)能(neng)設計育(yu)種(zhong)帶來了希望。因此(ci),該研究論文提(ti)出(chu)CropGPT 新概念,并(bing)向全(quan)球發(fa)起CropGPT 智(zhi)能(neng)設計育(yu)種(zhong)合(he)(he)(he)作(zuo)(zuo)倡(chang)導(dao)。CropGPT 的(de)(de)(de)(de)(de)(de)成功開(kai)發(fa)將需(xu)要(yao)兩(liang)個主要(yao)要(yao)素,一是合(he)(he)(he)作(zuo)(zuo)與整合(he)(he)(he),二是作(zuo)(zuo)物育(yu)種(zhong)的(de)(de)(de)(de)(de)(de)多(duo)模(mo)(mo)(mo)式(shi)GPT。該項目將堅持(chi)開(kai)放、合(he)(he)(he)作(zuo)(zuo)以及共贏的(de)(de)(de)(de)(de)(de)團(tuan)隊育(yu)種(zhong)模(mo)(mo)(mo)式(shi),需(xu)要(yao)育(yu)種(zhong)家(jia)(jia)(jia)(jia)、生(sheng)物學(xue)家(jia)(jia)(jia)(jia)、數(shu)學(xue)家(jia)(jia)(jia)(jia)、計算機(ji)(ji)學(xue)家(jia)(jia)(jia)(jia)、育(yu)種(zhong)公司(si)(si)和生(sheng)物技(ji)(ji)術(shu)(shu)公司(si)(si)之間(jian)的(de)(de)(de)(de)(de)(de)合(he)(he)(he)作(zuo)(zuo)(圖1A)。首(shou)先育(yu)種(zhong)家(jia)(jia)(jia)(jia)提(ti)供(gong)基(ji)(ji)礎(chu)的(de)(de)(de)(de)(de)(de)育(yu)種(zhong)資源,育(yu)種(zhong)公司(si)(si)利(li)用(yong)(yong)(yong)DH 等工程化(hua)技(ji)(ji)術(shu)(shu)構建育(yu)種(zhong)群體。其次,生(sheng)物學(xue)家(jia)(jia)(jia)(jia)利(li)用(yong)(yong)(yong)多(duo)組(zu)學(xue)數(shu)據(ju)構建基(ji)(ji)因網(wang)絡結合(he)(he)(he)AI 技(ji)(ji)術(shu)(shu)鑒定(ding)基(ji)(ji)因-性(xing)狀(zhuang)調控關(guan)系,提(ti)供(gong)大(da)量(liang)與特定(ding)性(xing)狀(zhuang)相(xiang)關(guan)的(de)(de)(de)(de)(de)(de)功能(neng)基(ji)(ji)因集合(he)(he)(he)。此(ci)外靶向基(ji)(ji)因分(fen)型(xing)(xing)(xing)檢(jian)測需(xu)要(yao)提(ti)高標記的(de)(de)(de)(de)(de)(de)有效(xiao)性(xing),高通(tong)量(liang)基(ji)(ji)因分(fen)型(xing)(xing)(xing)(與特定(ding)性(xing)狀(zhuang)相(xiang)關(guan)的(de)(de)(de)(de)(de)(de)基(ji)(ji)因)和表型(xing)(xing)(xing)分(fen)型(xing)(xing)(xing)(種(zhong)群)將通(tong)過生(sheng)物技(ji)(ji)術(shu)(shu)公司(si)(si)的(de)(de)(de)(de)(de)(de)協同努(nu)力(li)進(jin)(jin)行(xing)。然(ran)后(hou),數(shu)學(xue)家(jia)(jia)(jia)(jia)整合(he)(he)(he)基(ji)(ji)因型(xing)(xing)(xing)數(shu)據(ju)、表型(xing)(xing)(xing)數(shu)據(ju)和環境(jing)(jing)因素來開(kai)發(fa)合(he)(he)(he)適(shi)的(de)(de)(de)(de)(de)(de)大(da)數(shu)據(ju)模(mo)(mo)(mo)型(xing)(xing)(xing),而計算機(ji)(ji)學(xue)家(jia)(jia)(jia)(jia)通(tong)過模(mo)(mo)(mo)型(xing)(xing)(xing)預測合(he)(he)(he)適(shi)的(de)(de)(de)(de)(de)(de)組(zu)配(pei)(pei)方(fang)式(shi)并(bing)提(ti)供(gong)建議(yi)。最后(hou)育(yu)種(zhong)家(jia)(jia)(jia)(jia)/生(sheng)物家(jia)(jia)(jia)(jia)根據(ju)育(yu)種(zhong)建議(yi)進(jin)(jin)行(xing)雜交組(zu)合(he)(he)(he)配(pei)(pei)制(zhi)和基(ji)(ji)因編輯,根據(ju)性(xing)狀(zhuang)鑒定(ding)優(you)質材料或(huo)組(zu)合(he)(he)(he)。優(you)質的(de)(de)(de)(de)(de)(de)組(zu)配(pei)(pei)材料可直接進(jin)(jin)行(xing)商業化(hua)應用(yong)(yong)(yong),同時也可以再次加(jia)入基(ji)(ji)礎(chu)種(zhong)質,通(tong)過迭代優(you)化(hua)大(da)數(shu)據(ju)模(mo)(mo)(mo)型(xing)(xing)(xing)。
圖(tu)1 CropGPT智能設計育種架(jia)構
多(duo)(duo)模(mo)式GPT 將開發(fa)(fa)用于作物育種(zhong),數(shu)(shu)學(xue)家將基于大規(gui)模(mo)的(de)育種(zhong)語料庫開發(fa)(fa)合適的(de)育種(zhong)語言(yan)模(mo)型,這是(shi)CropGPT 成功的(de)關鍵(jian)因素。在此基礎(chu)上,研究人(ren)員的(de)目標是(shi)在CropGPT 中開發(fa)(fa)一種(zhong)特征融合方(fang)法,該方(fang)法使用獨立的(de)預訓練(lian)編碼器來處理多(duo)(duo)模(mo)態數(shu)(shu)據,包括表型、環境因素、基因型、多(duo)(duo)組學(xue)數(shu)(shu)據、基因網(wang)絡和(he)文本等(deng),從而(er)統一生命語言(yan)。理想情(qing)況下(xia),神經網(wang)絡和(he)自(zi)監督學(xue)習技術將被整合到CropGPT 中,以實現多(duo)(duo)種(zhong)模(mo)態數(shu)(shu)據和(he)人(ren)類(lei)自(zi)然語言(yan)之間的(de)對齊和(he)翻譯。最終期望CropGPT 能夠(gou)實現自(zi)由文本查詢、多(duo)(duo)模(mo)態輸入,并支(zhi)持不同的(de)下(xia)游任務(圖1B)。
綜(zong)上所(suo)述,CropGPT項目旨在協同應用DH技術、人工智能、基因組編輯、多(duo)組學等(deng)多(duo)種(zhong)(zhong)前沿技術,對(dui)基礎種(zhong)(zhong)質資源進行分析和豐(feng)富(fu),開發最(zui)優(you)生物大數據模型(LLMs/GPT),提高(gao)育種(zhong)(zhong)的精準設計。
—— 原文 ——
Zhu W, Han R, Shang X, et al. [J]. Molecular Plant, 2023, 16: 206-231.
實驗室-溫室-田間(jian)的一體化DH生產(chan)服(fu)(fu)務+基因編輯服(fu)(fu)務+高通(tong)量表型儀器和服(fu)(fu)務方案
北(bei)大(da)荒墾豐種(zhong)業-澤(ze)泉(quan)科(ke)(ke)技生(sheng)物(wu)技術(shu)與表(biao)型(xing)服務中心是(shi)由北(bei)大(da)荒墾豐種(zhong)業股份有限(xian)公司(si)和(he)(he)上海澤(ze)泉(quan)科(ke)(ke)技股份有限(xian)公司(si)共同(tong)建(jian)設(she)的開放式高(gao)通量(liang)植物(wu)基因型(xing)-表(biao)型(xing)-育種(zhong)服務平(ping)(ping)臺(tai)(tai)。中心建(jian)立了基因克隆和(he)(he)載(zai)體平(ping)(ping)臺(tai)(tai)、作物(wu)轉化系(xi)統、基因型(xing)分(fen)析平(ping)(ping)臺(tai)(tai)、表(biao)型(xing)鑒(jian)定(ding)分(fen)析平(ping)(ping)臺(tai)(tai)、數據分(fen)析和(he)(he)利用平(ping)(ping)臺(tai)(tai)等(deng)現代化生(sheng)物(wu)技術(shu)和(he)(he)信息支持平(ping)(ping)臺(tai)(tai),是(shi)定(ding)位于(yu)為植物(wu)科(ke)(ke)研(yan)和(he)(he)作物(wu)育種(zhong)提供植物(wu)基因型(xing)-表(biao)型(xing)-育種(zhong)數據分(fen)析的科(ke)(ke)研(yan)服務平(ping)(ping)臺(tai)(tai)。
為了縮短您(nin)的育(yu)種進程(cheng),提(ti)高您(nin)的育(yu)種成功率,北大荒墾豐種業-澤泉科技生物技術與(yu)表(biao)型服務中心(xin)將為您(nin)提(ti)供DH服務技術流程(cheng)(實驗室-溫室-田間一體化服務)、測序服務、高通量表(biao)型儀器和服務。
實驗室-溫室-田間的一體化DH生(sheng)產服務
單倍(bei)體(ti)產生:父本誘導(dao)系誘導(dao)母本材料,孤雌生殖(zhi),產生單倍(bei)體(ti)種子(幼胚)。
剝(bo)胚及培養(yang):20-60份/皿。置于人(ren)工培養(yang)室(shi)(帶(dai)光照(zhao)層架)或(huo)人(ren)工培養(yang)箱(xiang)中培養(yang)48小時左右。
挑選(xuan):將幼(you)胚在體視(shi)熒(ying)光顯微鏡下(xia)觀(guan)察或者在日光燈(deng)下(xia)觀(guan)察,以(yi)自交系所(suo)得幼(you)胚為對照。因(yin)為雜合(he)二倍(bei)體含有(you)父本基因(yin),所(suo)以(yi)單倍(bei)體有(you)微弱熒(ying)光或無色。
生苗:將挑選的擬(ni)單(dan)倍體直接置于(yu)含有加倍藥(yao)劑(秋水仙(xian)素)的MS培(pei)(pei)(pei)養(yang)(yang)基(ji)上,暗(an)培(pei)(pei)(pei)養(yang)(yang);后轉(zhuan)入(ru)不含加倍藥(yao)劑的MS培(pei)(pei)(pei)養(yang)(yang)基(ji),暗(an)培(pei)(pei)(pei)養(yang)(yang)后光(guang)照(zhao)培(pei)(pei)(pei)養(yang)(yang),待幼苗2葉(xie)一心時(shi)移至(zhi)培(pei)(pei)(pei)養(yang)(yang)瓶中(MS培(pei)(pei)(pei)養(yang)(yang)基(ji))。
煉苗(miao)(miao):將培養瓶中DH系幼苗(miao)(miao)在(zai)4葉一心時移栽(zai)至苗(miao)(miao)缽(bo),在(zai)溫室中煉苗(miao)(miao)。
移栽(zai):待幼(you)苗(miao)5-6葉期移栽(zai)至溫室花盆或大田,待散粉時,及時套袋進行(xing)自交授粉。
收獲:田間收獲和鑒別。如果用采(cai)用花藥(yao)離體培養單倍體的方(fang)法,則(ze)省去觀(guan)察幼胚的步驟,其(qi)余步驟基本相同(tong)。
靶向測(ce)序服務
靶(ba)向(xiang)(xiang)測序技術(shu)主要分為基(ji)(ji)于(yu)(yu)(yu)多重(zhong)PCR的(de)(de)靶(ba)向(xiang)(xiang)基(ji)(ji)因捕獲(huo)技術(shu)(GenoPlexs)和基(ji)(ji)于(yu)(yu)(yu)液相(xiang)探針雜交的(de)(de)靶(ba)向(xiang)(xiang)基(ji)(ji)因捕獲(huo)技術(shu)(GenoBaits)兩種。可完成單樣品50-5000和3000-40000標記(ji)的(de)(de)基(ji)(ji)因型分析(xi),并(bing)達到可設計(ji)區(qu)域(yu)覆蓋度高于(yu)(yu)(yu)95%,擴增(zeng)子(zi)均一性高于(yu)(yu)(yu)90%的(de)(de)捕獲(huo)效率。
高通(tong)量表型儀器和(he)服務(wu)方案
突變(bian)株作(zuo)(zuo)為(wei)育(yu)種(zhong)的(de)(de)(de)主要載體,篩選與鑒(jian)定工作(zuo)(zuo)復(fu)雜(za)而繁重(zhong)(zhong)。高(gao)(gao)通(tong)量表(biao)(biao)(biao)型(xing)(xing)分(fen)(fen)析(xi)設備和(he)熒(ying)光成像系統(tong)都可(ke)服(fu)務(wu)(wu)于突變(bian)株的(de)(de)(de)篩選,具體體現在(zai)對(dui)一些物(wu)理誘變(bian)和(he)化(hua)學誘變(bian)產生(sheng)的(de)(de)(de)突變(bian)群體,定時(shi)觀(guan)察植(zhi)株形態、顏色等(deng)(deng)變(bian)化(hua),可(ke)以(yi)獲(huo)得大量的(de)(de)(de)植(zhi)物(wu)表(biao)(biao)(biao)型(xing)(xing)參(can)數,構建指(zhi)紋圖譜。此外,還可(ke)利用IMAGING-PAM熒(ying)光系統(tong)對(dui)植(zhi)物(wu)幼苗進(jin)行(xing)(xing)光合特(te)性測定,高(gao)(gao)效篩選突變(bian)單(dan)株。隨著植(zhi)物(wu)生(sheng)物(wu)技術和(he)基因工程的(de)(de)(de)發展,細胞(bao)遺(yi)傳(chuan)操(cao)作(zuo)(zuo)與農(nong)(nong)藝性狀改(gai)良顯(xian)得尤為(wei)重(zhong)(zhong)要。細胞(bao)遺(yi)傳(chuan)操(cao)作(zuo)(zuo)之后導致農(nong)(nong)藝性狀例(li)如生(sheng)育(yu)期(qi),株高(gao)(gao),葉面積,果實重(zhong)(zhong)量等(deng)(deng)改(gai)變(bian),均(jun)可(ke)以(yi)通(tong)過(guo)中心服(fu)務(wu)(wu)平(ping)臺(tai)(tai)高(gao)(gao)通(tong)量表(biao)(biao)(biao)型(xing)(xing)平(ping)臺(tai)(tai)進(jin)行(xing)(xing)分(fen)(fen)析(xi)。目前,平(ping)臺(tai)(tai)已(yi)針對(dui)小麥、水(shui)稻、玉(yu)米(mi)、黃瓜、番茄、辣椒(jiao)、楊樹、丹(dan)參(can)、擬(ni)南芥、煙草、蕎(qiao)麥等(deng)(deng)多(duo)種(zhong)植(zhi)物(wu)進(jin)行(xing)(xing)表(biao)(biao)(biao)型(xing)(xing)服(fu)務(wu)(wu),服(fu)務(wu)(wu)內(nei)容涉及(ji)脅迫生(sheng)理,生(sheng)長(chang)(chang)模(mo)型(xing)(xing)構建、生(sheng)長(chang)(chang)勢評價(jia)等(deng)(deng)領域(yu)。
如(ru)您(nin)需要(yao)了解更多信息,請識別下方二維碼(ma)填寫(xie)登(deng)記表,我們會為您(nin)提供專業(ye)的服(fu)務,真(zhen)誠期待與您(nin)的合作(zuo)!
電話:
郵箱: