[科技日報]我超級稻基因組數(shù)據(jù)從“云端”向全球共享
“我們的3000份綠色超級稻基因組原始測序數(shù)據(jù),覆蓋了全球25萬份種質(zhì)基因全部遺傳變異的95%。這份核心數(shù)據(jù),將正式通過阿里云平臺,向全球免費開放?!?月15日,中國農(nóng)業(yè)科學院、阿里云計算有限公司、華智水稻生物技術(shù)有限公司、北京聚道科技有限公司在長沙共同啟動“云之稻項目”,中國農(nóng)科院農(nóng)作物基因資源與基因改良國家重大科學工程首席科學家黎志康如是告訴科技日報記者。
3000份水稻核心種質(zhì)基因組測序數(shù)據(jù),是科技部和比爾·梅琳達蓋茨基金會“為非洲和亞洲資源貧瘠地區(qū)培育綠色超級稻”重大科技專項的重要課題成果,這也是迄今為止全世界最大的植物基因組測序項目。項目旨在培育能夠廣泛適用于灌溉和雨養(yǎng)地區(qū)生態(tài)環(huán)境,并具氮磷高效利用、抗病、抗蟲、高產(chǎn)、優(yōu)質(zhì)、抗逆(干旱、鹽堿)等特性的水稻新品種,在目標國示范推廣,推動雜交稻種子生產(chǎn)能力,并為撒哈拉以南非洲國家、亞洲和中國的西南地區(qū)水稻分子育種建立一個高效水稻基因型分析技術(shù)平臺。
3000份水稻核心種質(zhì)基因組測序數(shù)據(jù)能做什么?
為水稻核心種質(zhì)做基因組測序,是一項龐大工程。黎志康領(lǐng)銜的團隊,耗費了兩年半的時間,才獲得這3000份水稻核心種質(zhì)基因組測序數(shù)據(jù)。一位超級稻科研工作者接受科技日報記者采訪時表示,該基因數(shù)據(jù)庫資源,至少有兩方面用途,一是從基因庫調(diào)取數(shù)據(jù),研究目標基因的分布、進化和功能。二是可分析基因組之間的多態(tài)性位點,并以之開發(fā)分子標記,甚至是基因芯片,用于分子育種。
黎志康認為,通過對3000份水稻核心種質(zhì)基因組測序分析,能夠回答水稻有多少遺傳多樣性可以應用,從哪里獲取生物育種所需遺傳資源的問題,分析得到的數(shù)據(jù)將為水稻基礎(chǔ)認識和生物育種提供基礎(chǔ)信息資源。這項研究可揭示全球栽培稻資源的基因組多樣性,和每個水稻資源的遺傳特點及應用價值。此外,將3000份水稻種質(zhì)資源帶入水稻育種應用中,將為水稻育種創(chuàng)新提供材料和新思路,對數(shù)據(jù)的分析結(jié)果還將填補人們對水稻甚至各個物種在基因組學方面的知識空缺。
“基因組大數(shù)據(jù)是水稻分子育種的基礎(chǔ)。我們正承擔有建設(shè)國家水稻分子育種大平臺的任務(wù),也希望通過對3000份水稻基因組序列進行深度分析,重點挖掘出水稻種質(zhì)資源的重要遺傳區(qū)段,為種業(yè)公司提供優(yōu)質(zhì)的分子標記開發(fā),全基因組關(guān)聯(lián)分析和優(yōu)良農(nóng)藝性狀定位等種業(yè)高科技服務(wù)?!比A智水稻生物技術(shù)有限公司總經(jīng)理張健說。
四方聯(lián)袂擬打造最全“水稻功能基因組和育種信息數(shù)據(jù)庫”
3000份水稻基因組測序項目分析得到的數(shù)據(jù)量將達到幾百TB,處理如此大規(guī)模的基因組數(shù)據(jù),科研機構(gòu)要具備相應存儲和計算能力既不現(xiàn)實,也會造成重復配置資源。為此,四方機構(gòu)共同啟動“云之稻項目”,協(xié)議將3000份水稻種質(zhì)資源基因組測序數(shù)據(jù)通過阿里云平臺,無償向全球共享數(shù)據(jù),項目組還擬建立最全“水稻功能基因組和育種信息數(shù)據(jù)庫”,為基礎(chǔ)研究和育種應用提供可供參考的重要信息。這不僅有利于加快規(guī)?;l(fā)掘水稻優(yōu)良基因,突破水稻復雜性狀分子改良的技術(shù)瓶頸,還能加快高產(chǎn)、優(yōu)質(zhì)、廣適性新品種培育的進程,全面提升我國及全球水稻基因組研究和分子育種水平。
水稻基因數(shù)據(jù)公益云平臺構(gòu)建于阿里云的對象存儲服務(wù)和批量計算服務(wù)之上。阿里云對象存儲服務(wù)(OSS),是阿里云自主研發(fā)的分布式存儲系統(tǒng),具海量存儲空間和幾乎無限的擴容能力,能通過多重數(shù)據(jù)冗余備份和自動故障恢復機制保證數(shù)據(jù)安全。通過OSS提供的免費存儲和下載服務(wù),云之稻項目的水稻基因組數(shù)據(jù)可以隨時為全球科學家所用。同時,阿里云批量計算服務(wù)是專門針對基因數(shù)據(jù)分析等計算密集型應用設(shè)計的分布式云服務(wù),其自動的資源管理、靈活的任務(wù)調(diào)度和工作流支持,可大大簡化在云上搭建水稻基因分析平臺的過程。
基因大數(shù)據(jù)的分析處理必須面對很多難題,比如海量數(shù)據(jù)傳輸,數(shù)據(jù)安全和權(quán)限隔離,數(shù)據(jù)調(diào)度和處理如何簡潔高效,以及如何尋找穩(wěn)定可靠且低成本的存儲資源等。聚道科技開發(fā)了GeneDock基因數(shù)據(jù)云服務(wù)平臺,針對基因數(shù)據(jù)格式使用獨特壓縮算法,大大降低數(shù)據(jù)存儲和傳輸成本,研發(fā)了行業(yè)一流的分布式調(diào)度和執(zhí)行引擎,大大提高任務(wù)運行速度,降低運行成本。用戶在云之稻下載數(shù)據(jù),可直接在云端對3000份水稻核心種質(zhì)基因組數(shù)據(jù)進行分析挖掘。
項目目前已經(jīng)對用戶免費開放,后期還將陸續(xù)推出新的分析工具,方便科研工作者深入分析水稻基因組數(shù)據(jù)?!昂蠡蚪M時代,這個項目還將結(jié)合功能基因組學新的方法和策略進行生物育種,貢獻于糧食安全和食品健康的發(fā)展。我希望全球水稻研究同行,能充分利用這一平臺,也希望國家有關(guān)部門能給予關(guān)注和扶持,促進生物大數(shù)據(jù)行業(yè)的快速發(fā)展?!崩柚究嫡f。
- [工人日報]我國科學家破譯油菜害蟲西北斑芫菁染色體水平基因組2025-04-25
- [新京報]177.65公斤 新品種刷新我國三熟制模式下油菜單產(chǎn)紀錄2025-04-25
- 奶牛瘤胃微生物優(yōu)勢脲酶結(jié)構(gòu)與綠色脲酶抑制劑2025-04-25
- 蛋白乙?;揎椪{(diào)控大口黑鱸肝臟炎癥和纖維化進程2025-04-25
- 陸地棉與海島棉葉片細胞類型的保守與分歧2025-04-25
- 能調(diào)控水稻粒重的新基因“鯤鵬”2025-04-25
- 楊振海走進樹人講堂 為研究生作專題講座2025-04-25
- 納米尺度“破譯”鎘與吸附材料間的相互作用2025-04-25
- 核酸標準物質(zhì)新進展2025-04-25
- 抗病毒基因的敲除可提高植物病毒載體介導的蛋白表達2025-04-25