全球科學家聯手打造—全新基因功能知識庫正式上線
近日,由Gene Ontology Consortium推出的一項全新資源正式問世,這是一部匯集所有人類蛋白質編碼基因已知功能的綜合性百科全書,並已在全新網站上公開。這項資源首次結合了來自南加州大學凱克醫學院、瑞士生物資訊學研究所等多家機構的研究力量,利用大規模的進化模型,將人類基因資料與其他生物體收集的遺傳數據整合在一起,最終建立起一個可搜尋的公共資源,詳盡記錄了超過2萬個基因的功能,並採用了目前最精確、最完整的證據支持。
據悉,相關研究成果已在《Nature》期刊上發表。Gene Ontology Consortium是一個由美國國家衛生研究院資助的知識庫,該知識庫經過超過25年的不斷擴充與完善,已成為生物醫學研究中不可或缺的工具,每年在超過3萬篇論文中被廣泛引用,協助科學家進行數據分析與解釋。

在生物醫學領域,進行「組學」實驗(例如大規模DNA、RNA、蛋白質及其他生物分子研究)的研究人員往往會在研究中鎖定數百個基因。例如,研究人員可能會發現與癌症細胞相比,健康細胞中某些基因處於開啟或關閉狀態。面對成千上萬篇論文中關於各基因功能的描述,直接逐篇查閱顯然不切實際,因此,科學家們紛紛轉向Gene Ontology Consortium這一權威知識庫。
全球協作與知識整合 進化模型賦能下的新資源
此次里程碑式的進展推出了一項名為「PAN-GO functionome」的新資源,該資源透過進化模型技術進一步提升了Gene Ontology Consortium的應用效能。這一方法不僅整合了來自人類基因的實驗數據,還結合了來自小鼠、斑馬魚等模式生物的相關基因資料,從而繪製出一幅更為全面的人類基因功能圖譜,特別是在直接來自人類研究證據不足的領域填補了知識空白。
該新資源由來自全球超過150位生物學家共同編撰,其中包括南加州大學凱克醫學院的研究團隊。自1998年以來,該團隊已經細致地審閱了超過175,000篇關於基因功能的科學論文,從中收集了有關各種模式生物以及人類基因,尤其是那超過2萬個蛋白質編碼基因的數據。研究團隊根據基因各自或協同執行的生物學功能,從自行建立的涵蓋細胞分裂、細胞信號傳遞、免疫反應、分子運輸等超過4萬種功能的目錄中,對每個基因進行了分類。這種對基因功能的精確劃分,有助於揭示癌症等疾病的病理機制,並為設計針對性治療策略提供科學依據。
「PAN-GO functionome」將與現有的基因本體論知識庫一同,供科學家們在進行組學數據分析等多種應用中使用,但由於整合了大規模進化模型的最新成果,其分析結果將更加準確。很多情況下,儘管人類基因的實驗數據不足,但模式生物如小鼠、大鼠、斑馬魚、果蠅、酵母或大腸桿菌等已進行了深入研究。通過解析這些生物中具體功能(如能量處理或細胞信號傳遞)的進化歷程,研究人員便能推斷出人類基因的功能特性,即便缺乏直接的人類實驗證據。
知識庫的未來與廣泛應用
展望未來,Gene Ontology Consortium聯盟呼籲全球研究者在數據分析中廣泛採用「PAN-GO functionome」資源。該資訊以機器可讀格式呈現,方便科學家運用人工智慧等計算工具進行快速檢索和數據利用。此外,聯盟也向全體研究者發出邀請,鼓勵大家透過項目網站提交對特定基因知識庫更新的建議。這種群眾外包式的知識共享和結構化分類,將確保這一公共資源在未來持續改進,並使其應用成果更加直觀便捷。
儘管「PAN-GO functionome」目前已覆蓋82%的蛋白質編碼基因,但仍有約18%(大約3,600個基因)的實驗數據尚未獲得,這部分基因的生物學功能依然未知。
該研究由來自南加州大學凱克醫學院、瑞士生物資訊學研究所以及加州柏克萊勞倫斯國家實驗室的多位專家共同參與,並匯集了來自全球約50個機構的超過150位貢獻者。這一全球協作的成果,不僅標誌著人類對基因功能理解的一大躍進,也為未來的生物醫學研究提供了堅實的數據基礎與創新工具。
回應文章建議規則: