幾年前,當小希孟和志凱梁首次提出這個想法時,詹姆斯·施納布爾對此表示懷疑。 至少可以說。
“'好吧,你可以試試,但我認為它不會奏效,'”農學和園藝學副教授回憶說,當時是內布拉斯加大學林肯分校 Schnable 實驗室的博士後研究人員孟和梁。
他錯了,事後看來,他永遠不會快樂。 然而當時,Schnable 有充分的理由揚起眉毛。 兩人的想法 - 屈服於嚴霜的對寒冷敏感的作物的 DNA 序列可以幫助預測更狂野、更耐寒的植物如何忍受冰凍條件 - 似乎大膽。 至少可以說。 儘管如此,這是一個低風險、高回報的提議。 因為如果孟和樑能夠讓它發揮作用,它可能只是加快努力,使對冷敏感的作物有點甚至更像他們的抗寒作物。
世界上一些最重要的作物是在熱帶地區馴化的——墨西哥南部的玉米,非洲東部的高粱——沒有對它們施加選擇壓力來進化抵禦寒冷或凍結的能力。 當這些作物在更惡劣的氣候下生長時,它們對寒冷的敏感性限制了它們可以種植的時間和收穫的時間。 較短的生長季節意味著光合作用的時間較短,導致預計到 10 年將接近 2050 億的全球人口的產量和糧食減少。
寒冷氣候
與此同時,已經在寒冷氣候中生長的植物物種進化出了抵禦寒冷的技巧。 他們可以重新配置細胞膜以在較低溫度下保持流動性,防止細胞膜凍結和破裂。 他們可以在這些膜內部和周圍的液體中加入少量的糖,降低它們的冰點,就像鹽對人行道的冰點一樣。 它們甚至可以產生蛋白質,在這些晶體長成破壞細胞的團塊之前,這些蛋白質會扼殺微小的冰晶。
所有這些防禦都起源於基因水平,儘管不僅僅是 DNA 序列本身。 當植物開始凍結時,它們可以通過關閉或打開某些基因來做出反應——阻止或允許轉錄和執行它們的基因指導手冊。 了解哪些基因耐寒植物在冰凍溫度下關閉和開啟,可以幫助研究人員掌握其防禦工事的基礎,並最終將類似的防禦設計到對冷敏感的作物中。
但施納布爾也知道,正如孟和梁所做的那樣,即使是相同的基因,在不同的植物物種中,即使是密切相關的物種,對寒冷的反應也往往不同。 這意味著,令人沮喪的是,了解基因如何在一個物種中對寒冷做出反應往往會告訴植物科學家幾乎沒有關於該基因在另一個物種中的行為的結論。 反過來,這種不可預測性阻礙了學習決定什麼將停用或激活基因的規則的努力。
“我們仍然非常非常不擅長理解基因為什麼會關閉和開啟,”Schnable 說。
玉米植物
由於缺乏規則手冊,研究人員轉向機器學習,這是一種基本上可以自己編寫的人工智能形式。 他們專門開發了一個有監督的分類模型——當展示足夠多的標記圖像時,比如貓和非貓,這種模型可以最終學會區分前者和後者。 該團隊最初展示了自己的模型,其中包含大量來自玉米的測序基因,以及當植物處於冰凍溫度時這些基因的平均活性水平。 Schnable 說,該模型還為每個玉米基因輸入了“我們能想到的每一個特徵”,包括它的長度、穩定性以及它與在其他玉米植物中發現的其他版本之間的任何差異。
後來,研究人員通過在這些基因的一個子集中僅隱藏一條信息來測試他們的模型:它們是否對冰凍溫度的開始做出反應,或者它們是否沒有反應。 通過分析被告知有響應或無響應的基因特徵,該模型識別出這些特徵的哪些組合與每個基因相關——然後成功地將大部分剩餘的神秘盒基因歸入正確的類別。
毫無疑問,這是一個充滿希望的開始。 但真正的考驗仍然存在:該模型能否接受它在一個物種中接受的訓練並將其應用於另一個物種?
答案是肯定的。 在僅使用來自六種物種中的一種——玉米、高粱、珍珠粟、黍、穀子或柳枝稷——的 DNA 數據進行訓練後,該模型通常能夠預測其他五種中的哪些基因會對冷凍做出反應。 令 Schnable 驚訝的是,該模型即使在對冷敏感的物種(玉米、高粱、珍珠或小米)進行訓練時也能成立,但其任務是預測耐寒粟或柳枝稷的基因反應。
型號
“我們訓練的模型在不同物種間的效果幾乎一樣好,就好像你真的有一個物種的數據並使用內部數據對同一物種進行預測一樣,”他說,幾個月後他的聲音中帶著一絲好奇。 “我真的沒有預料到這一點。”
“我們可以將所有這些信息輸入計算機,並且它至少可以找出一些規則來做出有效的預測的想法,對我來說仍然有點令人驚訝。”
在考慮替代方案時,這些預測可能特別有用。 大約十年來,植物生物學家實際上已經能夠測量活植物中每個基因產生的 RNA 分子的數量——負責轉錄和運輸 DNA 指令的分子。 Schnable 說,但是比較活體標本和多個物種中基因表達對寒冷的反應是一項艱鉅的任務。 對於野生植物來說尤其如此,它們的種子甚至很難獲得。 這些種子可能不會按預期發芽(如果有的話),並且可能需要數年時間才能生長。 即使他們這樣做了,每株植物都必須在相同的受控環境中種植,並在相同的發育階段進行研究。
更多種類
所有這些都對從足夠多的野生物種中培育出足夠多的野生標本來複製和統計評估其基因對寒冷的反應構成了巨大挑戰。
“如果我們真的想了解哪些基因是重要的——這實際上在植物如何適應寒冷中發揮作用——我們需要研究兩個以上的物種,”施納布爾說。 “我們想看看一組耐寒的物種和一組敏感的物種,並觀察模式:“這個相同的基因總是對一個有反應,而對另一個沒有反應。”
“這開始成為一項非常龐大且昂貴的實驗。 如果我們能從這些物種的 DNA 序列中做出預測,而不是,例如,選取 20 個物種,並試圖讓所有物種處於同一階段,讓它們都經歷完全相同的壓力處理,那就太好了,並且測量每個物種中每個基因產生的 RNA 量。”
幸運的是,該模型的研究人員已經對 300 多種植物物種的基因組進行了測序。 正在進行的國際努力可能會在未來幾年內將這一數字推高至 10,000。
儘管該模型已經大大超出了他的適度預期,但 Schnable 表示,下一步將涉及“說服我們自己和其他人”,相信它的效果與目前一樣好。 在迄今為止的每個測試案例中,研究人員都要求模型告訴他們他們已經知道的事情。 他說,當人類和機器都從頭開始時,最終的考驗就會到來。
“我認為我們需要做的下一個大實驗是對我們根本沒有任何數據的物種進行預測,”他說。 “讓人們相信它在我們也不知道答案的情況下確實有效。”
該團隊在美國國家科學院院刊上報告了他們的發現。 Meng、Liang 和 Schnable 與內布拉斯加州的 Rebecca Roston、Yang Zhang、Samira Mahboub 和本科生 Daniel Ngu 以及山東農業大學的訪問學者 Xiuru Dai 共同撰寫了這項研究。
欲了解更多信息,請訪問:
內布拉斯加大學林肯分校
www.unl.edu