董莎萌:用大数据“治疗”马铃薯癌症

2019-10-30 14:24:03 来源: 科技日报 作者: 金凤

金凤

“太惨了,马铃薯叶子和茎秆上布满了病斑,约2000亩的农田可能颗粒无收,罪魁祸首就是晚疫病,该病又被称为马铃薯癌症。”前不久,贵州省贵阳市息烽县南挢村马铃薯田的“遭遇”,让董莎萌十分忧心。

为缓解“疫情”,这位南京农业大学植物保护学院教授、博士生导师和他的学生连夜对“患病”马铃薯进行采样分析,破解了致病菌的基因组,并筛选出两款抗病性较好的马铃薯,推荐给当地农民。“明年,那里的农民就可以种这些抗病品种了。”董莎萌说。

这只是董莎萌接手的众多“病例”之一。38岁的董莎萌像一位植保界的“外科医生”,“追”着疫情跑遍全国的马铃薯晚疫病疫区;他又像一位植保界的“码农”,开发出马铃薯晚疫病大数据监控系统,研究我国晚疫病发病与流行规律。

日前,董莎萌在国际上首次在三维水平,对海量作物病菌信息实现了提取、运算与分析,并对病菌的致病型进行了高精度预测和模拟。

死磕3年绘成基因组图谱

打开南京农业大学马铃薯晚疫病卵菌菌株生化培养箱,一个个布满菌丝的培养皿映入眼帘。在这个资源库里,保存着450多份具有代表性的晚疫病菌株,这是董莎萌所在团队用12年收集来的。它们有的来自英国、荷兰、法国,有的则来自我国黑龙江、福建、安徽、贵州等马铃薯主产区。

“中国的马铃薯产量世界第一,且国家推行了马铃薯主粮化战略,而晚疫病是马铃薯的头号‘杀手’,若弄清了我国晚疫病的发病与流行的规律,就可让农民少打农药,指导他们精准选育、丰产丰收了。”穿着白大褂,行走在实验室里的董莎萌脚步飞快。

由于对晚疫病的原有认知不足,研究工具又很有限,至今我国学者对晚疫病的致病和成灾机制,还不是十分清楚。但2017年夏天的一个夜晚,董莎萌迎来了高光时刻。

那晚10点多,董莎萌和学生绘制的国际首个三维晚疫病表观基因组图谱问世。此前,他们就此研究了近3年。

这张图谱,源于董莎萌2014年开始设计集成的一款晚疫病基因组的三维大数据监控系统。“以往国内外科研人员分析晚疫病菌脱氧核糖核酸(DNA)时,只能以二维视角监测基因序列是否发生变异。但三维系统,能看到每个基因序列的空间和结构信息。”他说。

跨越生物学和计算科学两个领域进行研究,这曾一度让董莎萌陷入至暗时刻。“2015年前后,我感到非常痛苦,团队都是做生物研究的,而进行大数据分析需要懂算法。”董莎萌说。

为恶补算法短板,董莎萌开启“学霸模式”,每天十几个小时泡在实验室,一边自学编程、算法,一边四处给专家、同行写信求助,“但吃了不少闭门羹”。即便到了半夜12点,董莎萌办公室的灯还常亮着。

最终,他将传统计算机20多天才能完成的晚疫病致病型数据分析,压缩到了2天。如今,实验室的数据库里,已存储了70余张我国菌株的2维基因组图谱,三维的晚疫病菌表观基因组图谱已增至15张。

一听说有疫情就奔赴疫区

户外鞋、冲锋衣、GPS定位仪、大量的采样袋……这些东西堆满了董莎萌的办公室。一旦听说哪里出现晚疫病疫情,他带着这些“神器”,说走就走。

“我们赶病害的,拖拖拉拉就可能错过最佳采样时机了。”有一次,他上午10点接到电话,下午4点就出现在安徽省界首市的地头上。

在我国,马铃薯晚疫病的发病率接近40%,由此每年造成的损失超过70亿元。晚疫病,已日渐成为制约我国马铃薯产业发展的主要瓶颈。

这些年,为了采集尽可能多的菌株,董莎萌先后来到黑龙江、内蒙古、福建、安徽、云南、贵州、重庆、陕西、甘肃、宁夏、浙江等马铃薯产区。

晚疫病病情暴发的疫区,大多分布在山沟里。有一次,董莎萌带着学生去宁夏省固原市采样,下了飞机赶大巴再挤农机车,跟鸡鸭挤在一起,折腾了快两天,最终才抵达晚疫病疫区。

更糟糕的情况是,采集到的晚疫病菌株未能被分离成功,采集结果无一有效。今年5月在湖南,团队上下连续4天进行田间采样,可最终还是失败了。

“遇到不顺,只能硬扛。”无助的时候,董莎萌说,自己会独自一人去操场上散步减压,“最痛苦的一次,从下午4点走到晚上9点,脑中不停地分析失败的原因”。

脆弱的一面,董莎萌会小心“藏”好,在学生眼中,“董老师总是充满热情,只要他认准的事,就会坚持到底”。最让大家津津乐道的,就是他曾历时4年、辗转30多家机构,找到2008年导致我国西南地区马铃薯晚疫病暴发的菌株样本。

责任编辑: 张爽(实习)