随着致命性新冠病毒在全球范围内的持续扩散,科学家们正利用基因测序加开源软件工具跟踪其具体传播路径。
这款名为Nextstrain的软件工具虽然无法确切预测病毒的下一步蔓延,但却能够及时提醒我们新的病例来自何处。对于全球各地的卫生官员来说,这类信息可谓至关重要。只要快速发现新病例,他们就能及时跟进,了解这些病例源自境外抑或是本地传播。
Nextstarin项目成员、计算科学家James Hadfield表示,这种基因组流行病学分析“对于公共卫生而言极具价值。这类数据的处理时间越早,后续响应补救措施的效果就越好。”
此番导致严重呼吸系统疾病的COVID-19新型冠状病毒于去年12月首次出现在中国,随后快速感染80000余人。截至目前,新冠病毒已经传播至趤85个国家/地区,且韩国、伊朗与意大利的发病率最高。到本文撰稿时,美国也已经确认超过250起病例。
随着新病例的出现,确定病毒来源就变得非常重要,特别是明确感染者来自本地、还是在其他地区感染到病毒。在准确把握这部分信息之后,公共卫生官员即可立足出行限制、学校停课、疑似病例隔离以及防疫资源分配等层面做出明智决策。
利用基因测序技术为冠状病毒“画像”
基因组分析能够帮助我们找到揭示病毒起源的线索。在本次疫情爆发期间,病毒的遗传密码会随着传播过程不断发生稳定突变。但每一次突变往往影响不大,只表现为基因中的单一碱基变换——例如由ATC变化为ATTC。着眼于突变,我们能够在一定程度上把握病毒的传播时间与地理轨迹。(目前尚无证据证明这种突变已经对新冠病毒的生物活性造成影响。)
通过比较全球范围内采集到病毒样本基因,新型工具即可绘制出病毒在世界各地传播时所发生的突变图谱。Nextstrain的意义也正在于此。Hafield指出,“我们伪造这些自然发生的基因突变,协助生成与病毒传播相关的可视化信息。”
Nextstrain绘制的病毒图谱涵盖病毒家谱以及进化时间表。对于此次新冠病毒,其家谱起源于中国武汉市,并在此后不断衍生分支。当新病例出现时,Nextstrain可以将新病毒样本的基因与数据库内的原有基因进行比较,借此确定其起源区域。
例如,美国的研究人员已经从加利福尼亚州出现的8起病例中读取或测得冠状病毒基因组序列。Hafield指出,其中至少6例在遗传学层面存在差异,因此证明这些病例由美国之外传播入境。
Hafield解释道,“从基因组数据角度来看,此次调查中至少有6例病毒毒株由境外传入加利福尼亚。当然,这并不是说加利福尼亚州内就不存在任何本地传播,只是当前的基因组数据还无法证实这一点。”
西雅图地区传播的冠状病毒
相比之下,根据Nextstrain的分析,西雅图地区已经成为病毒的传播温床。该软件比较了两起病例,其一采样自今年1月中旬,其二则采样自今年2月下旬,且全部发生在西雅图附近的斯诺霍米什县。由于这些病毒存在遗传相似性,因此可以证明属于本地传播。
弗雷德哈钦森癌症研究中心研究员Trevor Bedford是Nextstrain项目的参与者,他表示在以上两起病例发现间隔的六周之内,病毒很可能已经在本地社区间进行大范围传播。他预计单西雅图区域一地就存在约600名潜在感染者,而预计感染者上限可能多达1500人。(大多数新冠病毒病例的发病症状比较轻微,感染者很可能不会前往医院就诊。)
当然,Nextstrain的成功也高度依赖于科学家们对病毒样本的努力测序,特别是将测序结果发布至可免费访问的网站之上。到目前为止,全球研究人员都在积极发布自己的测序发现。Hadfield表示,大多数从业者都会将测序数据上传至公开访问的GISAID库当中。感谢整个社区的贡献,Nextstrain团队得以在这里找到软件开发所必需的宝贵数据。
然而,在资源相对有限的区域,科学家可能拿不到进行此类分析所需要的实验室工具或者培训素材。为此,一支名为ARTIC Network的小组正在提供协议与培训资源,帮助全球科学家顺利完成疾病监测与基因测序。他们还开发出“案例实验室”,引导用户轻松将资源部署至远程位置。
上周,巴西也传出令人振奋的成功故事。在不到48小时之内,研究人员即从圣保罗的一位病患身上收集到新冠病毒样本,利用ARTIC协议对病毒基因组完成测序,并将数据共享至GISAID库。科学家们在这里使用的基因组测序工具为MinION。
好文章,需要你的鼓励
OpenAI团队的最新研究揭示了大语言模型产生幻觉的根本原因:AI就像面临难题的学生,宁愿猜测也不愿承认无知。研究发现,即使训练数据完全正确,统计学原理也会导致AI产生错误信息。更重要的是,现有评估体系惩罚不确定性表达,鼓励AI进行猜测。研究提出了显式置信度目标等解决方案,通过改革评估标准让AI学会诚实地说"不知道",为构建更可信的AI系统指明方向。
字节跳动AI实验室提出"逆向工程推理"新范式,通过从优质作品反推思考过程的方式训练AI进行创意写作。该方法创建了包含2万个思考轨迹的DeepWriting-20K数据集,训练的DeepWriter-8B模型在多项写作评测中媲美GPT-4o等顶级商业模型,为AI在开放性创意任务上的应用开辟了新道路。
ByteDance Seed团队开发的UI-TARS-2是一个革命性的AI助手,能够通过观看屏幕并用鼠标键盘操作电脑,就像人类一样完成各种任务和游戏。该系统采用创新的"数据飞轮"训练方法,在多项测试中表现出色,游戏水平达到人类的60%左右,在某些电脑操作测试中甚至超越了知名AI产品,展现了AI从对话工具向真正智能助手演进的巨大潜力。