
2019-nCoV最危险的特征在于人传人的能力,这也使其很快在中国感染了超过20000人。遗憾的是,在决定隔离武汉以及周边地区之前,携带该病毒的患者已经前往中国各省甚至世界各地。根据目前的统计,2019-nCoV已经扩散到全球20个国家,并导致世界卫生组织(WHO)于上周宣布启动全球公共卫生紧急事件。
好消息是,世界各地的公共卫生机构已经开始利用一系列数据分析工具以应对这场疫情,包括跟踪2019-nCoV的传播范围、传播方式并对病毒的下一步扩散做出预测。
分析软件开发商SAS公司生物统计学家Theresa Do表示,如今公共卫生机构不仅掌握着远超以往的各类工具,可资利用的数据规模也是此前难以想象的。
Do指出,“现在我们掌握着多种不同的数据源,并且正在尽可能运用这些定点数据源,以更快的速度完成数据传输。”
诚然,目前对2019-nCoV乃至其他疾病新增病例进行记录的起步环节仍然没有变化,只能依靠人工进行手动操作。调查工作者需要进入田间地头、医院病房,用纸和笔记录信息,同时保证佩戴口罩和手套以保护自身安全。
但是,在2019-nCoV这类新型疾病被及时上报之后,相关数据就会迅速扩大,并由技术人员利用自己掌握的其他资源(例如SAS以及其他来自软件供应商的产品)加以分析。曾参与美国国防部全球健康监测计划的Do解释道,在这一环节当中,技术人员往往会整合各类数据,包括病例报告以及航班清单,从而更好地了解疾病的实际传播方式。
她在采访中表示:“如今,我们能够更快得出分析答案,然后以此为基础构建起预测模型,并通过执行情境分析以做出合理推断,最终弄清楚疾病可能传播到哪里、又会造成什么样的影响。”
除此之外,地理信息系统(SIS)也能够有效跟踪2019-nCoV等病毒在不同空间及时间周期内的传播方式。约翰霍普金斯大学系统科学与工程中心(CSSE)就在运营着一套基于Esri ArcGIS的实时GIS仪表板,其中显出全球范围内所有记录在案的2019-nCoV病例。在这样的监控之下,相信各国疾病控制中心(CDC)、世卫组织乃至全球健康监测中心的决策者,一定能够有效利用相关数据做出更准确的形势判断。
CSSE基于Esri ArcGIS的实时GIS仪表板
当然,除了一线上报之外,我们也可以采取其他方法推断出疾病动态,比如,挖掘社交媒体以及各类新闻网站。以www.healthmap.org为例,该网站持续跟踪各类网络平台上所提及的全球公共卫生事件相关内容。负责healthmap.com网站运营的计算流行病学家John Brownstein指出,现在他们的可用数据规模远超以往任何历史时期。
Brownstein在接受采访时表示,“在SARS期间,我们还无法掌握来自中国的丰富病例信息。但现在,我们正不断挖掘新闻与社交媒体,并获取到详尽的实时资料。”
在确定了新的感染疾病病例之后,公共卫生机构会快速与其接触,追踪他们的生活动向和轨迹,确定他们可能曾与哪些人接触。虽然这是一项艰巨且耗时的任务,但现代技术的介入已经显著降低了其中的实施门槛。
Frost & Sullivan公司物联网全球研究总监Dilip Sarangan预测称,应该可以利用一套“病毒检测传感器网络”通过人脸识别技术“发现、跟踪并监控可能感染新型冠状病毒的人群。”
这样的系统还能够跟踪感染患者曾经接触到的每一名个体。Sarangan指出,“虽然很多人会觉得这样的全程监控让人有种生活在警察国家的感觉,但最终,物联网与AI的结合可能会成为高传染性疾病在全球范围内快速扩散的最佳方式。”
SARS爆发之后,一位名叫Kamran Khan的前线医生曾着手构建一套系统,希望自动收集并分析各类公开可用的传染病传播信息。Khan目前在多伦多大学担任医学与公共卫生教授,他当初构想的这套传染病监控系统如今已经成为现实,并通过BlueDot公司正式对外销售。
如今,BlueDot正在跟踪全球超过100种疾病的传播动态,包括寨卡病毒、西尼罗河病毒、腮腺炎病毒、拉萨热以及其他传统流行病。这套平台能够从10000多种官方及大众媒体源中自动提取涵盖65种语言的公共数据,利用自然语言处理(NLP)及机器学习技术处理文本信息,并将全部素材整理成简洁直观的汇总性结论。Khan在采访中表示,“如果按老办法用手动方式处理,那么这项工作至少需要一支上百人的大团队。”
另一些次要指标同样有助于流行病疫情的发现。SAS公司的Do指出,虽然Google Flu Trends一直没能发挥预期中的作用,但就目前来看,从社交媒体及其他个人信息源处识别疾病迹象倒确实可行。举例来说,通过智能手表等联网设备检测人体温度的集体升高,或者是Netflix剧集观看量的迅速增长,都能在一定程度上判断出各地的疫情变化。
Do解释道,“也许还会出现其他指标,可以用来提前预测病毒爆发以及其他尚未发生的状况。”当然,数据分析方需要向受众保证其数据隐私不会受到侵犯。她补充道,只要能够解决对于隐私的担忧,那么挖掘出的大量数据足以为公共安全增添强大助力。“技术就在那里,就看如何运用。”
从此次事件来看,预测2019-nCoV的下一个传播点非常重要,这能帮助政府决策者更为高效地分配本就有限的资源。同时,这也意味着提前增加医生与护士的物资配备水平,从而快速适应2019-nCoV患者的激增状况;甚至可以调整供应链以确保充足的防护用品供应,特别是目前在全球已经被抢购一空的N95口罩。
Do指出,在规划2019-nCoV等爆发性事件时,最重要的就是充分考虑其次生效应的作用机理。她指出,“在中国,成千上万人被快速传染,并导致现有医疗制度难以支撑。除了因为这种新型病毒而死亡的病患之外,这类病例占用的大量医疗资源也可能挤压其他病人的诊治空间。毕竟在医院满员之后,生病的民众将别无选择。”
好文章,需要你的鼓励
这项由Snowflake AI Research发表的研究挑战了传统语言学对大型语言模型的批评,通过引入波兰语言学家Mańczak的理论框架,论证了LLM的成功实际上验证了"频率驱动语言"的观点。研究认为语言本质上是文本总和而非抽象系统,频率是其核心驱动力,为重新理解AI语言能力提供了新视角。
freephdlabor是耶鲁大学团队开发的开源多智能体科研自动化框架,通过创建专业化AI研究团队替代传统单一AI助手的固化工作模式。该框架实现了动态工作流程调整、无损信息传递的工作空间机制,以及人机协作的质量控制系统,能够自主完成从研究构思到论文发表的全流程科研工作,为科研民主化和效率提升提供了革命性解决方案。
德国马普智能系统研究所团队开发出专家混合模型的"即时重新布线"技术,让AI能在使用过程中动态调整专家选择策略。这种方法无需外部数据,仅通过自我分析就能优化性能,在代码生成等任务上提升显著。该技术具有即插即用特性,计算效率高,适应性强,为AI的自我进化能力提供了新思路。
Algoverse AI研究团队提出ERGO系统,通过监测AI对话时的熵值变化来检测模型困惑程度,当不确定性突然升高时自动重置对话内容。该方法在五种主流AI模型的测试中平均性能提升56.6%,显著改善了多轮对话中AI容易"迷路"的问题,为构建更可靠的AI助手提供了新思路。