配图|扈佃杰
创立一档面向创新者的对话栏目,就必然要用一个“称谓”来向创新者们致敬,而「行者」就是在我们脑海中蹦出的第一个词——因为创新者毫无疑问是一批永远在路上的人。同样重要的,行动也是这个世界进步的本源,无论是自然世界的理解,还是人类自身的进步。莫不如是。
在古代,人类对宇宙的理解就源于对宇宙星辰「行动」的观察。考古学家曾经发现一块距今大约5000年的古巴比伦时期的泥板,上面记录着历史上最早将天文运动和地球现象结合的印迹:
在这个月的第15天,整整三天,天空中寻不到这颗星星的踪影。到了11月的第18天,它重新出现在东方。新的泉源涌出来,阿达德(古巴比伦的风暴之神)送来雨水……
在北京冬奥会的开幕式上,二十四节气倒数惊艳了全场。而6年前联合国教科文组织将二十四节气列入「人类非物质文化遗产代表作名录」时,对它的描述也正是——中国古代通过观察太阳周年运动而形成的知识实践体系。
在现代,人类自身的远足,更创造了一个个科技奇迹。50年前,人类自身向宇宙迈出了最远的步伐,阿姆斯特朗踏上月表的第一步,“个人一小步,人类一大步”传遍世界。去年八月,我们的「祝融号」已经在火星上漫步了超过一千米。
与这些奇迹同时发生的,是一系列的新发明。地图卫星导航,真空吸尘器,空气净化器,数码相机,甚至现代泳衣和隐形牙套......都是因太空远足而伴随创造的科技新物种,极大程度改变了人类社会和生产生活。
对旧事物的打破没有止境,创新也就没有止境,创新者的思考与行动也无止境。所以,我们希望与科技行者们对话,就像当年的巴比伦泥板一样,用文字记录下新发现和新洞察。
但同时,我们也希望找到那些更深刻的创新和更硬核的科技。在第四次工业革命和数字化转型同时到来之际,我们眼中的创新者不是信息茧房的编织者,而是未来世界的拓荒者。如同资深创业者、也是风险投资家彼得·蒂尔所说:“人们想要一辆会飞的汽车,得到的却是140个字符。”
「科技行者」,正在让科技走得更远,也让科技离我们更近,我们通过对话,与他们同行。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。