就在大多数人还沉浸在新年伊始时的喜悦中时,22岁的Edward Tian(下称“爱德华”)正坐在屏幕前狂热开发一款应用程序,这款软件所要对抗的,正是名为ChatGPT的强大新型AI工具。
鉴于其广泛的出圈效应,相信很多人已经听说过ChatGPT的大名。这是一个由机器学习支持的交互式聊天机器人,该技术基本已经吃透了整个互联网上的素材,阅读过人类的全部成果,并学习其中的语言模式。用户只要给它一段提示,ChatGPT就能完成各种各样的任务:以特定风格写个故事,回答一个问题,解释一个概念,写篇电子邮件甚至是大学论文。没错,只要几秒钟,它就能输出顺畅连贯、与人类作品几乎无异的文本。
爱德华表示,“我认为AI技术的拐点已经到来。这项技术令人难以置信,我相信它代表着未来。但与此同时,我们也如同打开了潘多拉魔盒,必须有安全措施保证人们负责任地使用它。”
爱德华是普林斯顿大学的一名大四学生,主修计算机科学、辅修新闻学。而在最近,他稀松平常的生活却迎来了巨变。随着软件开发的推进,他受到了全球风险投资公司、教育机构以及无数媒体的关注。
过去几年来,爱德华一直在研究GPT-3这套AI系统——GPT-3是ChatGPT的前身,用户友好度较差,而且需要付费使用,所以距离一般公众比较远。作为今年秋季学期内容的一部分,爱德华在普林斯顿自然语言处理实验室工作期间,认真研究了如何对AI系统编写的文本做检测和判断。
随着学期结束,GPT-3等AI工具的缔造者OpenAI向公众免费开放了ChatGPT。对于体验过ChatGPT威能的几百万用户来说,整个交互体验就如同开启了通往未来的大门——不久之前还只属于科幻小说的情节,如今已经实实在在跃动于眼前的屏幕上。
尽管亲自参与过AI研究,但爱德华跟其他用户一样,也对ChatGPT的强大功能感到震惊。他和朋友们甚至用ChatGPT创作诗歌和说唱歌词,而且“效果非常好。”学校里,几乎每个人都在讨论这项新技术的卓越超凡。虽然它生成的文本高度公式化,内容也并不永远准确,但这绝对代表着一场革命的开端。
而对不少用户来说,这股新鲜劲很快就转化成了恐慌。强AI的发展成熟会消灭多少工作岗位?这会助长恶意行为,并进一步腐蚀我们的公共话语吗?这会给人类的教育制度带来怎样的冲击?当AI继续保持这样的指数级发展速度,让输出文本的质量不断提升,未来的学生们还有必要写论文吗?
作者Stephen Marche上个月在《大西洋月刊》撰文,宣称“大学论文已死”,并将ChatGPT和AI革命描述为人文学科生存危机的一部分。文章认为,“论文,尤其是本科论文,是几代人的人文教育学的中心。而这种我们教授孩子如何研究、思考和写作的考察形式,即将被彻底颠覆。”
向机器发起挑战
秋季学期结束之后,爱德华回到了多伦多的家中度假。他跟家人郊游,在家里追剧,但这些都没法让他摆脱AI快速发展带来的危机感和压迫感。
之后他有了主意。如果能用过去几年在学校里学到的知识,帮助公众们识别出哪些东西是由机器生成的,结果又会如何?
爱德华已经具备了开发此类程序的专业知识。颇为讽刺的是,帮助他完成开发的GitHub CoPilot软件就是由GPT-3提供支持。在这样的高效开发环境下,他在三天之内就完成了软件构建,证明GitHub CoPilot确实能够大大提高开发效率。
1月2日,爱德华发布了这款应用程序,并将其命名为GPTZero。其本质就是让ChatGPT自己对抗自己,检查AI系统在特定文本中是“零参与还是大量参与”。
当晚,爱德华上床睡觉时,对自己的这款应用程序并没抱太大希望。“我就是把它发布了出去,估计能有几十人愿意尝试吧。反正我也没多想。”
第二天醒来,他的手机爆炸了。他看到来自世界各地无数记者、高校、教师的短信和邮件。托管这款应用程序的免费平台因为流量过大而陷入崩溃。面对暴涨的人气和汹涌而来的好评,该平台决定迅速扩大对该应用的支持力度。
反抗全面标志化
爱德华坦言,他开发GPTZero,主要出于几个动机:首先就是透明度,他认为“我们有权知道什么是人写的,什么是机器写的。”
遵循这个思路,GPTZero的一大典型应用,就是帮教师们确定学生的论文是不是由ChatGPT代笔,“这个问题目前困扰着世界各地的老师。”
但也有些人并不在乎,有人直接照搬ChatGPT产出内容的问题。本月早些时候,风险投资家兼互联网先驱Marc Andreessen在Twitter上写道,“ChatGPT剽窃压根就不是什么大问题。如果写的东西都不如一台机器,那你还写个什么劲?”
OpenAI的早期联合创始人之一马斯克最近也发推文,回应了多所学校管控ChatGPT剽窃行为的消息,“这代表着新的世界,再见了作业!”
这话说得当然有点粗暴,但我们似乎确实迈入了新的纪元。现在的我们需要重新评估整个教育体系及其价值,至少是关于写作的教育方式。
随着手机的出现,很多人快速丢掉了记忆大量电话号码的能力。通过把这项任务转交给机器,我们越来越习惯靠手机存储和拨打电话。有人觉得这是好事,帮我们释放出宝贵的脑力,思考更重要的问题;但也有人认为这是种反进化,是对心智能力的削弱,导致人们没了手机就寸步难行。
如今,人类似乎面临着更加依赖机器的前景。也许在下一个世代,大多数人不再具备良好的写作能力。到那时,我们的所有书面交流也许都像一张华贵的贺卡——没有创造力、没有个性,也没有想法、情感或特质,所有内容都是印好的,精美且统一。这,就是所谓全面标志化!
但当我们递出这样的贺卡时,至少是有明确过程和载体的。而如果用ChatGPT给朋友写道贺信或道歉信,对方甚至感受不到这其实是机器快速输出的产物。
于是,爱德华为自己的应用程序设想了另一项用途:识别并激励人类的原创写作热情。“如果我们不在课堂上传授写作,那就会失去这种热情。人类的写作可以如此美妙,其中某些方面永远不该被计算机所取代。如果每个人都习惯于依赖ChatGPT,那这种美好将彻底消失。”
爱德华并不是想阻止AI技术的发展,他认为AI的发展不可阻挡。他也反对纽约市公立学校那种粗暴的、对于ChatGPT的全面禁止。他坚信,学生们总会找到使用这项技术的办法。最重要的,是让新一代学生学着用它、用好它。孩子们需要了解席卷整个世界的技术变革。“我们不能盲目走入那个未来,最重要的是以明确规划的路线走进去。”
谈到大学毕业后的计划,爱德华表示对新应用程序充满期待,打算把它打造成更好、更准确的产品。“现在,我们的团队只有我自己和几位大学好友,他们前几天刚刚加入。我们需要听取更多来自教师和教育队伍的声音。”
所以如果你遇到了一些疑似机器生成的文本,不妨用爱德华的应用程序检测一下看看
GPTZero.me,访问这个网址就能使用。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。