微信扫一扫,关注公众号

  • 科技行者

  • 算力行者

见证连接与计算的「力量」

首页 AI模型"性格"大揭秘:斯坦福和魁北克团队首创"超新星事件"测试法,发现人工智能也有独特人格

AI模型"性格"大揭秘:斯坦福和魁北克团队首创"超新星事件"测试法,发现人工智能也有独特人格

2025-06-19 17:00
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2025-06-19 17:00 科技行者

这项由魁北克AI研究院的Pranav Agarwal和斯坦福大学的Ioana Ciuca共同领导的研究发表于2025年6月,研究论文已在arXiv平台公开发布(论文编号:arXiv:2506.12189v1)。有兴趣深入了解的读者可以通过该编号在arXiv.org上找到完整论文。这个研究团队做了一件听起来很神奇的事情:他们发现了一种测试AI"性格"的全新方法,就像心理学家给人做性格测试一样。

在我们开始这个有趣的故事之前,先想象一下这样的场景:如果你要了解一个新朋友的性格,你会怎么做?可能会观察他在面对不同情况时的反应,看他更关注什么,重视什么。研究团队发现,对AI模型也可以用类似的方法。他们创造了一个叫做"超新星事件数据集"的测试工具,通过观察不同AI模型在面对复杂历史事件时的选择和判断,来揭示每个模型独特的"思维偏好"。

这项研究的核心创新在于,它不是简单地测试AI能否正确回答问题,而是研究AI在面对主观判断任务时表现出的一致性行为模式。研究团队发现,即使没有被特意编程去模拟某种性格,不同的AI模型在处理同样的信息时,确实会表现出稳定而独特的"个性特征"。这就像是发现每个AI都有自己独特的"价值观"和"思考方式"。

**一、什么是"超新星事件数据集"**

研究团队创建的这个数据集就像是一个巨大的历史事件库,里面包含了各种类型的故事:名人传记、重大历史事件、新闻事件,以及科学发现的完整过程。这些材料主要来自维基百科文章,以及谷歌Deep Research生成的科学发现报告。

为什么叫"超新星"呢?就像天空中的超新星爆发会照亮整个星系一样,这些重大历史事件也会"照亮"AI模型的内在特征。当AI模型处理这些复杂的历史材料时,它们必须做出判断:哪些事件最重要?应该如何排序?这些选择就像照妖镜一样,暴露出每个模型独特的"思维偏好"。

这个数据集的设计非常巧妙。研究人员选择了那些包含多个重要事件、具有清晰时间线的历史材料。比如一个科学家的传记中可能包含他的早期教育、重要发现、获得奖项、与同行的争论等多个关键节点。不同的AI模型在面对这些信息时,会优先关注不同的方面,这种差异就揭示了它们的"性格"特征。

数据集包含了四个主要类别的内容。传记部分收录了192篇经过筛选的名人传记,这些人物都有超过5万次的页面浏览量,文章长度至少3000字,确保内容足够丰富和重要。历史事件部分涵盖了从公元前1000年到2000年的重大历史转折点,而新闻事件则聚焦于2000年至今的重大新闻。科学发现部分则通过谷歌Gemini 2.5 Pro Deep Research生成了25篇详细的科学发现故事,涵盖了从诺贝尔奖获得者的研究到重大科技突破的完整过程。

**二、如何测试AI的"性格"**

研究团队设计的测试方法就像是给AI做"心理测试"。他们会给AI模型一篇长文章,比如一位科学家的完整传记,然后要求AI从中选出5个最关键的事件,并按重要性排序。这听起来简单,但实际上需要AI进行复杂的判断和推理。

这个过程就像要求不同的人阅读同一本传记,然后说出他们认为最重要的五个人生节点。有些人可能更关注这个人的成就和奖项,有些人可能更在意他的成长经历和人际关系,还有些人可能更关注他面临的挑战和克服困难的过程。AI模型也会表现出类似的差异。

为了让这个测试更加客观和可重复,研究团队采用了一种叫做RAG(检索增强生成)的技术。简单来说,这就像给AI提供一个智能搜索系统,让它能够高效地从长文档中找到相关信息。系统会把长文档切分成1000个词的小块,每个小块重叠100个词,然后转换成数学向量存储在数据库中。当AI需要分析文档时,系统会自动找到最相关的部分提供给AI。

整个测试分为两个阶段。第一阶段使用特殊设计的提示词,帮助AI更好地理解什么是"关键事件"。研究人员明确告诉AI要寻找那些"如果没有发生,整个故事会完全不同"的转折点,以及那些产生了长期影响的重要节点。第二阶段则要求AI进行结构化分析,不仅要识别关键事件,还要排序并解释为什么某个事件最重要。

**三、AI"性格"的奇妙发现**

当研究团队分析不同AI模型的表现后,他们发现了一些令人惊讶的规律。每个AI模型确实表现出了独特而一致的"性格特征"。

比如,名为Phi-4的模型表现出明显的"战略成就者"特征。当分析著名天体物理学家钱德拉塞卡的传记时,Phi-4会优先关注诺贝尔奖这样的重大成就,然后是重要的职业里程碑,比如在芝加哥大学的任职。这就像一个非常重视结果和成就的人,总是先注意到那些光鲜亮丽的成功标志。

相比之下,Orca-2模型则展现出更多的"情感推理"倾向。面对同样的传记,它会首先关注钱德拉塞卡的重要科学发现——钱德拉塞卡极限,然后是他在剑桥三一学院的求学经历。这种模式表明Orca-2更关注知识的获得过程和人际关系的建立,就像一个更关注情感体验和成长过程的人。

而Qwen 2.5模型则表现出平衡而策略性的特点。它会综合考虑各种因素,既重视科学发现,也关注职业成就,还会注意到争议和挑战,比如与爱丁顿的学术争论。这种行为模式显示了一种更加全面和分析性的思维方式。

当研究团队用这些AI分析2008年金融危机时,差异变得更加明显。Phi-4和Orca-2都把雷曼兄弟的破产列为最关键事件,但它们关注的角度不同。Phi-4更关注具体的机构失败和政府救助措施,而Orca-2还会考虑欧洲债务危机等更广泛的社会影响。最有趣的是Qwen 2.5,它直接把次贷危机列为最重要事件,展现出一种更加系统性和宏观的分析视角,就像一个经济学家会从根本原因开始分析问题。

**四、科学发现中的"思维风格"**

在分析科学发现时,研究团队发现了更加细致的"思维风格"差异。他们测试了三个更强大的AI模型:OpenAI的o3、谷歌的Gemini 2.5 Pro和Claude Sonnet 3.7。

这些模型在分析科学发现时表现出了三种截然不同的"科学思维风格"。o3模型展现出"因果关系中心"的特征,它总是优先寻找直接的因果联系和机制解释。当分析人工神经网络的发展历史时,o3会特别关注霍普菲尔德1982年的网络理论论文,因为这篇论文建立了明确的物理学和计算机科学之间的因果联系。

Gemini 2.5 Pro则表现出"使能中心"的特征,它更关注那些"使某件事成为可能"的基础性发现和方法创新。在同样的人工神经网络历史分析中,它会优先关注1986年的反向传播算法,因为这个算法为后续所有的神经网络训练提供了基础工具。

Claude Sonnet 3.7展现出"综合中心"的思维风格,它擅长发现不同概念之间的整合和范式转换。它不仅关注具体的技术突破,还会注意到概念框架的转变和跨学科的整合,比如如何将物理学原理应用到计算机科学中。

这些差异就像三个不同风格的科学史学家。o3像一个机制研究者,总想搞清楚"为什么会这样";Gemini像一个工程师,关注"什么工具使这成为可能";而Claude像一个哲学家,思考"这些发现如何改变了我们的思维方式"。

**五、电影分析中的价值观差异**

为了验证这些"性格"特征是否真实存在,研究团队还让AI分析了电影剧本。结果证实了他们的发现:不同AI确实有不同的"价值观"。

当分析迪士尼电影《阿拉丁》时,Phi-4关注的是情节驱动的事件,比如贾法尔策划成为苏丹的阴谋,以及茉莉公主逃离王宫的行动。这些都是推动故事发展的关键情节点。

Orca-2则更关注人物关系和情感发展,它会把阿拉丁遇见茉莉公主列为最重要事件,然后关注阿拉丁与贾法尔的冲突。这显示了对人际关系和情感体验的重视。

Qwen 2.5展现出平衡的视角,它把阿拉丁与茉莉的第一次相遇列为最重要,然后是魔毯的出现,显示了对角色互动和叙事发展的综合考虑。

这种差异就像三个朋友在电影院看完电影后的不同感受。有人更关注情节的精彩程度,有人更在意角色的情感发展,有人则综合考虑各种因素。

**六、研究方法的创新之处**

这项研究的创新之处在于它开创了一种全新的AI评估方法。传统的AI测试主要关注准确性——AI能否给出正确答案。但这项研究关注的是一致性——AI在面对主观判断任务时是否表现出稳定的行为模式。

研究团队使用了一种巧妙的"AI评判AI"的方法。他们让Qwen 2.5模型充当"评判员",分析其他AI模型的输出,然后归纳出性格特征。这就像让一个心理学家观察不同人的行为,然后总结出每个人的性格类型。

这种方法的优势在于它可以大规模地进行,不需要人工逐一分析每个AI的输出。同时,它也避免了人类评判可能带来的主观偏见。不过研究团队也承认,这种方法可能会引入评判模型自身的偏见,未来需要结合人类评估来验证结果。

为了确保结果的可靠性,研究团队还使用了语义嵌入技术来量化不同AI的"性格"相似性。他们把每个AI的性格特征转换成数学向量,然后计算这些向量之间的相似性。结果显示,不同AI确实占据了"性格空间"中的不同区域,证明了它们的差异是真实和稳定的。

**七、实际应用和未来意义**

这项研究的意义远远超出了学术好奇心。在AI越来越多地参与重要决策的今天,了解不同AI的"思维偏好"变得至关重要。

在医疗健康领域,如果医生知道某个AI系统更关注症状之间的直接因果关系,而另一个系统更关注患者的整体状况和社会因素,他们就可以更好地选择合适的AI助手。在法律领域,了解AI的"价值倾向"可以帮助律师选择最适合特定案例类型的AI工具。在教育领域,不同"性格"的AI可以为不同学习风格的学生提供个性化的帮助。

更重要的是,这项研究为人机协作提供了新的思路。与其试图创造一个"完美"的AI,不如创造多个具有不同专长和视角的AI,让它们形成一个多元化的"AI团队"。就像人类团队中需要不同性格的成员一样,AI团队也可以通过多样性来提高整体表现。

这项研究还揭示了AI安全和对齐的新维度。如果AI确实有"价值观",那么确保这些价值观与人类价值观一致就变得更加复杂。我们不仅要关注AI是否会给出正确答案,还要关注它的判断过程是否符合我们的期望。

**八、研究的局限性和未来发展**

研究团队很诚实地承认了他们研究的局限性。首先,他们使用的"AI评判AI"方法虽然高效,但缺乏人类验证。未来的研究需要大量的人类评估来确认这些发现的真实性。

其次,研究中使用的维基百科文章可能带有西方文化的偏见,因为维基百科的编辑主要集中在西方国家。这可能会影响AI"性格"评估的普遍适用性。未来的研究需要使用更加多元化的数据源。

此外,研究团队使用的"性格"分类是经验性的,而不是基于已建立的心理学框架。虽然这种方法适合探索性研究,但未来需要与心理学理论更好地结合。

研究团队还指出,他们只测试了有限数量的AI模型,而且主要集中在英语环境中。随着AI技术的快速发展和全球化,需要对更多模型和更多语言环境进行测试。

尽管有这些局限性,这项研究开辟了一个全新的研究领域。未来的研究可以探索AI"性格"与训练数据的关系,研究如何有意识地塑造AI的"价值观",以及如何利用AI的多样性来改善人机协作。

**九、对普通人的启示**

对于普通用户来说,这项研究提供了一些实用的启示。当我们使用AI工具时,不应该假设所有AI都是一样的。不同的AI可能适合不同的任务和个人偏好。

如果你更喜欢直接、注重结果的建议,可能更适合使用类似Phi-4这样的"战略成就者"型AI。如果你更关注过程和情感因素,可能更适合使用类似Orca-2这样的"情感推理"型AI。如果你需要全面、平衡的分析,可能更适合使用类似Qwen 2.5这样的综合型AI。

这项研究也提醒我们要保持批判性思维。即使AI表现出某种"性格"特征,我们也不应该盲目依赖单一AI的判断。最好的做法是使用多个不同"性格"的AI,从多个角度分析同一个问题,然后做出自己的判断。

归根结底,这项研究揭示了一个重要事实:AI不是中性的工具,它们有自己的"观点"和"偏好"。理解这些特征不仅有助于我们更好地使用AI,也有助于我们思考人工智能在社会中的角色。正如研究团队所说,AI的未来不在于创造完美的机器,而在于创造能够与人类有效协作的智能伙伴。而有效协作的前提是相互理解,包括理解每个AI独特的"思维方式"和"价值倾向"。

Q&A

Q1:AI真的有"性格"吗?这是怎么发现的?

A:研究发现AI确实表现出稳定的行为模式,类似于人类的性格特征。研究团队通过让不同AI分析同样的历史事件,观察它们在选择和排序关键事件时的不同偏好,发现了这些"性格"差异。比如有些AI更关注成就结果,有些更注重情感关系,有些偏向综合分析。

Q2:这种AI"性格测试"有什么实际用处?

A:了解AI的"思维偏好"可以帮助我们更好地选择合适的AI工具。比如在医疗诊断时选择更注重因果关系的AI,在情感咨询时选择更关注人际关系的AI。这也为人机协作提供了新思路,可以组建由不同"性格"AI组成的团队来处理复杂问题。

Q3:普通人在使用AI时应该注意什么?

A:不要假设所有AI都是一样的。不同AI可能有不同的"观点"和偏好,适合不同类型的任务。建议在重要决策时咨询多个AI工具,从不同角度分析问题。同时要保持批判性思维,理解AI也有自己的"价值倾向",不应盲目依赖单一AI的建议。

分享至
0赞

好文章,需要你的鼓励

推荐文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-