微信扫一扫,关注公众号

  • 科技行者

  • 算力行者

见证连接与计算的「力量」

首页 测试仪向来不靠谱,AI令情况进一步恶化

测试仪向来不靠谱,AI令情况进一步恶化

2020-03-17 16:53
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2020-03-17 16:53 MIT Technology Review

在测谎信宣布其有罪之前,Emmanuel Mervilus一直在新泽西州纽瓦克的一家信用油公司工作。他靠搬运货箱每小时能赚到12块美元,但这样的收入实在太过有限。他的弟弟妹妹还太小,没法出外工作;他的母亲则身患癌症,每天与病魔斗争。不过他的老板给他带来了好消息,接下来他将被晋升为技术员职位,到时候一个小时能赚到25美元。

测试仪向来不靠谱,AI令情况进一步恶化

2006年10月19日,Mervilus还在等着这个不知靠不靠谱的晋升。当时他和一个朋友在新泽西州伊丽莎白附近的一家Dunkin’ Donuts甜品店休息。几分钟之后,他们走出店外,这时两名警察走向他们,宣称他们涉嫌几分钟前在附近的火车站持刀抢劫。

受害人远远指点着他们,表示抢劫自己的就是这两个家伙。为了证明自己的清白,Mervilus天真地表示接受测谎仪的考验。警察同意了,但就在接受测试的几天之前,他的母亲不幸辞世。当警察把传感装置绑在他身上时,他的情绪相当烦躁焦虑。结果可以想见,他没能通过测试;他要求重新测试一遍,但警方表示拒绝。

Mervilus一直坚持自己无罪,于是这个案件最终闹上了法庭。管理测谎仪的警官在法庭上作证称,这台装置是台可靠的“真相指示器”。他还言之凿凿地强调,回顾整个职业生涯,他从没见过“测谎仪显示说谎,但最终却被证明为清白的嫌疑人”。陪审团裁定Mervilus罪名成立,上诉法院后来发现,由于过测谎仪的过度信任,法官裁定Mervilus入狱11年。

通过分析人体反应即可检测到欺骗行为的观念,已经在现代生活当中根深蒂固。尽管有不少研究都在质疑测谎仪的有效性,但每年美国利用该设备进行的筛查仍超过250万次,由此带来的产业价值高达20亿美元。包括司法部、国防部以及中情局在内的美国联邦政府各机构在筛选潜在雇员时,都会使用测谎仪结果作为参考。根据美国司法部2007年发布的数据,有超过四分之三的市政警察及刑侦部门使用测谎仪对雇员进行筛查。

但是,现有测谎仪设备仍然太过缓慢且笨重,无法在过境点、机场或者其他人流密集的区域内使用。结果就是,过去十年出现了一批基于人工智能技术的新型测谎仪,据支持者们声称,这代新产品比传统测谎仪速度更快、准确度更高。

但事实证明,支持这类新型AI系统的心理学原则甚至还不如传统测谎仪可靠,几乎没有证据能够证实它们产生的结果真实可信。尽管如此,AI技术的介入让测谎这个概念变得越来越高大上,并开始向那些以往无法涉足的领域渗透:过境检查、工作面试、贷款筛选以及保险欺诈索赔等等。企业与政府也开始利用AI测谎方案对客户、员工、公民、移民以及国际访问者做出可信度决策。但是,如果谎言太过复杂,无论多么先进的算法都难以做出准确判断,我们又该怎么办?

在《中世纪寓言选集》中,讲述了一个士兵测量妻子的脉搏、借此判断爱人有没有对自己不忠的故事。

在第一次世界大战期间,美国哈佛大学的研究员William Marston首次利用测量血压的机器尝试判断对方是否说谎。几年之后,受到Marston工作成果的启发,刚刚在加州大学伯克利分校拿到生理学博士学位的John Augustus Larson警官开发出一款名为“心肺电图”的机器。通过连续读数,这台设备能够跟踪受试者的血压、脉搏与呼吸频率。Larson声称,相较于单纯的血压,这些更为复合的读数能更准确地反映出对方是否在说谎。

Larson首先利用这台机器调查了伯克利大学女子宿舍发生的一起盗窃案,并在同一年尝试利用其审判旧金山一名被指控杀害了一位牧师的男子。到上世纪三十年代,Larson的一位追随者开始向全美各地的警察局出售该设备的便携式版本。新版本中还添加了一款传感器,可测量皮肤导电性的变化——受试者越紧张,就越容易出汗,而汗水会令皮肤的导电性增强。到上世纪七十年代,已经有数百万名供职于私营企业的工人应雇主要求,定期接受测谎仪的检测。

当下人们使用的大多数测谎仪,其基本结构与Larson发明的初代仍然保持一致:调查人员会提出一系列问题,同时测量受试者的正常生理状态,并在受试者回答问题的同时通过页面或者屏幕以波形线记录测量结果。以此为基础,调查员会向受试者提出与犯罪嫌疑或者作案感受相关的问题,并关注测量波线是否突然出现上升或下降。

但自Larson把自己的发明向公众公开的那天开始,心理学家与神经科学家们就一直对测谎仪抱有质疑。虽然某些说谎者确实可能出现心率或者血压方面的变化,但几乎没有证据能够表明这种变化就与欺骗行为存在强关联性。不少无辜者在受到质疑时同样会紧张起来,而有经验的坏蛋则能够控制甚至引导自己的生理变化,从而蒙蔽测试设备。另外,嫌疑人可以通过悄悄咬自己的舌头、踩钉子或者想回忆自己最恐怖的经历来对抗测谎仪。即使是在高度受控的实验室当中,测谎仪仍然不够可靠:能够通过测试的罪犯当然不会向警方坦白真相,而无辜的嫌疑人有时候会在申诉无门后、通过虚构犯罪过程求得减刑,这种种变量最终导致测谎仪的实际效果得不到丝毫保障。

测谎仪发明者John Larson的门生Leonarde Keeler利用测谎仪对Bruno Hauptmann进行检测。后者因绑架Charles Augustus Lindbergh Jr指控而被捕、定罪并处决,但其一直坚称自己是无辜的。

正是由于上述问题,因此除非原告/被告双方都明确同意,否则美国大多数法院都不接受将测谎仪结果作为裁定依据。自1988年以来,联邦法律禁止私营雇主对其雇员进行测谎(可能接触军火、药品等敏感货物的职位以及涉嫌进行偷窃或欺诈行为的雇员不在此列)。美国心理学会警告称,“大多数心理学家都认为,测谎仪能够准确检测出的谎言其实非常有限。”美国国家科学家2003年发布的一份报告也对先前政府方面的研究做出呼应,指出虽然测谎设备确实能够以较高比率检测出说谎者,但还远不足以作为完美的论证工具。这份报告的第一作者还提到,“国家安全非常重要,绝不能容许这种不完美空间的存在。”

但对于其他一些相对没那么重要的场景,测谎仪仍然很有市场。制造商们当然希望能将越来越多的测谎技术出售给政府以及企业。他们强调称,只要能够引入更为复杂的检测模式,就能带来远高于纯脉搏/血压变动形式的谎言检测准确度。在这方面,复杂算法有望贡献出强大的力量。

从1969年至1981年,绰号为“约克郡开膛手”的连环杀手曾在英格兰北部杀死至少13名年轻女性并将她们吃掉,另有7名女性侥幸逃脱。随着杀戮狂潮的升级,警察曾9次将其抓获,但在审判之后认定他无罪。他手下的最后一名受害者是利兹大学年权20岁的学生Jacqueline Hill,于1980年11月被杀害。几个月后,警方终于将他抓了个现形,当时他正准备在谢菲尔德附近谋杀一位女士。

Janet Rothwell于1980年秋季就读利兹大学,她住在Hill隔壁的宿舍,也是Hill谋杀案的第一发现人。

Rothwell表示,“她和我大概同时乘上了从学校图书馆发车的公共汽车,并在下车之后遭到谋杀。”在了解到凶手以往的审讯与释放经历后,她不禁追问,“我想知道,计算机能不能帮助警察准确识别出这些犯罪分子?”

Rothwell随后于上世纪九十年代末进入曼彻斯特城市大学(MMU)研究生院学习。在这里,她遇到了计算机科学系的伊拉克-英国讲师Zuhair Bandar。Bandar近来刚刚冒出一个奇妙的念头,因为当时一家营销公司要求他开发一款基础设备,用于衡量消费者对自己看到的产品广告到底感不感兴趣。

Bandar指出,“他们打算给客户发放一款手持设备,如果他们感兴趣,就按下1;如果不感兴趣,就按2。我觉得,如果客户的表情已经说明了一切,为什么还要费力发放手持设备?”为此,Bandar要求Rothwell在硕士毕业后继续留在城市大学攻读博士学位,并帮助他设计一款能够分析人脸表情并提取信息的软件。他们认为,说谎时的微表情应该与欢乐或愤怒情绪一样容易被发现。毕竟任何人都会或多或少出现“不一致”反应,而计算机特别擅长辨别这种言语或者非言语层面的行为模式。

Rothwell在新世纪初着手训练出一套神经网络,用于跟踪检测对象的眨眼与面部充血等人脸活动,然后向其中导入包含数十位检测对象坦白/说谎时视频片段的数据集。为了确定说谎者之间的共同点,计算机会检查对方的面部动作,同时分析这些动作之间以及动作与谎言之间的关联,最终提出一种由于太过复杂而无法用人类语言表达的“理论”。通过这种方式完成训练之后,系统就能够逐帧分析面部变化,并利用这套理论知识做出对方是否说谎的判断。

在2006的一项研究中,这套Silent Talker的系统开始正式对受试者进行测试。不过根据Rothwell得出的结果,其准确度一直无法超过80%,在此之后该研究小组发表的所有论文都没得在效果方面更进一步。Rothwell还告诉我们,如果爱试者佩戴眼镜,那么结果将彻底失败。她解释道,“整个测试必须在完全相同的照明条件下进行,而且案件内容只限于盗窃类行为。”Rothwell还回忆道,即使是在系统还未成熟时,Bandar就已经“积极将其设计为一款商用产品。”他甚至和一位同事向她展示了一段存在出轨嫌疑的女性的录像带,要求她使用Silent Talker进行分析。

Rothwell对此持保留意见。她表示,“在我看来,如果这款软件真能起效,也有可能带来潜在的侵犯问题。而且我认为任何系统都不可能100%有效,一旦系统做出错误判断,有可能给人际关系甚至生命财产造成灾难性的后果。”她于2006年离开大学,并在学习听力学相关专业之后在泽西岛的一家医院供职至今。

曼彻斯特大学在2003年发布一份新闻稿,称这项神经网络技术将使传统测谎仪彻底过时。Rothwell对此表示震惊,“我觉得一切还为时过早,这样的结论太过草率。”

9/11之后的第一年,美国政府开始在欺骗检测技术方面做出一系列尝试,国土安全部(DHS)、国防部(DoD)以及国家科学基金会都在这类研究身上投入数百万美元。其中典型的成果就是由各政府机构资助亚利桑那大学打造的AVATAR信息亭。AVATAR在美国各机场进行了测试,通过分析面部表情、肢体语言以及语音语调为受试者提供“可信度”评分。除此之外,国土安全部还在以色列资助了一家名为WeCU的初创企业。根据这家名为Fast Company于2010年发布的文章,他们打造的检查亭能够“识别出人们在携带违禁品时表现出的细微生理反应。”(顺带一提,这家公司很快就倒闭关停。)

Bandar并没有停止这项技术的商用化之路。他与Jim O’Shea及Keeley Crockett两名学生共同创立了Silent Talker公司,并开始在警察局及私营企业当中物色对其“心理分析”技术感兴趣的客户。Silent Talker也是首批投放市场的AI测试方案之一。据该公司介绍,去年,“源自Silent Talker”的技术被引入欧盟资助的研究计划iBorderCtrl,用于对希腊、匈牙利以及拉脱维亚边境的志愿者进行测试。Bandar指出,该公司目前正在谈判,希望进一步将该技术出售给律师事务所、银行以及保险公司,从而将测试方案引入工作面试以及欺诈筛查等领域。

Bandar与O’Shea投入数年时间调整核心算法,以确保这套方案能够适用于各类场合。他们曾尝试将其销售给曼彻斯特及利物浦市区的警察局。在2003年接受英国《工程师》杂志采访时,该公司表示“我们正在与高层人士进行非正式会谈。”他们指出,其目标是“将相关试验引入真实面试当中。”O’Shea还在公司网站上发布的2013年白皮书中提出,Silent Talker“可用于保护我们部署在海外的部队免受「蓝绿」(内部人士)攻击的影响。”(「蓝绿」一词,通常是指身着蓝绿色制服的阿富汗士兵对前盟友发动的攻击。)

该团队还发布了实验结果,展示Silent Talker如何在识别与检测领域发挥作用。在2012年的一项研究中,该团队首次展示了Silent Talker系统在实际应用中的表现——他们与坦桑尼亚的一家医疗保健非政府组织合作,记录下80名女性的面部表情,用以确定她们是否在参加HIV治疗及避孕套使用课程后真正掌握了相关知识。正如研究的引言部分所提到,“本此研究的核心重点,在于评估参与者在知情认可过程中是否实际理解相关内容。”通过对受试女性们分析结果的交叉引用,该团队认为系统能够以80%的准确度辨别受试者对上述知识的掌握情况。

凭借在坦桑尼亚试验中的表现,Silent Talker被正式纳入iBorderCtrl。2015年,财团领域的新生力量Athos Antoniades向O’Shea发出电子邮件,询问Silent Talker团队是否有意加入企业及执法机构联盟,共同向欧盟申请资助。在过去几年当中,进入欧盟的交通运输量急剧增加,导致欧盟边境国家的管理机构不堪重负。因此,欧盟将向任何能够“提供高效、安全陆地过境检查方案的机构”提供450万欧元(约合500万美元),借此“预防犯罪与恐怖主义活动。”Anthoniades认为Silent Talker在望在这一领域发挥重大作用。

当该项目最终于2018年10月宣布进行公开试点时,欧盟委员会在新闻稿中迅速宣称该系统能够采用“独特方法”并“成功”检测出欺骗行为的结论,同时解释称该分析“能够分析微表情以帮助判断受试者是否在说谎。”新闻稿同时指出,这套在曼彻斯特训练而成的算法将“提供更高效且更安全的陆地过境检查方案”,进而“为预防犯罪及恐怖主义活动做出贡献。”

O’Shea在采访中指出,该程序的基础算法也适用于其他多种场景,例如广告宣传、保险索赔分析、求职者筛选以及员工评估等等。在这里,我们很难充分表达他对这项技术的充分信任,但即使是在电话采访中,他也难掩自己的激动之情,而且Silent Talker已经开始在欧盟过境点进行部署。该公司刚刚于2019年1月开张营业,所以我们决定去曼彻斯特亲眼看看。

Silent Talker的办公室距离曼彻斯特城市大学只有一英里路程,O’Shea正在该校担任高级讲师。他已经从Bandar手中接过日常技术开发工作。该公司坐落于一处平平无奇的砖砌园区之内,街对面就是烤肉餐厅和足球场。走进大楼,Silent Talker的办公室只有一个单间,里头摆着几台电脑、桌上放着公文包以及近二十年前印制出来的技术宣传海报。

在去年9月造访办公室时,我跟O’Shea以及Bandar在楼下的会议室里一起坐下。O’Shea表情冷峻,头发稀疏还留着范戴克胡。他坚持要求我们不要多谈iBorderCtrl项目,而是多从技术角度交换意见。他还强调批评者们的意见“并不正确。”在这次漫长的对话中,他主要谈到系统AI框架的功能,偶尔还引用计算机先驱图灵与语言哲学家John Searle的名言。

他这样表述系统对于算法的依赖,“机器与人类都有自己的意图,即对于这个客观世界中事物及状态的信念、欲望与认识。因此,复杂的应用程序要求我们对机器与人类的观念及意图做出权衡。”

O’Shea还展示了他们打造的系统,具体过程是播放一段男性问答视频,内容为回应他是否从盒子中偷取了50美元。程序会在对方面部周边叠加一个黄色广场,眼睛周边又有两个较小的广场。在他讲话时,屏幕角落的指针会在检测到谎言时从绿色变为红色,对方不再讲话时又变中橙色。对话结束后,软件会生成一份图表,描绘出对方说谎的概率随时间推移的变化情况。从理论上讲,这就代表着受试者开始说谎以及停止说谎的具体时间。

O’Shea表示,他们的系统能够在普通笔记本电脑上运行,用户每分析一分钟视频只需要支付10美元左右。O’Shea还强调,该软件会首先对视频进行初步的本地处理,而后将加密数据发送至服务器,由服务器进行进一步分析,再将最终结果发送回来:就这样,用户即可获得之前提到的说谎概率分布图。

根据O’Shea的介绍,该系统能够对受试者身上大约40个物理“频道”进行监测,具体包括眨眼频率以及头部倾斜的角度等等。利用说话者与坦白者训练数据集,该系统能够针对每一张新面孔总结出自己的一套说谎识别“理论”。系统每秒对对象的面部活动及姿势变化进行多次测量,找到其中与训练数据集内说谎者相通的运动模式。这种模式绝不是简单的偷瞄天花板或者头部向左倾斜,而更像是对组合模式之间的关联关系进行分析,这意味着不同动作之间往往有着多种联系及解读方式。由于理论太过复杂,人类不可能跟踪得了——这也符合现代机器学习系统的典型特征。

AI技术在这里发挥的根本作用,就是确定与说话相关的姿态模式。O’Shea告诉我们,“心理学家经常说,你应该给这套系统建立起一套模型。但我们没有这样的模型,也不需要。我们把一切都交给AI。”但他同时表示,面部“频道”分析的合理性,确定来自与欺骗心理学相关的学术文献。在Silent Talker于2018年发表的论文中,作者称这款软件“假定与欺骗行为有关的某些心理状态,会同时驱动受试者做出某些非语言类行为。”这些行为包括“认知负荷”或编造谎言时带来的额外精神负担,以及“假装轻松”或者因某句谎话蒙混过关时的喜悦情绪。

但荷兰马斯特里赫特大学的心理学教授Ewout Meijer表示,这种将微表现视为普遍性特征的理由不够充分与不够稳定。能够通过面部准确发现情绪“泄露”迹象的理论,源自美国心理学家Paul Ekman,他曾在上世纪八十年代提出如今非常著名的“微表情”学说,即面部会出现一些幅度极小因而无法控制的动作。Ekmn的研究使他成为畅销书作家,并成为犯罪电视剧集《Lie to Me》的灵感来源。他曾为包括国土安全部以及DARPA在内的众多美国政府机构提供咨询服务。他以国家安全为由,拒绝透露相关研究数据,但这也引发了学术界对于微表情是否具有现实意义的激烈争论。

Silent Talker的AI技术能够跟踪多种面部活动,而不单纯局限于Ekman提出的微表情。该公司发言人在一封邮件中写道,“我们将这些高级线索拆分成一组独特的微姿态,并训练AI组件将其整理为有意义的指示性模式。”O’Shea指出,这意味着即使受试者只是环顾四周或者在椅子上稍微动动身子,系统也能够识别出欺骗行为。

Meijer则警告称,O’Shea和他的团队可能是打算用技术培训来解决关于欺骗活动层面的心理问题,“这在很大程度上取决于他们到底是将其视为技术问题还是心理问题。AI系统在检测面部表情方面确实能够胜过人类,但尽管如此,这仍然不足以证明对方存在欺骗行为……欺骗是一种心理活动。”Meijer还补充道,学术界不仅没有在姿态表现与欺诈活动间的关联方面达成共识,甚至在二者间到底存不存在关联上也有争议。但Silent Talker公司在邮件中表示,这种反对意见“不适用于”他们,对方“使用的统计数据并不适用。”

此外,Meijer指出,除非能够使用实际场景下的多样化数据集进行训练,否则这种算法在过境或者工作面试中无法带来可靠的效果。研究表明,当人脸识别算法纯靠白人为主体的数据集进行训练之后,系统往往在识别少数族裔方面表现很差,O’Shea本人也承认这一点。Silent Talker发言人在邮件中写道,“我们使用较小的样本量进行了多轮实验,前后共数百次。其中一些属于学术性试验,我们将结果发表在论文当中;也有一些属于商业机密,因此没有公开。”

但是,一切证明Silent Talker准确性的已发表研究都出自少量存在局限性的数据集。以2018年发表的论文为例,其中受试者数量仅为32人,且男性是女性的两倍;只有10名“亚裔/阿拉伯”受试者,且没有任何黑人或者西班牙裔受试者。尽管该软件目前提供用于分析男性及女性的不同“设置”选项,但O’Shea表示他也不确定是否有必要针对种族背景或年龄进行区别化设置。

在2018年iBorderCtrl试点项目公布之后,社会活动家及不少政界人士都在谴责该计划实际上就是对国家监控的一次史无前例的奥威尔式扩张。欧洲议会荷兰议员、中左翼民主党派66党领导人Sophie in’t Veld在写给欧盟委员会的一封信中指出,Silent Talker系统可能侵犯“众多跨境旅行者的基本权利”;而国际隐私组织等机构则强调这实际上是在“利用一套不够透明且功能不够完善的自动化系统进行人员判断、评估与分类,这种行为目前已经开始形成危险的整体趋势。”反对者们还对iBorderCtrl本身加以抨击,称欧盟委员会最初宣称iBorderCtrl只是计划“开发一种加快过境速度的系统”,但如今却演变成一种纯理论层面的“研究项目”。Antoniades在2018年底接受一家荷兰报纸采访时表示,欺骗检测系统“最终可能不会被引入项目当中”,但截至本文拨时,Silent Talker仍被明确列在iBorderCtrl的官方网站之上。

美国学者兼隐私主义支持者Vera Wilde居住在柏林,她曾发起针对iBorderCtrl的反对运动。她指出,“以往的测谎仪就是在帮助调查员找出那些被认定与欺骗行为相关的生理反应。现在的这套系统遵循同样的原理,只是科学性更差。在AI系统中,调查员会让计算机自行找到二者的关联性。”她还强调,“O’Shea表示这套系统没有对应的理论,他明显说错了。这里面有理论依据,只是这种理论非常糟糕。”

虽然有Wilde这样的反对者不断施压,但人们对于完美测谎仪的期待永远不会消失,而这种期望也在AI技术降临之后变得更加迫切。在本世纪初投入数百万美元资助大学进行欺骗行为研究之后,国土安全部也在尝试开发自己的行为分析技术方案。这套系统被称为“未来属性筛选技术(FAST)”,意在利用AI技术通过受试者的眼部及身体活动判断其犯罪倾向(早期版本要求受访者站在Wii Fit平衡板上以测量姿势的细微变化)。三位已经退出该机密项目的研究人员透露称,该项目本身从未付诸实践,因为部门内部对其存在大量意见分歧,特别是是否应该使用Ekman提出的微表情理论作为行为分析苊。2011年,国土安全部决定削减项目的研究规模。

尽管FAST遭遇失败,但国土安全部对测谎技术的兴趣并没有消失。就在去年,他们与一家人力资源企业签订了价值11万美元的合同,旨在通过“行为分析”培训官员“发现欺骗行为并做出回应。”与此同时,政府其他部门也在大力支持AI解决方案。陆军研究实验室(ARL)目前就与罗格斯大学签订一项协议,由后者开发一款AI程序以检测主机游戏《黑手党》中角色的说谎行为。ARL部门负责人Purush Iyer指出,他们还计划最终打造出一款“类似于谷歌眼镜的产品,用于随时就欺骗行为发出提醒。”来自以色列的AI语音分析软件厂商Nemesysco也告诉我们,纽约警察部门以及中西部州执法机构正利用他们提供的技术审讯嫌疑人,不少债务客服中心也在借此衡量债务人对于当前负债情况是否有所隐瞒。

AI谎言检测的当前与潜在风险甚至不在政府之内,而更多体现在私营市场之上。支持iBorderCtrl等项目的政客最终还是要对选民负责,因此大部分AI测谎设备可能会随着此后的法律法规而被逐出法庭。然而,私营企业在利用此类技术筛选求职者及潜在客户方面,则没有那么多限制。以Silent Talker为代表的多家厂商都宣称能够提供更加客观的异常或欺骗行为检测方案,可为客户带来超越传统信用评分及社交媒体资料的“风险分析”能力。

这款软件会产生大量误报。

来自蒙大拿州的Neuro-ID公司正尝试利用AI技术对用户的鼠标移动及点击操作进行分析,为贷款申请人的“可信度”打出1到100的直观评分,帮助银行及保险企业评估欺诈风险。该公司通过一段视频向我们展示了客户在申请在线贷款期间填写家庭现有收入时,鼠标移动的具体轨迹;系统能够分析其操作轨迹并整理出信誉评分。这套方案基于该公司创始科学家的学术研究,他们声称该研究能够找到鼠标轨迹与用户情绪之间的关联性:一篇论文断言,“欺诈性行为会增加鼠标的正常运动距离、降低鼠标运动速度、增加响应时长并带来更多的点击次数。”不过该公司自己的测试也表明,这款软件会产生大量误报:在一项案例研究中,Neuro-ID处理了2万项电子商务网站申请,只有半数被评为最低得分的申请人(10人中的5人)被证明存在欺诈行为,而得分在20到30之间的用户则只有10%确定存在欺诈行为。该公司承认,这款软件有可能误标一切正常的申请人,他们希望能够利用这部分结果进一步完善系统设计。该公司一位发言人表示,“没有任何一种基于行为的分析方案能够100%准确。我们建议用户将结果与关于申请人的其他信息结合分析,从而做出良好决策并高效揪出欺诈性客户。”

总部位于犹他州的初创公司Converus正在销售一款名为EyeDetect的软件,其能够在面试过程中检测受试者的瞳孔扩张情况,借此判断对方的认知负荷。与Silent Talker类似,这款工具的基本假设是:说谎时的认知负担要高于说真话。根据《连线》杂志2018年发表的文章,盐湖城与乔治亚州哥伦布的警察部门已经开始使用EyeDetect筛选求职者。Converus还在采访中表示,麦当劳、Best Western、Sheraton、IHOP以及联邦快递等公司都已经在巴拿马及危地马拉等国使用这款美国本土不允许使用的软件。

在一份声明中,该公司还援引不少研究结果,表明EyeDetect在识别说谎者及坦白者方面可达到85%左右的准确率,且样本量“高达”150人。该公司总裁Todd Mickelsen指出,他们的算法已经被用于处理数十万次检测。但身为博伊西州立大学心理学教授的Converus公司顾问委员会成员Charles Honts表示,这些结果还不足以证明EyeDetect能够在实际使用中具有充分的可靠性。他告诉我们,“我觉得EyeDetect系统真的非常有趣;但另一方面,我不打算亲自使用。我觉得目前的数据库规模仍然相对较小,而且主要来自同一实验室环境。在真正扩展并得到他人的重现之前,我觉得最好是保持慎重的态度。”

开发出AVATAR系统的亚利桑那大学研究人员则成立了一家名为Discern Science的私营企业,开始销售自己的欺骗检测技术。他们的Discern产品于去年推出,这是一款高度为6英尺的信息亭,与初始AVATAR类似。根据《金融时报》的文章,该公司已经“与航空业的合作伙伴签订了合资协议”,计划将该工具出售给各地机场。根据营销材料,这套系统将测量受试者的面部活动与语音压力,从而“在对话当中悄无声息地收集信息。”与Silent Talker与Converus一样,Discern与宣称该技术能够以85%左右的准确率分辨说话者与坦白者,而且相关结果也同样未能得到独立重现。该信息停至少重复使用一项输入内容,因此结果并不足以严格采信。(Honts进一步指出,像AVATAR及Silent Talker这样的面部运动分析技术「几乎没有任何科学依据作为支持」,「这方面失败的例子太多了」。)

“如果有人宣称他们拥有一台能够直接检测谎言的设备,别怀疑,这家伙肯定是骗子。”

在被问及这款信息亭的科学依据时,Discern公司研究员Judee Burgoon强调称,他们只负责进行评估,而不会对结论的可靠性做出明确判断。她指出,“无论是AVATAR还是Silent Talker,这类系统并不能直接衡量对方是否在说谎。如果有人宣称他们拥有一台能够直接检测谎言的设备,别怀疑,这家伙肯定是骗子。”但在营销材料当中,Discern显然是把这款工具描述成了一种可靠的测谎设备——该公司的官方网站宣称其“有助于发现对方不愿透露的意图”,且相关算法“已被科学证明能够以更快、更可靠的方式检测出欺骗行为。”

上诉法院最终撤销了Emmanuel Mervilus在2001年蒙受的不白之冤,要求立即释放并重审;但此时,他已经服刑超过3年。在2013年的第二次审判当中,陪审团仅进行了40分钟的审议,就宣布他无罪。如果不是因为对测谎仪近乎偏执的信任,Mervilus也许永远不用走进法庭。接下来,Mervilus起诉了当初逮捕并审讯他的警官,指控对方使用已知存在缺陷的测谎仪侵犯了他享受正当司法程序的权利。同年3月13号,此案进行了庭外调解。

即使Silent Talker及其他类似系统的广泛应用并没有导致Mervilus这类无辜者的悲剧,但它们的存在会创造出一种新的社交习惯,迫使人们在租车或者贷款时首先接受“信誉评估”。

Wilde表示,“在法庭上,只有头发及血液等实物证据才能被采信。当然,被告也有权保持沉默,有权不透露关于案件的信息。”Mervilus以为测谎仪的基本原理也是这样,同DNA检测一样严谨,能够证明自己的清白。但设备弄错了,而且真正将Mervilus送进监狱的并不是机器,而是过度信任测谎仪的陪审团。他们如此依赖测谎仪的结果,甚至让他们无视掉眼前明明白白的事实证据。

AI谎言检测的基本前提,就是理论上能够通过正确的工具看透谎言。但心理学家们并不确定这样的假设是否有效,更可怕的是,这样未能证明的理论很可能导致人们得不到应得的工作、拿不到应有的贷款,也过不了自己本来能够正常通过的边境。

Wilde总结道,“这更像是一种读心术。我们都知道读心术是假的,但却偏偏有人相信测谎仪是真的。”

分享至
0赞

好文章,需要你的鼓励

推荐文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-