美国有许多通过输油管道、铁路或水运码头与炼油厂相连的运输终端,建有巨大的储油罐区,加油站的油一般是卡车从这些终端拉来的。每天早晨,都会有许多油罐车来来往往。正是这些运油车,加满了油后输入到各加油站的地下储油箱内,再卖给消费者。
美国加油站的燃油价格几乎每天都要进行调整。几十年来,燃油定价都是门艺术,主要依靠人类的运算和直觉。随着人工智能与机器学习的兴起,它们的巨大潜力将使燃油定价更准确有效。目前,测试阶段正使用一种新定价工具来测试这一方法。
PriceAdvantage公司燃油定价软件的测试与反思 线性算法不适用
PriceAdvantage是Skyline Products(成立于1970年,为交通和石油行业设计和制造了40多年的智能标牌解决方案)的一个分公司,它之前的燃油定价软件使用了线性算法(linear algorithms)预测价格的变化,这将会影响零售商的销量和利润。但遗憾的是,这一方法并不完善。
PriceAdvantage的科学数据专员Brendan Doner表示,如果价格降低两美分,通过该方法得到的预测结果会出现约30%的错误,结果并不十分准确。
这款燃油定价软件采用了一种自上而下的建模方式。这一方法是基于经济学建立的,Doner以及他的同事都认为这应该有效(但事实并非如此)。根据这些假设创建了一个模型,模型中给出的价格就是定下的大致燃油价格。
他举了个例子,例如,该模型中零售商为了实现盈利目标,提高汽油价格,使其比以往的定价高出10美分,比市场价格高出6美分。顾客一定会说“这太疯狂了。或许今天我会获得更多利润,但从现在开始三个星期以后,如果所有人都意识到我们的定价高的时候,我们将失去所有的顾客”。
另一方面,旧的模型会建议降低燃油价格以增加销量,而不管其他地点的营业动态。这一模型是基于经济学课本知识建立的——如果你降低了燃油价格,今天就会卖出更多燃油,Doner认为这已经老套过时了。
线性运算的另一个问题是:不能将竞争对手对价格变化的反应考虑在内。有经验的零售商通过频繁的现场调查或定期油价信息服务(OPIS)获得价格数据反馈,快速了解竞争对手的价格变化。因此,他们可以更快地做出反应,使竞争对手不能实现期望的销量或利润增长。
Doner表示,旧模型从现实生活定价的因果中吸取经验,并依此调整定价方式方面做的不好。要摒弃“我们认为它应该发挥作用”的想法,要在现实中观察到底是如何发挥作用的,这更像是一种自下而上的方法。
AI成为“新”燃油定价软件核心
PriceAdvantage所追求的不是创造一个算法,让零售商盲目定价或者简单给出一个建议的燃油价格。而是希望这个经济模型可以为燃油价格分析师提供数据,帮助他们更好的了解该定价背后的来龙去脉。而人工智能技术成为PriceAdvantage“新”燃油定价软件的核心。
Doner说道,大多数人认为人工智能是靠神经网络支持的,这些巨大模型就像个黑匣子,人们并不清楚为什么它要给出这样的定价建议,为什么在这个地点卖的更多或在这一天卖的更少。但是这些模型却能够准确的预测出价格变化将会如何影响燃油的销量及利润。
PriceAdvantage采用了一种基于概率的模型,能够向燃油分析师提供价格变动成功的概率。相比之下,旧模型虽可提供建议价格以及以这种价格预计燃油售出的量,但并未提供实现该预测的置信水平(confidence level,置信水平是指特定个体对待特定命题真实性相信的程度,也就是概率是对个人信念合理性的量度)。而新模型告诉零售商,该价格变动下实现销售目标的可能性为57%。
“新”燃油定价软件更能满足零售商的个别需求,它可以根据店铺人员数量、利润或店内销售目标,随时计算每一个店铺在不同市场下的成功率。新模型也能显示价格改变的时机对其完成目标可能性的影响。比如,如果店铺燃油定价比市场定价稍高一点或许更有可能实现销售目标。
Doner表示,之前的工具(旧的燃油定价软件)无法实现的一项功能是了解竞争者的反应。如果在星期三下午三点更改定价,这个价格可以保持到第二天早上。或者如果在顾客流量很大的早上更改定价,这个时间正是竞争对手进行价格调查或者获得OPIS信息反馈的时间,所以他们会紧跟你的步伐调整价格。
或是周二下午,零售商网站将24小时监视市场并对价格变动作出回应。但在星期一顾客流量高峰期该段时间会缩短为12小时。或者说竞争对手对于2美分的降价或许不会有太大的反应,但4美分的降价将会导致整个市场降价。
AU能源公司用了“新”燃油定价软件 效果还不错
过去五年里,加利福尼亚州弗里蒙特的AU能源公司(AU Energy LLC)一直是PriceAdvantage的客户,其在加利福尼亚有119个Loop Neighborhood便利店。“新”燃油定价软件的应用将给该公司带来巨大潜能。
Varish Goyal是AU能源公司的总裁,他表示,我们销售的主要商品之一是燃油,传统燃油定价的方法是“人为定价”。必须有人进行价格调查,并将结果输入系统。同时必须有人进入系统,查看这些价格,决定如何定价。我们正在尝试使用工具提升客户体验,希望在不断变化的市场环境下,能够利用AI技术作出更有效更快速的回应,帮助我们的客户以最优惠的价格获得最好的体验。
除了对竞争对手的燃油价格变化保持警觉,AU能源公司希望AI工具能够帮助他们更好地了解竞争对手如何对他们公司的定价变化作出反应。
Goyal说道,也许这位经理从未进行过价格调查,可我们需要不断更新价格调查结果,万一发生飓风天气,一天之内燃油市场价格将急剧变化,迫使一天之内进行不止一次的价格调查,才能努力跟上市场变化。这是我们对人工智能技术感兴趣的原因,它是否有让我们更快获得燃油信息的办法?这样我们可以对市场变化做出更快的反应。
数据对于人工智能模式来说既是机遇也是挑战。Goyal补充道,AI太新颖了,需要花费大量时间思考,确保理解这些数据呈现的到底是什么,以及如何才能以最好的方式利用这些数据。
对此,Doner举了个例子,例如,一个零售点网站连续两天不会显示任何批量销售记录,因商店经理连续几天没有做账目结算,但第三天会显示数量庞大的销售总额。因此,零售点必须建立合理流程,确保数据的可靠性,并及时进行账目结算,以提高提高工具的效力。他表示,真正需要的是好的、有效的数据,这些数据适用于任何类型的模型。也需要大量准确的历史记录。而获取数据的速度越快,获得可靠分析的速度就越快,分析也越接近实时分析。我们的目标是将其直接绑定到销售点系统,欧洲的一些零售点已经实现了这一目标。
在预测燃油销售量方面,新的AI模型(“新”燃油定价软件beta版)存在10%的误差率,而基于线性算法的模型(旧燃油定价软件)误差率则是30%。Doner强调,这不是我们的终极目标。我们想要的比这个更精准。
有趣的是,人性可能是AI工具考虑的最令其困惑的因素之一,比如该模型需要创建一个准确价格模型时,对人工智能模型构成挑战的是单站点零售商,因财务流程不同,这些零售商的做法可能更显“古怪”。Doner补充说,可能他们这个月开销很大,定价也参差不齐,对市场也不能快速做出反应。一位PriceAdvantage的客户提到,他竞争对手的燃油定价比平时高出20美分,因为他的女儿正准备结婚。提高定价后他的利润更高,可以支付他女儿婚礼的费用。
今年夏天,新的AI估价建模工具完成了beta版测试,其将在2017年NACS展会上亮相发布,Doner指出,AI驱动模型发布后可以立即投入使用,但它并不能取代优秀的燃油价格分析师。AI驱动模型是个很好的工具,但有能力的人使用这个工具会有更大收获。我们不是要取代分析师,只是努力为他们提供一个更好的分析工具。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。