这么多年,一直静观Facebook、Google向开发者争宠,这次Twitter终于绷不住了!在今天召开的Twitter Flight大会上,社交小鸟高调宣布向移动平台提供商转型。翅膀硬了,Twitter不再甘心活在只有’推文’的世界里。
这是个挺有意思的会议,一场跟开发者之间的‘开诚布公’的对话。技术大佬们出来讲了一上午code,都跟大家以往认识的那个Twitter(用来发微博刷新闻的软件)没多大关系。是的,从今以后,Twitter要以Twitter, Inc的形象示人,跻身到Facebook、Google、亚马逊......这个行列当中,开始为移动开发者提供后端支持和开发工具。
全世界有超过100万个app需要外包的技术支持才能得以正常运转。Twitter Inc.的长远计划是,通过自己的工具帮助千千万万的开发者赚钱,减少他们app的崩溃次数,并借此与之建立关系,令Twitter长期受益。如果Twitter的这个算盘打得转,说白了大家以后用不用Twitter发推文都无所谓了,反正你每次用手机(上面的app)的时候就等于用到了Twitter家的产品,你可能根本意识不到。
到目前为止,一个公司想要获得如此’入口级’的存在只有两条路:弄出个iPhone这样的街机,再不然就是鼓捣操作系统。Twitter没打算去做Twitter OS或者Twitter phone,而是决定通过’潜伏’在各式各样的应用中,进而深化自己在移动互联世界的存在感。
此前,Twitter曾经扮过高冷,2012年的时候公布了更严格的API使用规则(限制对API的使用频率,禁止匿名访问API等等),跟不少第三方开发者的关系搞僵。随着公司战略发生变化,今起Twitter开始向开发者认真示好;具体就是,发布了名为Fabric的免费工具包,总共分为3款SDK,目前已经被Jawbone、Spotify、麦当劳等合作伙伴测试使用。
意在提升app的稳定性。Crashlytics去年被Twitter收购,它可以帮助开发者判断具体是哪行代码导致应用崩溃,还能帮助他们将早期应用版本分发给测试用户。
仅仅借助几行代码,任何开发者都可以用MoPub变现自己的应用。该移动广告交易市场也是去年被Twitter收购的;它通过让广告主对广告位进行实时竞价的方式,填补移动应用中的空白广告位。任何开发者可以MoPub来填补自己应用里的各种广告位,横幅或者原生都OK。
值得注意,MoPub可以直接为Twitter贡献收入;Twitter可从每笔广告费用中抽取一定比例的分成。据Twitter的数据,MoPub过去30天的广告展示次数已经超过1700亿次。
这部分可以将原来的Twitter产品延伸到其他应用。这个SDK包括一个叫Digits的产品,用户只需输入手机号码,即可创建一个新的第三方应用账号(目前,Snapchat和Whatsapp都在使用这种登陆方法)。现在Twitter的Digits让这个过程进一步地简化,以便所有第三方开发者都可以通过一行代码就将这个功能整合到自己的app里面。对于电子邮件普及率很低但仍然可以使用手机的地区,Digits会变得尤其有用。
此外,Twitter SDK还能方便开发者直接将Twitter里的内容嵌入到自己的应用。换句话说,Twitter希望将Twitter信息推送到原有Twitter平台之外。站在用户的角度,大家以后会在自己喜欢的应用中看到更多Twitter的推文。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。