在去年的甲骨文全球大会上海,甲骨文公司数据库技术产品高级副总裁Andrew Mendelsohn携正式发布不久的甲骨文旗舰数据库Oracle Database 12c登场,12c让他成为了当时的“明星”。在本次甲骨文总部之行中,我们也采访了这位在甲骨文工作30年、25年前就访问过中国客户的数据库产品线元老。
甲骨文公司数据库技术产品高级副总裁Andrew Mendelsohn
其实对于甲骨文数据库的市场份额以及优势无须赘述,而面对云计算和大数据的高速发展,Andrew Mendelsohn认为这也是甲骨文数据库产品增长的驱动力。
在当前云计算发展进程中,更多客户主要还是考虑把应用软件放到云上,通过云来实现自动化,若要支持这些应用软件的运行,就需要包括甲骨文数据库在内的产品来支持。对甲骨文来说,关心是否市场上所有应用软件厂商在提供云模式后都还能够继续使用甲骨文的数据库,而事实的确如此。目前世界上规模最大的SaaS公司使用的都是甲骨文数据库产品,Salesforce.com甚至还买了50台甲骨文Exadata一体机。
而当所有客户都开始认识到要更好的利用大数据时,就要有数据库平台或者Exadata一体机这样的平台来运行大数据。这也是甲骨文数据库增长的驱动。
提及甲骨文数据库,12c中的内存数据库增强功能因为与竞争友商的“争论”而引发关注,Andrew Mendelsohn表示,其区别于对手之处在于:甲骨文在保留原有数据库高性能交易处理基础上增加高性能数据分析性能;客户不用做任何的数据迁移工作;原先数据库可靠性、可用性原封不动保留,对原先数据库功能不需做任何改动和牺牲。
据他介绍,在今年夏季,甲骨文数据库12c就会提供内存数据库增强功能选件;该功能也将可以在所有甲骨文集成系统上运行,使得一体机不仅能发挥数据库产品最佳性能,也能发挥内存数据库选件的最高性能;而在明年推出的下一代SPAC芯片中,也会把内存选件性能发挥到极致。
因为对中国客户和市场非常了解,Andrew Mendelsohn介绍了很多中国的情况。福建移动利用甲骨文Exadata集成系统运行250T数据;华为利用甲骨文Exadata集成系统运行200T数据。在中国有很多银行、金融机构、保险公司、电信运营商在广泛采用Exadata集成系统解决方案。原来越多国内客户把Exadata作为部署私有云的基础,同时也考虑部署在公有云上。
Andrew Mendelsohn认为中国对甲骨文的意义不仅是有客户,还是重要的研发基地。他团队10%的数据库研发人员在中国工作,在美国本地也有20%数据库研发人员是出生在中国。甲骨文数据库部门设立下三个客户顾问委员会,其中有北美的客户顾问委员会、中国客户顾问委员会和其他地区的客户顾问委员会。从这一设置足见中国市场的重要性。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。