9月12日, 普元与计世传媒集团新金融世界联合举办的“2014中国金融云平台峰会”在北京召开。本届峰会以“互联网金融时代的大数据应用”为主题,与会嘉宾涵盖银行、保险、证券、互联网金融等领域的权威专家、公司CIO以及负责信息技术、产品创新的部门负责人,深度探讨了金融业的数据整合、数据挖掘、数据治理、数据平台、数据安全等热点问题,并对互联网金融时代的大数据应用创新与实践进行了分享,旨在推动国内金融领域在互联网金融时代成功转型。
在此次金融云平台峰会上,计世传媒集团总裁与新金融世界出版人黎争、国家信息中心副研究员李良博士、普元CTO焦烈焱、TalkingData数据商业部高级总监陈星霖、中国建设银行产品与创新管理部副总经理赵志宏、宁波银行信息科技部总经理沈栋等重量级演讲嘉宾从互联网金融的大数据应用、分析、架构和解决方案等方面分享了他们的创新理念和最佳实践。
大数据应用基石:数据治理
金融业是典型的数据驱动行业,在这一行业,大数据无处不在:交易、报价、业绩报告、消费者研究报告、官方统计数据公报、调查、新闻报道等皆是数据来源。在此次金融云平台峰会上,计世传媒集团总裁与新金融世界出版人黎争指出,企业需要利用大数据来判断消费者的需要、对企业的反馈,以及怎样针对不同消费者推出相应的产品和技术。中国建设银行产品与创新管理部副总经理赵志宏表示,金融行业已在大数据应用指引下,完全向客户化定制时代过渡。国家信息中心副研究员李良博士则认为,大数据的价值在于如何成为预警和规避风险、提高资产质量、扩大利润空间和提升核心竞争力的关键。
那么,如何在互联网金融下如此繁杂的大数据中,有效利用与驾驭数据呢?普元CTO焦烈焱在此次金融云平台峰会上强调:大数据应用的前提是高质量的数据,数据治理应是基石和关键。焦烈焱认为当下CIO应以资产的角度来管理数据,让数据对内发挥作用,对外产生效益,并需解决在多种技术混合下的大数据治理的实时性和快速交互等问题。宁波银行信息科技部总经理沈栋更是以自身的实际案例来说明,良好的数据治理应以“大平台”的策略逐步实现。
普元数据治理平台:实现可落地的大数据治理
普元大数据产品线总经理王轩在此次金融云平台峰会上表示,监管机构很早就认识到数据治理的重要性,2011年银监会启动了数据质量管理标准的检查,在为金融客户实施的数据治理项目中,普元总结出可落地的大数据治理的一套方法论:在做数据治理时客户不仅要有强有力的组织架构、完善的制度流程,更要有良好的平台支撑和成熟的实施方法。在峰会上,王轩还分享了普元的数据治理平台Primeton Data Governance在金融业的众多成功应用:从大型的政策型的银行、大型的城市商业银行到大型的资产公司,普元数据治理平台领先的技术和方法论可以从根本帮助用户解决数据质量的问题,并有效地分析系统数据之间的来龙去脉。
王轩强调,普元大数据平台有非实时数据整合、实时数据整合、数据治理、数据发布、数据可视化、数据分析等一系列产品,可提供从咨询、数据集成、数据治理到可视化的“一站式”服务,以标准化、模块化和动态可持续的IT平台助力金融行业大数据应用。在大数据架构的创新上,普元讲求“大平台+微服务”的概念,落点在客户最终体验上,即微小的快速服务体验,帮助合作伙伴快速实施应用,并产生效果。针对风险管理、数据管理等问题,普元通过业界流行的流式计算技术Storm,为金融行业这一面向海量客户的服务行业实现应用场景设置、实时风险控制、主动营销、时间预警等功能,为大数据安全保驾护航。
众多金融企业成功实施
普元自2010年开始涉足大数据领域,一直走在整个业界的前列。普元数据治理平台Primeton Data Governance,提供从数据治理咨询到工具落地实施一体化的解决方案,在业内特别是金融行业拥有丰富的成功实施案例,全力支持互联网金融时代的大数据应用,堪称大数据时代企业挖掘数据资产、高效分析、提升业务管理能力的利器。
普元数据治理平台Primeton Data Governance能够进行跨行业、多领域数据治理,拥有强大、灵活的数据接入能力,强大的解析能力,多平台一体化的分析能力。在中信银行的项目中,普元团队通过分析,实现了以业务价值为驱动的原则,在元数据信息整合共享、变更影响分析等环节发挥了重大作用,有力提升了日常工作的效率。除此之外,普元数据治理平台Primeton Data Governance在国家开发银行、上海银行等国内金融行业的重点企业,均已成功应用。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。