淘宝最近在打假,靠的是大数据。
12月16日晚,淘宝公布,联手上海、福建、浙江、湖南等地公安机关,运用大数据查获一起网售假冒运动鞋案件,涉案总价值2150余万元。各地警方共立案5起,破案5起,抓获犯罪嫌疑人8名(其中刑事拘留8名),捣毁犯罪团伙1个、捣毁销售、仓储窝点7处,现场缴获各类各类假冒“耐克”运动鞋300余双,查封生产流水线2条。
值得注意的是,大数据在这起案件中发挥了关键性作用。
今年4月,上海市公安局奉贤分局经侦支队在侦办“褚某等人销售假冒‘耐克’品牌运动鞋案”中发现,犯罪嫌疑人褚某,赵某利用淘宝等网络平台销售假货,这为打击留下了可追寻的线索。阿里巴巴集团网络信息安全部专家通过大数据分析后发现,嫌疑人账户曾多次从福建莆田人张某处,大量购入假冒“乔丹”品牌运动鞋,并大量销售至福建、北京、上海、浙江、湖南等地。
经过双方协作,通过嫌疑人的帐户交易数据、物流发货信息等进行交叉对比分析,警方迅速掌握了一个以福建莆田为生产源头,经销网络涉及上海、浙江、福建、湖南等地的生产销售假冒“耐克”等品牌运动鞋的犯罪团伙。
在掌握了整个假货生产销售体系的数据信息后,10月底,上海、福建、浙江、湖南等地警方联手出动51 名警力,对上海市奉贤区褚某等人销售假冒“耐克”品牌运动鞋案战役开展集中收网行动,一举捣毁了这一覆盖假货生产、批发、销售全链条的黑色产业链。
阿里巴巴集团安全部知识产权保护专家介绍,随着淘宝网保护知识产权水平的不断提高,售假者的行为已变得越来越隐蔽。
“但网上交易行为都会留下数据记录,通过大数据手段对这些数据进行交叉分析,再狡猾的狐狸也终会露出马脚,”该名专家表示。
继昨日《2014年淘宝联动警方打击假货报告》后,淘宝方面于今日又公布了《2014年淘宝联动知识产权局打假报告》。报告显示,自2010年起,淘宝联手知识产权局已处理各类专利侵权投诉案件3000余件。截至12月12日,共破获18个集群,端掉200多个制售假窝点,抓获犯罪嫌疑人近400人。
引入专业产权机构
报告显示,阿里巴巴集团与国家知识产权局的系列协作在今年得到继续加强,2014年4月-7月,浙江省和省内各地级市知识产权维权援助中心进驻电商平台,5个地级市的知识产权人入驻阿里巴巴,开展电子商务领域专利保护专项行动。
一系列动作收到了良好效果。在2014年4月-7月的联合保障知识产权行动中共处理343起案件,计2009条链接,涉及外观、实用新型、发明各类型的专利侵权判定。
在此基础上,12月15日,浙江省知识产权局与阿里巴巴集团合作出台全国首个《电子商务领域专利保护工作指导意见》,探索建立电商环境下的专利侵权纠纷投诉处理新机制。
平台已经逐步建立
目前,新专利法征求意见稿正在紧锣密鼓准备中,阿里巴巴向新专利法立法起草小组配合国家知识产权局条法司、中国专利保护协会多次调研。
这份报告还介绍了淘宝平台在2014年保护知识产权的相关数据。2014年由淘宝平台处理的专利侵权投诉案中,外观专利侵权占74%,实用新型专利侵权占23%,发明专利侵权占3%。各个行业中,侵权投诉案件排名第一位的是3C数码、小家电;第二位为日用品;第三位为文化体育用品。
报告之外的一项数据显示,截止到2014年9月底,与阿里巴巴有知识产权合作的品牌权利人已达1137个。今年,阿里巴巴知识产权保护平台继续得到加强,4月份,阿里巴巴同韩国知识产权保护协会签订了谅解备忘录,9月份,再同英中贸易协会和商业软件联盟(Business Software Alliance)签订谅解备忘录。
淘宝方面表示,迄今为止,这一平台已逐步建起了涵盖政府部门、权利人、卖家、消费者的知识产权保护综合体系。
好文章,需要你的鼓励
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。
这篇论文介绍了LegalSearchLM,一种创新的法律案例检索方法,将检索任务重新定义为法律要素生成。研究团队构建了LEGAR BENCH数据集,涵盖411种犯罪类型和120万案例,并开发了能直接生成关键法律要素的检索模型。实验表明,该模型在准确率上超越传统方法6-20%,且在未见犯罪类型上展现出强大泛化能力。这一突破为法律专业人士提供了更高效、精准的案例检索工具。