CNET科技行者 9月1日 北京消息:8月30日,高通和奇景光电宣布将展开合作,加速高分辨率、低功耗、主动3D深度传感摄像头系统的开发与商用,以面向手机、物联网(IoT)、安防监控、汽车和增强现实/虚拟现实(AR/VR)领域中的生物特征人脸识别、3D重建和场景感知等用例,支持计算机视觉功能。
此次合作融合了Qualcomm Spectra™在计算机视觉架构与算法上的技术与专长,以及奇景光电在晶圆光学、传感、驱动和模组集成能力上的配套技术,以提供完全集成的SLiM™(结构光模组)3D解决方案。SLiM™是一站式完整3D摄像头模组,可在室内外环境中,提供高分辨率、高精确度表现的实时深度传感和3D点云生成。SLiM™的外形设计非常紧凑、简单,并具有极低功耗,从而使该解决方案成为集成在嵌入式和移动终端内的理想选择。Qualcomm Technologies和奇景光电将把SLiM™ 3D摄像头作为面向广泛市场与行业的完整摄像头系统解决方案投入商用,预计将于2018年第一季度实现量产。
Qualcomm Technologies, Inc.高级副总裁兼亚太与印度区总裁Jim Cathey表示:“此次与奇景光电的合作,突出展现了我们与台湾企业所做的技术投入,将继续引领视觉处理领域的创新。结合先进技术许可,以及与奇景光电这样业界领先的台湾合作伙伴的协作,将帮助我们在台湾打造具有突破性的全新产品,强化全球3D深度传感生态系统,并提振台湾经济。”
Qualcomm Technologies, Inc.工程技术副总裁章建中表示:“作为一名工程师,我们很高兴能够见证我们的技术创新如何为全球消费者带来体验更加丰富的产品。与奇景光电合作在智能手机、虚拟现实和增强现实产品中支持3D计算机视觉技术,是一次非常宝贵的经验。”
奇景光电CEO吴炳昌表示:“我们的3D传感解决方案是一项改变产业的突破性技术。我们将为Android生态系统的智能手机,提供下一代移动用户新体验。我们两家公司在SLiM™ 3D传感解决方案上,已经共同合作超过四年,以满足日益增长的计算机视觉功能需求,并在广泛的市场和应用上,提供令人惊叹的全新功能和使用场景。奇景光电很高兴与Qualcomm Technologies共同合作,为我们的客户提供及时的支持,为整个生态系统创造革新性的计算机视觉新应用。”
关于奇景光电
奇景光电(NASDAQ: HIMX)是专注于显示影像处理技术的无晶圆厂半导体解决方案供应商。奇景光电是全球显示驱动IC和时序控制器的领先厂商,产品应用于电视、笔记本电脑、台式电脑、手机、平板电脑、数码相机、汽车导航、虚拟现实终端和其他多种消费电子终端。此外,奇景光电设计并提供触控传感显示器控制器、内嵌式触控与显示驱动集成(TDDI)单片解决方案、LED驱动IC、电源管理IC、监视器与投影仪控制产品、定制视频处理IC解决方案、提供硅片授权、以及面向增强现实终端和汽车头戴式显示器(HUD)的LCOS微显示器。公司还提供数码相机解决方案,包括用于增强现实终端、3D传感与机器视觉的CMOS图像传感器和晶圆级光学部件。产品在各种各样的应用中广泛使用,如手机、平板电脑、笔记本电脑、电视、PC摄像头、汽车、安防、医疗设备和物联网等。奇景光电成立于2001年,总部位于台湾台南市,目前有2,100多名员工,分布于台南、新竹和台北等三个台湾办事处以及中国大陆、韩国、日本和美国等国家办事处。截至2017年6月30日,奇景光电在全球拥有3,000项授权专利和404项待审专利。奇景光电向全球消费电子品牌提供显示图像处理半导体解决方案,一直保持着领先供应商的地位。
好文章,需要你的鼓励
北航团队推出Easy Dataset框架,通过直观的图形界面和角色驱动的生成方法,让普通用户能够轻松将各种格式文档转换为高质量的AI训练数据。该工具集成了智能文档解析、混合分块策略和个性化问答生成功能,在金融领域实验中显著提升了AI模型的专业表现,同时保持通用能力。项目已开源并获得超过9000颗GitHub星标。
卢森堡计算机事件响应中心开发的VLAI系统,基于RoBERTa模型,能够通过阅读漏洞描述自动判断危险等级。该系统在60万个真实漏洞数据上训练,准确率达82.8%,已集成到实际安全服务中。研究采用开源方式,为网络安全专家提供快速漏洞风险评估工具,有效解决了官方评分发布前的安全决策难题。
中国电信研究院等机构联合开发的xVerify系统,专门解决复杂AI推理模型的评估难题。该系统能够准确判断包含多步推理过程的AI输出,在准确率和效率方面均超越现有方法,为AI评估领域提供了重要突破。
昆仑公司Skywork AI团队开发的Skywork R1V模型,成功将文本推理能力扩展到视觉领域。该模型仅用380亿参数就实现了与大型闭源模型相媲美的多模态推理性能,在MMMU测试中达到69.0分,在MathVista获得67.5分,同时保持了优秀的文本推理能力。研究团队采用高效的多模态迁移、混合优化框架和自适应推理链蒸馏三项核心技术,成功实现了视觉理解与逻辑推理的完美结合,并将所有代码和权重完全开源。