百度美研要做的第三件事则是做最有挑战的项目,这些项目包括:山西阳泉的新数据中心;大数据预测;百度天眼;医疗大数据分析;语音识别技术等。
其中,百度天眼项目受到极大关注。这是一款可以实时知晓飞机航线的产品,其数据通过地面设备得到,而非官方渠道获取信息,这解决了拿不到数据以及信息滞后这两大问题。此外,百度的语音识别技术也获得突破,在一项识别错误率的比较中,百度无论在安静环境还是噪音环境中,识别正确率都高于谷歌。百度高级技术总监吕厚昌表示:“尽管有这些成果,但还只是一小步,百度美研未来任重而道远。”
对于中国如何学习硅谷精神,百度The Big Talk特意邀请到Apple的联合创始人沃兹尼亚克来谈此话题。沃兹尼亚克说,“硅谷已经从硬变软,硅谷精神是内生的,这些科技人士在此学习长大。”值得注意的是,在他看来,创业是一种空前的快乐。这或许就是硅谷为何能持续创新和拥有激情的本质。
好文章,需要你的鼓励
Queen's大学研究团队提出结构化智能体软件工程框架SASE,重新定义人机协作模式。该框架将程序员角色从代码编写者转变为AI团队指挥者,建立双向咨询机制和标准化文档系统,解决AI编程中的质量控制难题,为软件工程向智能化协作时代转型提供系统性解决方案。
西北工业大学与中山大学合作开发了首个超声专用AI视觉语言模型EchoVLM,通过收集15家医院20万病例和147万超声图像,采用专家混合架构,实现了比通用AI模型准确率提升10分以上的突破。该系统能自动生成超声报告、进行诊断分析和回答专业问题,为医生提供智能辅助,推动医疗AI向专业化发展。
上海AI实验室团队发现自回归图像生成模型存在局部依赖、语义不一致和空间不变性缺失三大问题,提出ST-AR训练方法。该方法通过掩码注意力、跨步骤对比学习和跨视角对比学习,让AI"先理解再生成"。实验显示,ST-AR将LlamaGen模型的图像理解准确率提升一倍以上,图像生成质量提升42-49%,为构建更智能的多模态AI系统开辟新路径。