
百度美研要做的第三件事则是做最有挑战的项目,这些项目包括:山西阳泉的新数据中心;大数据预测;百度天眼;医疗大数据分析;语音识别技术等。
其中,百度天眼项目受到极大关注。这是一款可以实时知晓飞机航线的产品,其数据通过地面设备得到,而非官方渠道获取信息,这解决了拿不到数据以及信息滞后这两大问题。此外,百度的语音识别技术也获得突破,在一项识别错误率的比较中,百度无论在安静环境还是噪音环境中,识别正确率都高于谷歌。百度高级技术总监吕厚昌表示:“尽管有这些成果,但还只是一小步,百度美研未来任重而道远。”
对于中国如何学习硅谷精神,百度The Big Talk特意邀请到Apple的联合创始人沃兹尼亚克来谈此话题。沃兹尼亚克说,“硅谷已经从硬变软,硅谷精神是内生的,这些科技人士在此学习长大。”值得注意的是,在他看来,创业是一种空前的快乐。这或许就是硅谷为何能持续创新和拥有激情的本质。
好文章,需要你的鼓励
南华科技大学等顶尖院校联合发布的对角蒸馏技术实现了AI视频生成的重大突破,通过"前重后轻"的智能资源分配策略,在保持高质量的同时将生成速度提升277倍。该技术能在2.61秒内生成5秒视频,达到每秒31帧的流畅效果,有效解决了长视频生成中的质量衰减问题,为视频制作、教育内容创作等领域的实用化应用铺平了道路。
KRAFTON与KAIST联合研究揭示,当前最先进的AI视觉模型在识别图像间微妙差异方面存在显著不足。研究团队开发的VLM-SubtleBench测试平台显示,即使最好的AI模型准确率也仅有77.8%,远低于人类的95.5%。这一发现对医疗诊断、工业质检等需要精细视觉判断的关键应用领域具有重要警示意义。
南开大学联合字节跳动、清华大学团队发布视频理解新突破ASID-1M,创建包含100万精细化描述的数据集,将视频内容分解为八个详细属性。采用三阶段渐进训练法,让AI从单属性理解逐步发展到复杂长视频分析。在七项基准测试中表现优异,小规模模型性能可媲美大型商业系统,为视频内容创作、教育培训、娱乐媒体等领域提供强大技术支撑。
这项Google DeepMind的研究提出了"智能委托"框架,让AI助手学会像优秀项目经理一样分析任务、选择合作伙伴、监控进度和应对变化。通过建立信任体系和多重安全防护,该框架能够协调多个AI和人类专家高效协作,在个人助手、企业管理、科研合作等领域展现巨大应用潜力,代表了AI从被动工具向主动协作伙伴的重要转变。