教师在课堂上教小学生们使用平板电脑(图:GETTY)
AI技术如何更好地在教育和娱乐领域发挥作用?原帖发布在知识普及与分享论坛Quora上,下面来看专业人士给出的答案。
回答者为Patricia Scanlon博士,SoapBox Labs创始人:
说起孩子和科技的交集,大多数讨论都集中在“孩子每天看几个小时屏幕”或者“孩子们到底该不该接触科技”等等。但也许真正重要的问题应该是——科技能够为学生们的学习和娱乐生活带来哪些独特的助益?我们又该如何实现这些助益?
语音识别是一种AI技术,可以通过语音为孩子们提供许多独一无二的学习和娱乐体验。就个人来看,我觉得这是个独特的机会,有望使用语音识别为所有年龄段和学习阶段
的孩子们提供更强大、更快乐也更加身临其境的体验。而且这种体验是他们在其他场景中所享受不到的。
下面仅举几例:
1.阅读:语音阅读工具能够在孩子学会阅读、识字或者说话之前帮助他们尽快跨过阅读门槛,提前消解掉相当一部分阅读障碍问题。而当孩子们真正接触书籍时,支持语音的阅读应用还能在过程中倾听、提示、纠正并鼓励他们把握文中含义,如同身边始终伴有一位耐心的成年指导者。
支持语音的阅读应用能够即时准确地提供反馈信息,帮助孩子自主进步、定期练习、评估自己的阅读能力并发现需要改进的方面。支持语音的阅读评估系统则即时帮助教育工作者和家长及时了解孩子对哪部分内容理解不到位,并帮助他们以更加个性化的方式支持孩子们达成阅读目标。
2.语言学习:评估工具可以聆听孩子们的朗读语音,并立即返回发音得分与鼓励反馈,整个体验与家长或教师的陪伴非常相似。以面向2到6岁儿童的英语学习平台Lingumi为例,它就把专为儿童设计的语音识别技术嵌入到应用之内,使其能够在儿童朗读口语练习时认真“倾听”,之后根据发音是否标准、朗读是否流利等指标如同经验丰富的语言教师那样给出准确的即时反馈意见。
3.数学:尚不识字的孩子们也可以使用支持语音功能的应用,帮助他们在认识数字之前就初步理解这些符号背后的抽象概念。支持语音的应用能让整个数学学习体验变得更有趣、互动性更强。这些应用提供的课程内容也会随着孩子的成长和数学技能的加深而不断调整。
我们可以设想一位6岁的孩子在家中第一次接触数学:应用会向他们展示一张包含5个苹果的图片,并问孩子“你能看到多少个苹果?”孩子脱口而出“5个!”应用会返回正确的语音提示,并进一步发问“如果你吃掉3个,还剩几个?”孩子则叫道“2个!”孩子答对的问题越多,应用后续提出的问题就越难。如果孩子回答错误,应用则会在提示之后鼓励对方尝试再次作答。
4.交互式电视:如今的儿童向剧集和电影固然有趣,但本质上仍然只是一段被动的单向体验。孩子虽然喜欢爱探险的朵拉,但永远无法与她交谈并帮助她探索丛林。而语音功能的加入将彻底颠覆传统娱乐范式。
未来的电视和电影可能提供诸多分支,孩子可以在其中引导自己最喜爱的角色并选择他们接下来要去哪里一探究竟。交互式电视让孩子们有机会享受到每次不同的探险开端、中段与结尾。只要喊出自己的选择,孩子们就能在自己喜欢的节目中随时开启一段新的旅程。当然,这只是我对于未来交互式电视观看体验的一种畅想,但我真心希望自己的孩子能够拥有这样美好的童年经历。
好文章,需要你的鼓励
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。
谷歌DeepMind团队开发的GraphCast是一个革命性的AI天气预测模型,能够在不到一分钟内完成10天全球天气预报,准确性超越传统方法90%的指标。该模型采用图神经网络技术,通过学习40年历史数据掌握天气变化规律,在极端天气预测方面表现卓越,能耗仅为传统方法的千分之一,为气象学领域带来了效率和精度的双重突破。