学习新语言无疑是一项挑战,尤其是超过18岁的群体,往往更难掌握一门从未接触过的语言。但语言学习平台Duolingo(多邻国)对此有不同看法,他们称自己是“世界上最好的语言学习方式”,并希望在人工智能(AI)的帮助下攻克这一难题。
Duolingo成立于2011年,通过个性化学习、即时反馈以及游戏化/奖励等组合,目前已经发展为下载次数最多的教育应用之一。下面,我们一起来看人工智能技术如何帮助该公司为3亿用户提供个性化语言课程。
▲Duolingo使用人工智能构建免费语言学习平台
由卡耐基梅隆大学计算机科学家Luis von Ahn于匹兹堡创立的Duolingo,立场是“让世界上的所有人都能接受免费教育”。如今,该公司通过跨平台应用,为超过3亿多用户提供着涵盖30多种不同语言的个性化培训,其中包括西班牙语、纳瓦霍语甚至《星际迷航》中的克林贡语等等。
语言学习往往非常耗时——根据美国国务院估计,掌握一门语言通常需要600到1100个课时。但Duolingo则将整个学习过程拆分为多个可管理的单元,并对每个单元随时针对用户进行个性化调整,同时辅以乐趣满载且以积分为基础的奖励系统。用户可以免费使用此应用,并通过支付月度订阅费以获取高级服务并直接跳过广告内容。
人工智能是Duolingo达成“让世界上的所有人都能接受免费教育”这一重大使命的技术基础。从AI驱动型分班测试开始,Duolingo旨在确定每位用户需要掌握的语言入门知识。例如,如果某人希望学习法语并且曾在高中阶段接受过法语教学,那么其起点就要比从未接触过法语的用户高得多。为了确定每位用户在特定语言上的基础情况,Duolingo会根据用户是否正确回答了当前问题,来判断下一题该如何选择。只需要短短五分钟,测试就能帮助用户找到取适合自己的学习起点。这项功能有助于带来积极的用户体验,并减少起步阶段因枯燥无聊而很快放弃的用户比例。
除此之外,Duolingo应用使用人工智能实现的另一大核心功能,名为“间隔重复”。这项技术可在更长时间间隔之内持续提供个性化语言课程,相较于短时间内部署大量课业,这种方式能够带来更好的学习效果。此外,“滞后效应”对于提升Duolingo教学效果同样非常重要。有时候将每次测试之间的间隔拉长,会让用户获得更大的进步。所有这一切,都将由AI技术在后端负责控制。
随着学习进度的推进以及语言能力的提升,用户将以不同方式与课业内容进行交互。此时,使用深度学习的AI算法能够在任意给定时刻 预测用户能够在特定上下文中回忆起单词的概率,而后计算出该用户最需要练习的内容。此算法会分析用户数据,而后为其设计个性化的学习体验。
事实上,Duolingo能够生成大量数据,并据此创建预测性模型。数据的数量、类型与唯一性,也帮助这家公司在AI及研究负责人Burr Settles的推动下顺利步入发展快车道。比如,Duolingo提出的半衰期回归统计模型已经对数百万语言学习者的错误模式做出分析,借此提醒每位用户需要重视的知识要点,并为其提供最具价值的复习内容。
为了保证带来引人入胜的体验,Duolingo还提供AI驱动型聊天机器人,能够在应用内与用户通过语言进行自动对话并向对方教授语言。机器人不权能够帮助用户练习语言交流以提高语言技能,而且使用得越多,聊天机器人本身也会变得越聪明。该公司甚至开始考虑将相关服务扩展到虚拟现实技术,从而带来更具沉浸感的体验的可能性。
与其他人工智能一样,用户与AI交互得越多,AI模型的性能就越好。而AI越强大,其教学效果就越接近于人类语言教师。随着Duolingo人工智能的发展,这套免费教育平台正帮助全球更多用户快速掌握新的语言技能。
好文章,需要你的鼓励
清华大学等多家机构研究团队完成了语音分离技术的全面调研,系统梳理了从传统方法到深度学习的技术演进。研究揭示了"鸡尾酒会问题"的核心挑战,分析了各种学习范式和网络架构的优劣,并通过统一实验框架提供了公平的性能基准。调研涵盖了实时处理、轻量化设计、多模态融合等关键技术方向,为学术界和产业界的技术选型提供了重要参考,推动语音分离从实验室走向实际应用。
浙江大学和腾讯微信视觉团队发现AI图片生成训练中"时机胜过强度"的重要规律,开发出TempFlow-GRPO新方法。通过轨迹分支技术精确评估中间步骤,结合噪声感知权重调整优化不同阶段的学习强度,将训练效率提升三倍,在复杂场景理解方面准确率从63%提升至97%,为AI训练方法论带来重要突破。
谷歌DeepMind发布突破性AI规划技术,让机器人学会像人类一样进行"情境学习"规划。该技术通过Transformer架构实现了快速适应新问题的能力,在迷宫导航、机器人控制等测试中表现优异,为自动驾驶、智能制造、医疗等领域应用奠定基础,标志着向通用人工智能迈出重要一步。
新南威尔士大学研究团队开发了ZARA系统,这是首个零样本运动识别框架,能够在未经专门训练的情况下识别全新的人类活动。该系统集成了自动构建的知识库、多传感器检索机制和分层智能体推理,不仅实现了比现有最强基线高2.53倍的识别准确率,还提供清晰的自然语言解释,为可穿戴设备和健康监护等应用领域带来了突破性进展。