AI 能将物体和单词配对的结果,显示了语言中某些部分是可透过少量的经验来学习,不需要某种先天性的能力,团队中的一名心理学家表示这样的结果「动摇了我的世界观」。
生成式AI 的训练资料集是众所皆知的庞大,有时可能涵盖数兆个单字,反观人类小时候仅需要一小部分的资料,便能发展出完整的沟通方式。儿童究竟如何学会语言,以及对语言学习的理解能如何让AI 模型更上一层楼,也是科学家们着墨的领域。
其中纽约大学研究人员在《科学》杂志刊登了一篇新论文,团队提供AI 儿童学习语言时的数据集,发现AI 能藉由少量的资料,将单字与代表的物体配对。
研究团队让一名来自澳洲儿童「山姆」佩戴头盔摄影机,在长达一年半的时间中(六个月大至两岁),共拍摄了长61 小时的影片。影片记录山姆视角所看到的环境,包括家里养的两只猫、父母、婴儿床、玩具和食物等。
为了进一步训练AI 模型,研究人员将60 万个影格,和山姆环境中共3.75 万则话语进行配对,部分组合能成功配对,其他则无法配对。团队也提供模型两条线索:物体和词语同时出现就代表可能有关系;当物体和单词未同时出现时则代表可能不匹配。
AI 能将物体和单词配对的结果,显示了语言中某些部分是可透过少量的经验来学习,不需要某种先天性的能力,团队中的一名心理学家表示这样的结果「动摇了我的世界观」。(由于儿童身处的环境时常很复杂,有多种物品散布各地,听到的单字也有可能含多种意义,因此有些发展心理学家认为,儿童能学会说话是源自于对语言有某种先天性的理解。)
研究的下一个阶段是要持续探索如何让AI 模型学习的模式更接近儿童的发展,因此接下来需要收集更多资料,包括让18 个月大的儿童也开始配戴摄影机来进行实验。
如果AI 模型能仿效人类部分的学习语言模式,或许就能让AI 的学习更加有效率,能学到字句内涵的意义、对新情境做出反应,或从新经验中学习,离人类再靠近一步。
研究论文:Wai Keen Vong et al. ,Grounded language acquisition through the eyes and ears of a single child.Science383,504-511(2024).DOI:10.1126/science.adi1374
本文来自INSIDE,经授权后发布,本文观点不代表沙鸥科报立场,转载请联系原作者。