神经网络可以学习解决各种各样的问题,如识别照片中的猫、驾驶自动驾驶汽车等。但是人们还是不知道此类强大的模式识别算法是否真的理解其正在执行的任务。例如,一个神经网络的任务是让自动驾驶汽车保持在自己的车道上,其可以通过观察路边的灌木丛来学习如何做到这一点,而不是学习探测车道以及专注于道路地平线。
神经网络学习导航任务的因果结构(图片来源:MIT)
据外媒报道,美国麻省理工学院(MIT)的研究人员展示了当某种特定的神经网络被训练执行导航任务时,其能够理解该项任务真正的因果结构。因此此类神经网络能够直接从视觉数据理解该任务,当在树木密集或天气条件变化迅速的地方等复杂环境中导航时,此类神经网络比其他神经网络更高效。
未来,该项研究能够提升执行高风险的机器学习代理的可靠性和可信度,如在繁忙高速公路上驾驶自动驾驶汽车。
一种吸引人注意的结果
神经网络是一种进行机器学习的方法,计算机通过分析许多训练实例以及反复试验来学习完成任务,而“液体”神经网络则改变其基础方程,以不断适应新的输入信息。
该项新研究利用了此前Hasani和其他人的研究,后者展示了一种由液体神经网络细胞构建的、受大脑启发的深度学习系统-神经回路策略(Neural Circuit Policy,NCP),如何通过只有19个控制神经元的网络自动控制一辆自动驾驶汽车。
研究人员观察到,执行车道保持任务的NPC在做出驾驶决策时,会将注意力集中在道路的地平线和边界上,这与人类驾驶汽车时的做法相同,而所研究的其他神经网络并不会总会关注于道路。
他们发现,当一个NCP在接受完成一个任务的训练时,该神经网络学会与环境互动,并理解干预行为。从本质上看,该网络能够识别其输出是否被某种干预所改变,然后将因果联系在一起。
在训练过程中,该网络向前运行以生成输出,然后返回运行以纠正错误。研究人员观察到,NPC会在前向运行和后向运行模式中将因果关系关联起来,从而可以使该网络能够将注意力集中在真正的因果结构上。
Hasani及其同事无需对系统施加其他额外限制,也不需要为NCP进行特殊设置以学习此种因果关系——会在训练期间自动出现。
风化环境变化
研究人员通过一系列模拟测试NCP,在模拟场景中,无人机执行导航任务,每一架无人机采用单个摄像头的输入信息进行导航。
该无人机的任务是飞行一个特定目标,追随一个移动的目标,或者在不同环境中跟随一系列标记,如晴朗的天空、大雨以及雾。
研究人员发现,在天气好的情况下,NPC在较简单任务上的表现与其他神经网络一样好,但在更具挑战性的任务上,如在暴雨中跟随移动的物体时,NPC的表现要好于其他神经网络。
研究结果显示,采用NCP能够让无人机在条件变幻莫测的环境中成功导航,例如阳光明媚的天气突然变得雾蒙蒙时。
未来,研究人员希望探索采用NCP来构建更大的系统。将成千上万的神经网络连接在一起,从而让其处理更复杂的任务。
获取更多评论