据外媒2月14日报道,美国密歇根大学科学家们正利用人类的步态、身体对称性和足部位移,教授自动驾驶汽车识别和预测行人的行动,其精确度要高于现有技术。
据悉,汽车通过摄像头、激光雷达和全球定位系统(GPS)收集到的数据,可以使研究人员能够捕捉到人类活动的视频片段,然后在三维(3D)计算机模拟中再现它们。在此基础上,科学家们创造了一个“生物力学启发下的循环神经网络”,用于对人类运动进行分类。
据研究人员称,他们通过利用循环神经网络预测距离汽车约50码处的一个或几个行人的动作及其未来位置,该网络相当于一个城市交叉路口的规模。汽车要想拥有必要的预测能力,需要利用循环神经网络深入研究人类动作细节,其中包括人类步态的节奏(周期性)、四肢的镜像对称性,以及走路时脚的位置对人体稳定性的影响。
密歇根大学机械工程助理教授Ram Vasudevan说:“此前在这一领域的研究通常只关注静态图像,并不关注人们如何在三维空间中运动。然而,如果这些汽车要在现实世界中运作和互动,我们需要确保对行人所在位置的预测与车辆的下一步走向不一致。行人的动作和他们遥望的地方可以告诉你他们的注意力水平程度,也能告诉你他们下一步即将做什么。”
大部分将自动驾驶技术提升至目前水平的机器学习算法,都涉及二维图像—即静态照片。如果一台电脑展示了数百万张的停车标志照片,最终它将能够在现实世界中实时识别出停车标志。然而,通过利用运行数秒的视频片段,系统可以研究视频片段的前半部分来进行预测,然后用后半部分来验证准确性。
最终,研究结果表明,这种新系统提升了无人驾驶汽车预测未来最有可能发生情况的能力,有利于提高自动驾驶汽车的安全性。
获取更多评论