地平线总裁 陈黎明
以下内容为现场演讲实录:
尊敬的各位嘉宾,尊敬的各位业界同仁,大家早上好。今天非常荣幸有这个机会参加世界新能源大会,来跟大家分享,今天我要和大家分享的题目是用户价值驱动软硬结合技术推动智驾向高而行。
首先我们一起来看一下中国新能源汽车的发展,在2024年7月份新能源汽车的渗透率突破了50%,8月份以来进一步增加到将近54%。 整个上半年国产品牌的市场份额也达到了61.8%,今年估计会突破62%,另外我们也观察到几个现象,城区NOA成为智驾新发力点,在2022年的时候是30万以上的车才配备的,2023年就已经下降到20万了,2024年又有一款新的车型进一步下探了,突破了20万以下的区间。我们看到高级自动驾驶市场正处于一个增长的关键拐点。
我们初步判断2025年将会成为高阶智驾的一个决胜点,也是一个跨越鸿沟的关键节点。为什么这么讲呢,目前整个城区智驾的渗透率达到了8.5%,虽然还不是很高,但是从整个发展来看的话,已经进入了一个相对竞争的阶段,有越来越多的车型可能会配备城市NOA,新的创新和新的产品是否能够跨越鸿沟,一个非常重要的或者关键的点,就是这个产品本身的性能,给客户带来的价值能不能被大家接受。怎么样才能说是一个好的产品呢? 这一块驾驶的责任和功能分了L1到L5,地平线从用户的角度提了一个自动驾驶的分级,是把可用作为智能驾驶系统的1.0,给用户提供一个物理的安全保障,来帮助驾驶员进行辅助驾驶。对于智驾系统2.0的话,我们的定义是好用,在物理安全的基础之上提供了一个新的安全,同时它的整个体验要更加优化。
(直播没有声音少了一段)
到了2018年BEV算法,看图的算法成为一个主流,这就是它能够通过对多模态和多摄像头的特征进行前融合,来更好地感知车的周围环境,这样的话可以更好地解决我们在透视图的技术里面关于透视的问题,遮挡的问题,追踪的问题,整体的性能得到比较大的提升,同时BEV有局限性,它的CN算法比较关注局部,对于全局信息的建模能力比较差,对于物体目标的几何形状,还有视角的变化比较敏感,所以造成整个特征的提取还有效果都不太好。2021年推出BEV+transformer算法,这是目前主流的算法,transformer可以通过更好的对序列数据和全局上下文信息的融合处理来解决单纯BEV局限性的问题。同时它有更强的特征表达能力,对于视角变化,还有几何形状有更好的适应性,整个特征的提取更加稳定,成为目前主流的算法。
同时BEV+transformer有计算资源的问题,BEV对整个周边的环境是均匀地分配计算资源,这样的话就会造成很多地方不需要计算资源时的巨大浪费,整个算力上很难去平衡,主要造成的问题是对于远处目标的识别,还有高处的目标,比如红绿灯的识别都会受到限制,比如牺牲一些高处目标的探测和远处目标的识别,这就是BEV+transformer目前存在的一些挑战。
怎么解决呢?地平线在2022年提出了Sparse4D长时序纯稀疏融合感知架构,能够通过稀疏的融合感知框架来对计算资源进行充分的利用,这样的话就解决了计算资源不够的问题,同时通过长时序的特征融合来对物体进行更好的跟踪,整体的话能够实验端到端,从图象输入到轨迹的输出整个端到端的算法,我们可以看到跟其他的算法相比,在不同的处理速度下,它的整个综合精度都是最高的。我们可以看到它的显存占用降低53%,推理效率提升42%。在夜间密集人群的时候,可以看到它可以更准确的感知,对于远距的目标能够进行更好的识别,这样使得整个感知更加的精准。
今年1月份我们已经对这个算法进行了开源,希望让行业共同来推动这个算法进一步完善和推广应用,我们认为它会接棒BEV和transformer成为下一代感知的架构,对整个感知带来新的突破。
神经网络在自动驾驶里面的应用,之前都是感知和规控,它是一步步演进的,首先是感知的神经网络化,然后再进入规控的神经网络化,再往下就是模块化的端到端,再往下是全栈的端到端,对于初期的神经网络,刚开始还是根据感知,还有规控的功能分成一些小任务,用一些不同的神经网络模型来实现这些功能,从整体的性能来说,针对于规控它的追踪更精准,识别性能更好,同时它的整个算法是可解释的。对于汽车安全来讲比较关注的是,可解释性和可追溯性,因为应用了不同的模型,使得计算效率比较低,特征信息损失比较大,造成整个系统性能比较低,这就是最后为什么会发展到端到端,然后是全栈的端到端。端到端对于整个感知和规控当中,所有的特征信息是无损的传递,从图象的输入到最终的轨迹输出,利用所有的特征进行更好的感知和规控。
对于端到端到大模型来讲结构肯定更加简洁,计算效率更高,同时由于数据的驱动整个性能上线比较高,目前存在一个问题,纯粹的神经网络架构是一个黑盒,不具备可解释性,对于一些明确简单的任务它的处理下限很低,安全不一定能够得到保障,至少目前没有一个很好的解决方案。在端到端和全栈的端到端当中,地平线做了比较大的贡献,2020年底的时候地平线学者作为第一作者提了自动驾驶大模型UniAD,首次将检测、跟踪、建图、轨迹预测、占据栅格预测及规划整合到一个基于transformer端到端网络框架下,实现感知决策一体化,确保了整个过程中信息无损传递。同时也发挥了每个子模块的优势,对于中间过程的可解释性和可追溯性都起到比较好的作用。
下面再讲一下规控。规控这部分,从基于规则,发展到基于模仿学习再到强化学习,这样一步步发展的,我们知道基于规则的算法,它的规则非常明确,同时解释性也非常强,但它存在的问题是什么?它是通过写规则来模拟我们人的驾驶行为,这样的话我们知道驾驶是非常复杂的,不可能把所有人的驾驶行为全部通过手写把它变成一个很大的库,这是不可能的,同时整个规则出来的规控,拟人性比较差,机械感比较强,所以就出现了模拟机器学习,模拟机器学习主要是基于专家的轨迹,给智能学习策略,能够非常快速地学到合理有效的驾驶策略,使得整个驾驶更加拟人,但同时它也存在一个问题,毕竟它是模拟人的行为,相当于克隆,对于环境和规划生存的本质关系没有深层的理解和建立关系,在碰到复杂的场景时还是比较难解决的。另外,对于驾驶的多样性,还有高质量海量专家数据的收集也是非常大的工作量,在整个推广泛化过程中不是一个很好的技术。
接下来是基于强化的学习,不依赖于专家体系,通过对环境交互的积累进行奖惩,使得智能体得到最大的优化策略,克服了基于规则和模拟学习的弊端,同时它也存在其他的问题,如果奖惩函数设置的不好会出现性能不稳定的情况。另外它的拟人性也不好,毕竟是通过对环境和规划的学习,缺乏模拟学习的一些优势。怎么解决这个问题?地平线提出一种算法框架,进行交互博弈,通过这个框架能够看到,它可以很好地发挥模拟学习和强化学习的优势,交互学习采用了混合的方式,一方面通过模拟学习,学习效率比较高,另一方面它通过闭环强化学习,克服模仿学习存在的问题。与单纯的模拟学习相比,它的闭环性能更好,碰撞率降低50%。与单纯的强化学习规控策略相比,它具有更好的拟人性,使得整个舒适度提升20%。
接下来谈一下关于地图精确定位的问题,如果我们不能精确知道车道线的位置,就很难控制车辆保证车辆的安全性。目前主流用的还是高精地图,能够到厘米级的精度,对于定位提供非常好的帮助,同时我们也知道高清地图成本非常高,而且同时它的推广泛化可能性比较低,实时更新率也比较低。这使得我们在自动驾驶里面感受到某些区域有很好的表现,某些区域功能会关掉,就是因为没有高清地图。这两年出现新的技术,叫无图或者轻地图,无图不是真正的无图,是说不需要高精地图,而是低于高精地图的其他地图来支撑规划当中的需要。
怎么进行轻地图或者用其他的方式来进行自动驾驶,轻地图对于泛化是很好的方向,但是它也存在着对复杂的道路图谱的道路结构怎么进行理解和建模的问题,如果没有很好的技术,实际上跟高精地图情况一样,也会出现在不同的区域,自动驾驶性能下降的情况。
地平线怎么解决这个问题呢?我们目前也在探讨一套解决办法,刚才讲到基于高清地图主要是基于规则的,地平线应用世界模型算法,它是learning-based。它是通过用我们正常的导航地图,通过卫星定位GPS,通过数据的大量积累和训练,根据道路的情况以及车的实时感知、动态情况进行推理,加深对场景的理解和认知,建立自己的知识库,这样来进行定位和导航,帮助我们比较快地进行泛化和推广。
世界模型这一块主要通过这些传感器的输入,还有导航地图的输入,对周边的世界进行理解和认知学习,同时它能够输出一些动静态目标和网格信息来给规控做后面的应用。这里总结了目前地平线在整个软件框架,从感知到规控它的一个架构和框架。
一个交互博弈和整体通过端到端的世界模型对周边世界进行更好的认知和感知,接下来就是交互博弈来支撑城区自动驾驶的需要,这里我们没有完全采用端到端大模型,有一部分是端到端的规划,同时还有一个是混合的模型,这里面有博弈验证网络,还有规则进行安全兜底,同时对模型的输出进行评估,最后输出控制轨迹。地平线通过世界模型和交互博弈来实现“Scale Up”和“Scale Out”的最优解。
接下来讲一下芯片,前面讲地平线在整个行业算法方面的经验。接下来结合我们的产品来讲一下芯片技术在自动驾驶里面发展的过程,芯片它最主要是高速完成算法的需要,然后去提供最高效的计算,最短的延迟,来实现驾驶的任务,这是芯片要解决的问题。对于我们最早期的L2来讲,它最重要的是检测物体、语义分割,这是最主要的任务,优化算子,根据这样的任务和这样的算法,我们就提出第一代架构,随着高速NOA这个功能的引入,它完成的任务跟之前不一样,需要提供物体的跟踪和轨迹的预测,用到比较多的算法是LSTM、BEV、Transformer要优化Warping、Vector、Softmax,需要有一些新的创新来支撑任务。全场景NOA,最主要的城区NOA,最主要的任务是对环境的预测以及对复杂环境交互,这里面用到的算法主要还是大参数Transformer&GPT、蒙特卡洛树搜,它要优化的算子是Data Transformer和紧耦合异构计算,我们提出Nash架构,对整个效率进一步提升,还有对于交互博弈进行支持。它有强大的并行浮点算力、特别优化的超越函数、全新的存储系统。
我们在数据移动方面进行非常大的优化,减少了数据在核内的移动,还有减少数据在核之间的移动,同时减少数据对于存储器的读写,这样可以加快计算速度、计算效率,同时降低功耗,使得这一代架构相对于前两代架构来讲,比如说主流的CNN算法来讲,相对于Bernoulli提升了246倍,与transformer相比,相对于Bayes提升了27倍,通过整个对软件的需求来对硬件进行创新设计,来提升它的性能,就是刚才提到的如何高效地完成软件提出的任务。
对于交互博弈这一块,交互博弈它需要高频次的小模型的调度计算,要完成道路使用者所有之间实施的交互博弈,BPUⓇNash首先是完整支持矩阵、向量、标量计算和逻辑控制。通过灵活可编程的算力,支持用户自定义算法。它有专门设计的标量计算核,完成高频次小模型的调度计算,更灵活地处理各种任务,提升算法效率。
从整个计算和自动驾驶来讲,最重要的是减少整个系统的延迟。感受平滑不平滑,实际上跟整个的计算系统的计算效率,还有它的延迟有直接的关系,我们在最新的BPUⓇNash架构,这两个方面有了大的突破,我觉得这也是我们这次能够获奖的主要原因。
上面讲了算法,还有芯片技术的发展,芯片技术它不是纯粹自己发展的,完全是由应用的需要,软件发展的需求来驱动硬件的发展,使得硬件不断地向前去迭代,我们在软件方面有非常深的研究和积累,这也就是我们把在软件方面的积累和研究最新的成果,还有我们最新的芯片,集大成,形成SuperDrive。提供一个全栈的自动驾驶高阶解决方案,这就是通过我们在软件上面的视觉模型和交互博弈,利用我们的芯片来提供全场景高阶智能驾驶。
非常荣幸得到大会的认可。SuperDrive,包括了平时我们开车的所有场景,有两种模式,一种是车在开,人在看,另外一种是人在开,车在看。车在开,人在看指全场景智驾模式,具有顺畅丝滑的驾驶能力和主动、自信的驾驶风格,车帮助解决所有的问题。人在开,车在看,是指车提供一个全场景的安全兜底。
从整个大的架构来讲,跟传统的架构相比,传统架构更多是功能的一个一个堆积,不同的模块堆积出一个全功能的系统,SuperDrive 是一个框架,通过一个框架来实现所有功能,它是一个完整的系统,只要驾驶员给A到B的指令,就能够按照驾驶员的规划进行自动控制,达到一键激活,让驾驶员能够轻松享受每一程。
在北京最近下雨的一个晚高峰,在没有车道线的情况下也能够很好地进行自动驾驶,对于打伞的行人还有骑车的人能够礼让让行。在城市下雨天,雨很大,也能够很好地跟周边进行交互博弈。在无保护的左转,能够见缝插针地进行博弈,不会停下来,在该让人的地方进行礼让,不会鲁莽地进行抢道,在很窄的地方处理跟其他车辆的礼让。很多主机厂朋友还有很多行业领导都试乘过我们的系统,给出的评价非常高。
我们从去年10月份立的项,目前投入1000多人开发这个项目,时间虽然比较短,但是进展非常快速,我们今年Q2已经跟多家客户达成了合作意向,今年年底我们会完成全国的泛化,出来一个标准的方案,对于最终的量产我们目前计划在明年的Q3,有一个量产的车型展现给大家,目前是这样一个计划,所以整体的话我们希望通过我们的技术来达到一个行业的标杆,能够让我们看到高阶自动驾驶的上限在什么地方,能够到达什么程度。
同时我们还跟我们的合作伙伴密切的合作,在前期推进过程当中也是一样,首先地平线搭了一个样板房,打了一个标杆来证明我们的技术和我们的芯片,再去赋能我们的合作伙伴,一起去推动自动驾驶技术的发展,对于这个高阶自动驾驶SuperDrive 也是一样,我们首先是打造一个样板间,打造一个标杆,技术成熟的时候和我们的合作伙伴,一起推动自动驾驶的发展,同时也实现成本上的优化。在所有产业合作伙伴的支持下,地平线目前为止也取得一些商业上的成绩,我们已经给客户提供600多万芯片的出货,正式量产上市车型超130款,累计斩获270多量产定点车型,累计百亿公里的数据,希望能够与合作伙伴一起开放共赢,共同推进自动驾驶技术的发展和普惠我们所有的驾乘人员,我的分享就到这儿,谢谢大家。
赵福全:感谢陈总,地平线作为国内明星的本土诞生的芯片企业,受关注程度还是蛮高的,陈总今天讲完以后,我们感受更多的还是在讲我们如何用芯片来解决企业痛点的问题,汽车进入万物互联,产业分工越来越模糊的情况下,地平线定位是怎样的?芯片还涉及到硬件的调配和应用,是整车企业主导还是地平线主导?
陈黎明:对,就像我刚才在介绍里面讲的,除了芯片之外我们地平线也做很多先进算法的研究,去解决目前我们行业在自动驾驶里面碰到的这些技术难题和关键点,我们也希望能够通过我们这些技术能够有一个产品展示给大家,因为技术的难度比较大,而且挑战也很大,同时我们地平线又聚集了一帮世界顶级的人才,能够有这样的能力打造一个样板,我们能够更快地推进自动驾驶技术,这是第一点。
第二点,实际上我们这是一个非常open的商业模式。首先,希望打造一个样板间,这个技术成熟之后能够open分享给所有的合作伙伴,我们的主机厂就像之前的在中低阶一样,高阶也是一样,根据他们的需求,因为商业模式比较灵活,不一定说给一个全套方案,如果需要我们的芯片就供应芯片,如果需要我们的感知算法就提供感知算法,如果需要提供全栈,可能目前会提供全栈,地平线还是关注在我们擅长的地方做前沿的研究和解决行业最棘手的问题,去不断地提升整个自动驾驶性能的展现,等它都成熟以后提供给行业。
赵福全:时间关系,谢谢黎明总的分享,大家再次用掌声表示感谢。
【免责声明】所有会议实录均为现场速记整理,未经演讲者审阅,AI汽车网转载本文仅用于传递行业信息,并不代表赞同其观点或证实其描述。
WNEVC 2024
龚淑娟
李峥
9月27日,2024世界新能源汽车大会在海南国际会展中心隆重召开,比亚迪首席科学家、汽车总工程师、汽车工程研究院院长廉玉波出席会议,并发表主题演讲:面向未来出行的新能源汽车前沿发展展望。
2024-09-29
2024-09-24
2024-09-24
2024-09-27
2024-09-24
2024-09-26
2024-09-26
2024-09-26
评论
加载更多