据外媒报道,可扩展模块化自动驾驶技术供应商AImotive宣布推出aiWare NPU硬件IP的最新版本aiWare4。该版本对片上存储器架构进行了大幅升级,并拥有创新的波前处理算法和增强的符合ISO26262的安全功能,从而提供终极可扩展的解决方案,可应对最具挑战性的单芯片边缘应用程序,以及最高性能的汽车AI中央处理平台。
(图片来源:AImotive)
凭借aiWare4,许多关键指标都取得进一步改善,包括TOPS/mm2、有效TOPS/W和一系列高效CNN拓扑。aiWare4的升级功能包括:
可扩展性:凭借更高的片上内存可配置性、硬件安全机制和外部/共享内存支持,每内核算力可高达64 TOPs(aiWare3为32 TOPS),且每个多核集群算力可达256 TOPS;
安全性:标准硬件功能和相关文本认证进一步增强,确保简单ISO26262 ASIL B级,以及高度符合SEooC(脱离上下文的安全元件)和应用程序上下文安全元件。
PPA(功率、性能和面积):通过使用5nm或更小的工艺节点,典型CNN(理论峰值可达30 TOPS/W)的有效TOPS/W为8-10;具有更广泛的CNN拓扑,效率高达98%;具有更灵活的电源域支持动态电源管理,无需重启即可响应实时环境变化;
处理:与aiWare3相比,对于需要访问大量外部存储器资源的CNN来说,采用aiWare最新波前处理和交错多任务调度算法的创新波前RAM (WFRAM),可实现更多平行执行、具有更好的多任务处理能力,并显著减少存储器带宽。
aiWare4还可继续提供行业领先的NPU效率,通过减少使用硅而实现最佳性能。最新升级还可使aiWare4仅使用片上SRAM就可执行大量CNN工作负载,从而用于单芯片边缘AI或高度优化的ASIC或SoC应用。
AImotive硬件工程高级副总裁Marton Feher表示:“通过与芯片和汽车合作伙伴合作,AImotive获得了丰富的经验,而aiWare4正是基于这些经验,以及aiDrive™团队的洞察力而打造。团队的洞察力与推动CNN汽车应用的最近趋势和最新思路密切相关。很自豪我们能够为汽车发展提供业界最高效的NPU,并成功扩展aiWare的功能,以在最苛刻的汽车运行环境下实现高安全性、灵活性和性能,以及低功耗。”
获取更多评论