5熊猫网

 找回密码
 免费注册

QQ登录

只需一步,快速开始

开启左侧
查看: 12|回复: 0
 虎纹蛙 发表于: 2025-4-16 10:40:42|显示全部楼层|阅读模式

[2025年] 昇腾自动驾驶训练加速套件DrivingSDK,加速智驾算法创新

 [复制链接]
  : 中关村在线
  自动驾驶技术随着人工智能的崛起,迎来了飞速发展,智驾已成为新能源车标配,L2及L2+智驾渗透率已经从2024年的66%提升到了80%。为了满足市场需求,数据的快速闭环以及模型的天级迭代已成为智驾训练的刚需。自动驾驶技术也在不断演进,从传统的模块化、规则化发展到BEV+ Transformer 架构,如今正逐步迈向端到端、VLM和VLA等更前沿的技术,其应用场景也从最初的高速领航、智驾开城,进化到无图也能开、城市NOA、车位到车位等更加复杂和多样的模式。
  然而,自动驾驶技术本身具有功能复杂、训练数据规模庞大、模型训练周期长等挑战,并且在发展过程中还面临着开源模型版本配套复杂、兼容性差等问题,这些都给自动驾驶模型的开发带来了诸多挑战。
  昇腾AI发布全新的DrivingSDK自动驾驶训练加速套件,基于昇腾AI集群系统,提供丰富的模型和算子库,全面提升自动驾驶模型开发效率,加速自动驾驶技术的创新和应用。
50dd-2ab51815b732e139de727d04f5d5d964.png
  DrivingSDK自动驾驶加速套件包含高性能算子库、模型训练优化加速和自动驾驶优选模型库,旨在为客户提供自动驾驶系统开发的基础能力,加速模型训练效率。

▲ 高性能算子库
  提供50+算子自动驾驶场景高性能算子,涵盖典型智驾算子如DCN、MSDA、SparseConv3D等,快速打通迁移训练链路。

▲ 优选模型库
  预置50+主流智驾模型,包含BEV、OCC、Lane&Map、端到端等多个类别,覆盖感知、规划控制等多个场景。

▲ 训练优化加速技术
  提供HostBound、小算子下发多、CPU负载高等加速优化手段,快速提升模型性能。
  三大特性,支撑智驾算法快速落地
  01极致性能,主流模型性能提升30%+
  基于昇腾NPU架构特点,设计SIMD计算加速吞吐、多级指令流水线优化加速指令下发、UB融合实现连续Vector计算、Cube与Vector协同计算等方案,构建智驾高性能算子库,内置50+高性能算子,涵盖通用、目标检测、点云、融合、3D稀疏等多个智驾场景,兼容MMCV、Spconv、OpenPCDet等多个智驾三方库,支撑智驾模型无感迁移。
  同时,DrivingSDK自动驾驶加速套件提供多种训练优化手段,提升自动驾驶模型训练的效率。例如,部分自动驾驶模型中包含大量小算子操作以及cpu数据处理逻辑,使得模型存在Host侧下发瓶颈问题。为解决这一问题,我们通过二级流水优化、小算子融合等优化手段,使得模型性能提升20%+。
ea31-e1c8c9b36e3d214f0a106127ad8eb8ad.png
  模型优化前后流水图对比
  02极简易用,分钟级构筑自有模型
  DrivingSDK自动驾驶加速套件提供50+主流场景模型,包含BEVFormer、MapTR、FlashOCC、LMDrive、StreamPETR和UniAD等高性能自动驾驶模型,涵盖BEV感知、OCC感知、Lidar感知、预测规划、通用目标检测等多个场景。
913f-99f613837465abbdd3364a803fa73321.png
  图:自动驾驶优选模型库的
  主流场景模型的NPU性能与业界参考性能对比
  同时,DrivingSDK自动驾驶加速套件支持环境变量自动拼接,一键迁移功能继承典型智驾模型优化经验。
7c73-6572e1dac38ceaf6d655c4159efbce75.png
  03开源开放,自定义开发效率提升20%
  工程架构:算子实现与适配解耦,项目结构偏平,工程编译门槛低;
  资料文档:高性能API调用逻辑统一、示例清晰易上手并附带甜点场景说明;
  全量开源:算子、模型、算法全量开源,提供丰富参考设计及算子实现样例,助力客户自定义开发算子及模型。

▲ 昇腾亲和API替换示例
  DrivingSDK仓针对智驾模型高频使用的API进行了迁移和优化,以充分利用昇腾NPU的澎湃算力。
  API替换参考代码:
a2b0-20cb4aa83b2a1a5b853217dba31906a5.png
  主流模型使用示例
  DrivingSDK适配并优化了50+典型智驾模型,按照README操作执行,即可在昇腾服务器上启动模型训练。
1ecf-df19870b7faae4b8010e298a4bcd40f9.png
  一键迁移功能使用示例
  DrivingSDK套件引入了一键迁移功能
  解决了智驾模型迁移优化周期长、手动复用优化经验易出错等问题,使用方法非常简单,只需要给main函数加上patcher的作用域。例如,对于没有迁移过的模型,框架提供了默认的patcher,其中涵盖了所有通用优化特性,只需要在train.py中的main函数添加即可:
e90e-c4b1f1de3a9cd2ad86fce690201eed47.png
  结语
  昇腾AI联合华为车BU,将DrivingSDK自动驾驶加速套件应用于ADS3.0智驾系统的开发中,大幅缩短ADS3.0模型训练时长,实现模型天级迭代。未来,我们也将持续提供更丰富的模型和算子,帮助更多客户伙伴完成智驾算法创新。
『 5熊猫网 』提醒,在使用本论坛之前您必须仔细阅读并同意下列条款:
  1. 遵守《全国人大常委会关于维护互联网安全的决定》及中华人民共和国其他各项有关法律法规,并遵守您在会员注册时已同意的《『 5熊猫网 』管理办法》;
  2. 严禁发表危害国家安全、破坏民族团结、破坏国家宗教政策、破坏社会稳定、侮辱、诽谤、教唆、淫秽等内容;
  3. 本帖子由 虎纹蛙 发表,享有版权和著作权(转帖除外),如需转载或引用本帖子中的图片和文字等内容时,必须事前征得 虎纹蛙 的书面同意;
  4. 本帖子由 虎纹蛙 发表,仅代表用户本人所为和观点,与『 5熊猫网 』的立场无关,虎纹蛙 承担一切因您的行为而直接或间接导致的民事或刑事法律责任。
  5. 本帖子由 虎纹蛙 发表,帖子内容(可能)转载自其它媒体,但并不代表『 5熊猫网 』赞同其观点和对其真实性负责。
  6. 本帖子由 虎纹蛙 发表,如违规、或侵犯到任何版权问题,请立即举报,本论坛将及时删除并致歉。
  7. 『 5熊猫网 』管理员和版主有权不事先通知发帖者而删除其所发的帖子。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

© 2002-2025, 蜀ICP备12031014号, Powered by 5Panda
GMT+8, 2025-5-7 06:13, Processed in 0.109200 second(s), 10 queries, Gzip On, MemCache On
快速回复 返回顶部 返回列表