企业:健智机器人
汽车行业主营业务、产品和服务:
智能机器人公司继续围绕“基于软硬件协同优化构建自动驾驶与机器人的3D智能计算,实现机器与物理世界的智能交互”的愿景,以创新的技术突破解决自动驾驶与机器人的关键基础问题,以量产的自动驾驶产品和商业模式为主机厂和一流供应商提供高性能、高性价比、可靠的解决方案和产品服务。
推出以视觉3D理解为核心,基于软件2.0架构和端到端数据驱动的高级自动驾驶解决方案。整个方案为量产打造,可以自适应、向上兼容所有基于5R13V传感器配置的高级自动驾驶功能,在向后兼容上也可以是基于1R1V配置的基本ADAS功能。作为一个具有成本可控、高适应性、模块化交付等一系列特性的成熟产品方案,一经推出就受到了众多一线主机厂和主流Tier1的密切关注,并迅速获得了多项深度合作,其中包括国内头部车企的量产智能驾驶项目,在项目推进和商业落地方面取得了重大进展,获得了客户的良好口碑。
推出首款全栈自研模式的软硬件一体化产品——双目视觉雷达PhiGent海姆达尔。这一创新的商业化产品通过高效的AI计算,同时获得低水平视觉的3D基本描述信息和高水平视觉的高级语义信息,并将两者相结合,实现对真实世界“细节一切”的感知和理解,从而进一步强化自动驾驶的前向3D感知能力,推动自动驾驶水平的飞跃。
创始人背景:
简志机器人联合创始人杜大龙
杜大龙在中科院计算所读硕士期间,主要从事计算机视觉尤其是人脸识别的研究和开发,为以深度学习为核心的计算机视觉研究打下了良好的基础。
在百度工作期间,2011年开始在百度进行卷积神经网络的研发,2012年在国际上首次应用深度学习和大规模图像搜索以及OCR字符识别。然后,2014年我在百度最早提出了CNN+LSTM+CTC的OCR字符识别方案,2014年大规模应用。基于其突出贡献,获得两次百度百万美元大奖。
以后续创始员工身份加入地平线,参与中国首款AI芯片的设计和量产,现已在AIoT领域出货超过百万片。在人脸识别领域取得了突出的成绩。其人脸识别系统的效果达到了世界一流水平,在美国国家标准与技术研究院最权威的人脸识别测试(FRVT)中,获得了带口罩人脸识别赛道的世界第一。由清华大学联合推出的Webface260M是当今世界上最大的开放人脸识别数据集,已被麻省理工学院、杜克大学、新加坡国立大学、南洋理工大学、香港中文大学、阿德莱德大学等4000多家研究机构应用。
后来作为联合创始人创办了简智机器人,专注于自动驾驶和机器人方向的研发,在技术、资本和业务方面都有重大影响力。他领导的团队提出的BEVDet自动驾驶感知范式获得了nuScenes自动驾驶评测数据集全球第一名,获得了广泛的影响力。同时被清华大学录取为创新引领工程博士,在读期间将重点研究基于自动驾驶的深度学习2.0系统。
合伙人刘,商务部副总裁
原赛灵思AI全球市场总监,负责汽车、医疗、数据中心等行业的市场拓展,累计产品周期总收入超过1亿美元。Xilinx期间,为全球头部车厂和主流零部件厂商提供基于FPGA的AI加速方案;
千剑科技业务VP,全面负责公司业务战略的制定和落地,支持公司被赛灵思以数亿美元全资收购;
曾任诺基亚大中华区商务总监,拥有十余年通信行业市场开发和行业整合经验;
清华大学电子工程学士、硕士,清华大学经济管理学院MBA
拥有数十项国内外授权专利和多篇国际论文。
企业综合实力:
1.RD功能:
在技术层面,团队自主研发了以3D理解为核心的自动驾驶感知新范式BEVDet,并在自动驾驶权威评测集nuScenes上获得纯视觉3D目标检测全球第一。截至目前,健智机器人仍然保持着BEVDet范式在全球榜单的领先地位。与其他许多范式相比,BEVDet以更高的计算效率和更少的数据需求满足了行业的现状和要求,在自动驾驶的量产中发挥了关键作用。
在应用层面,团队推出了以视觉3D理解为核心,基于软件2.0架构和端到端数据驱动的高级自动驾驶解决方案。整个方案为量产打造,可以自适应、向上兼容所有基于5R13V传感器配置的高级自动驾驶功能,在向后兼容上也可以是基于1R1V配置的基本ADAS功能。作为一个成熟的产品方案,具有成本可控、适应性强、模块化交付等一系列特点。
团队推出了首款全栈自研模式的软硬件一体化产品——双目视觉雷达PhiGent海姆达尔。这一创新的商业化产品通过高效的AI计算,同时获得低水平视觉的3D基本描述信息和高水平视觉的高级语义信息,并将两者相结合,实现对真实世界“细节一切”的感知和理解,从而进一步强化自动驾驶的前向3D感知能力,推动自动驾驶水平的飞跃。
2、核心技术团队:
智能机器人实现了覆盖算法、调控、计算、软硬件、产品、商务等160多人的全栈团队。在北京,上海,苏州和杭州,并有能力完成交货和大规模生产。
核心团队来自国内外顶尖的AI算法、芯片、自动驾驶公司,以及主流的Tier 1和OEM厂商,并在持续吸引国内外技术和行业专家的加入。
拥有国际一流的AI和机器人算法全栈研发能力,是国内最早从事深度学习相关研发和应用的企业。已发布的世界级数据集已被数百家研究机构申请并广泛使用。
规划团队主要负责自动驾驶中的多传感器环境建模、决策规划和控制。利用我公司的3D视觉实时感知完成自主研发的多传感器数据融合,完全可以实现不依赖高精度地图的整套实时视觉SLAM系统方案。
计算团队具有完整的设计、仿真和验证能力,具有丰富的AI加速器和图像信号处理器设计经验。
硬件团队来自头部自动驾驶方案和芯片公司,具有丰富的自动驾驶开发经验。专注于人工智能视觉的软硬件协同,图像和硬件加速能力全面实现自主知识产权。
软件团队深耕深度学习工程十余年,具有丰富的AI工程和落地经验。核心团队在业内率先提出基于数据流图的AI软件构建框架,并在多个主流异构计算平台上完成大型AI项目。
3.支持与合作:
作为下一代驾驶员案例提供商,健智机器人自成立以来,就与汽车行业、自动驾驶行业的龙头企业进行战略合作,共同打造技术,优势互补,共同推动智能汽车的技术创新和商业化进程。
4.专利或其他资质证明:
团队发表了许多CVPR和ECCV峰会论文,拥有4项专利,超过15项被接受;有一个软件著作权,接受五个以上。
1)2022年2月16日发明了一种物体检测模型训练方法、物体检测方法和装置。
2)2022年2月16日发明识别场景中物体的方法和装置
3)2022年5月10日3D点云标注方法、装置及终端发明。
4)视觉报警方法、装置和系统的发明2022年2月16日
软件版权:基于激光雷达采集的三维点云数据标注系统1.0版软件
其他:
核心产品或技术:
1.技术名称:
BEV系列,自动驾驶感知新范式,已应用于量产项目。
2.技术描述:
BEV系列是智能机器人自动驾驶感知的新范式,由BEVDet、BEVDet4D、BEVerse等一系列技术组成。
1)BEVDet
BEVDet是BEV空间的第一个公共3D感知范式,具有高性能、可扩展性和实用性。
BEVDet基于视觉雷达和眼脑协调的思想构建了一个自动驾驶感知框架。通过视觉传感系统,还原整个空间的三维结构,在三维空间中直接感知和理解。
BEVDet遵循模块化设计的理念,包括以下四个分工明确的模块:1)图像编码模块用于提取二维图像空间中的高纬度特征;2)视角转换模块用于将图像空间的特征转换为鸟瞰图的特征;3)利用鸟瞰图编码模块进一步提取鸟瞰图特征;4)3D目标预测模块(Head)用于预测3D目标在鸟瞰视图空间中的位置、比例、方向、速度和类别。通过以上四个模块,BEVDet简洁地解决了纯视觉自动驾驶仪中的3D目标检测问题。
2)BEVDet4D
BEVDet4D是基于BEVDet的四维目标感知框架。自动驾驶目标检测的四维时空建模大大提高了准确性和鲁棒性。
3)BEVerse(与清华大学团队合作)
BEVerse是首个以视觉为中心的自动驾驶大感知统一框架,可以通过单一模型高效实现4D感知、实时局部地图、运动预测等自动驾驶关键模块。同时,每个模块都可以实现SOTA的效果,特别是在实时局部地图和运动预测任务上,相比目前公开的性能最好的方案有了显著提升。
BEVerse以全景视频流为输入,首先利用图像编码器和视图变换模型对每个时刻的多视图图像进行处理,得到多帧的鸟瞰视图特征。基于帧间自运动实现鸟瞰坐标系对准后,
BEVerse利用三维卷积进一步提取时空特征,获得4D鸟瞰图特征;基于这一特点,BEVerse为三维目标检测、实时局部地图、物体运动预测等三个关键任务建立了解码器,实现多任务联合预测。为了满足不同任务对视野范围和细粒度特征的要求,BEVerse通过局部网格采样生成任务特定的鸟瞰图特征;此外,BEVerse提出了一种基于迭代光流的高效未来预测方法,可以降低运动预测的内存需求,更好地赋能多任务学习。
3.独特优势:
在自动驾驶权威评测集nuScenes上获得纯视觉3D目标检测(2021)全球第一。截至目前,健智机器人仍然保持着BEVDet范式在全球榜单的领先地位。
具有以下优点:
1)高性能
与基于Transformer的图像到BEV投影相比,BEVDet具有更好的泛化性能和更少的数据需求,可以大大提高效率和效果。
2)可扩展性
BEDET的框架是高度可扩展的。未来,智能机器人将基于BEDET进行扩展,进一步实现视觉雷达、4D感知、实时局部地图等纯自动驾驶关键模块,为多传感器前方融合提供优秀的新框架。
3)实用性
BEVDet通过更低的计算能力要求达到相同或更好的算法效果,可以大大提高实际自动驾驶系统的计算能力利用效率。
BEVDet拥有业界领先的技术指标,包括:支持前瞻/360°视觉感知;支持多达10+类的动态目标感知;支持多达100+类的静态目标感知;AI算力需要1-4T(1V)和10-20T(6V);支持主流车载计算平台;2mp/5mp/8mp30fps支持;支持多摄像头端到端3D感知;支持端到端实时生成3D局部地图。并且,在很多关键指标(检测率、误检率、检测距离、测距精度)上都处于行业顶尖水平。
BEVerse可以在三维动态物体检测、局部语义地图构建和物体运动预测三个任务上超越现有的单任务算法。
4.应用场景:
在复杂的城市道路场景中,BEV系列技术可以稳定地检测三维的各类动态目标,实时构建高质量的局部语义地图,预测道路交通参与者的未来状态。
基于此,BEV系列技术可以大幅提升自动驾驶的感知能力,构建以视觉感知为核心的多层次、全场景、跨平台、强智能的自动驾驶解决方案。
企业未来发展前景:
未来,健智机器人将继续围绕“基于软硬件协同优化,构建自动驾驶与机器人的3D智能计算,实现机器与物理世界的智能交互”的愿景,以创新的技术突破不断解决自动驾驶与机器人的关键基础问题,以大规模量产的自动驾驶产品和商业模式,持续为主机厂和一级供应商提供高性能、高性价比、可靠的解决方案和产品服务。
金奖系列简介:
“金奖”由盖世发起,旨在“寻找好公司,推广好技术”,围绕“中国汽车供应链新100强”主题展开,聚焦自动驾驶、智能驾驶舱、软件、芯片、动力总成电气化、热管理、车身与底盘技术、内外饰、环保轻量化与新材料、服务商十大细分行业,评选出优秀企业和先进技术解决方案,评选出公司十大细分行业。