地方频道 > 看浙里

博登智能:人工智能的“粮食”生产商

2026-03-27 17:28:39 来源:浙江在线 作者:记者 龚晓 编辑:毕真

浙江在线3月27日讯(记者 龚晓)如何教会车辆思考并驾驶?

在演示大屏幕前,科研人员正聚精会神地观察着车辆在测试环境中的表现。

与真实路测不同,映入眼帘的是由无数光点构成的“虚拟”真实世界,所有与车辆测试相关的环境要素,道路周边的车辆、树木、建筑,包括道路本身都被打上了高精度激光雷达点云。

区别于背景环境,测试车辆被精准地纳入了3D边界框中,车辆的行驶轨迹、空间状态被密密麻麻的“点云”完整记录下来。据团队科研人员介绍,AI 并不是天生就会开车。这些画好框、打好点的数据,就是喂给 AI 的“知识点”,学得越多,它开车就越聪明、越安全。

那么,一家优秀的数据标注企业背后究竟有多少核心技术支撑呢?

近期,浙江在线《向新力》栏目,专访宁波市博登智能科技有限公司董事长兼创始人赵捷,就数据标注、智能驾驶、大模型、具身智能等大家关心的AI热点问题进行了交流。

数据标注是什么?

“刚才这种标注模式被称为点云标注。”宁波市博登智能科技有限公司董事长赵捷说,“标注好的数据就像AI的粮食,学习这些数据,AI就能理解开车是怎么一回事。”

对话的开端,赵捷就以智能驾驶行业为例,直观演示了一番什么叫做数据标注。

在图片上用拉框标注车辆位置,告知AI,这里可以通过,被称为2D图像标注。

而在视频上标注车辆位置,平面框就变成了立体的盒子,被称为3D点云标注。

4D点云标注

如果叠加时间维度,反映车辆在系列时间点中相对自身位置的变化,被称为4D点云标注。

“实际上,为了支撑高阶智能驾驶,很多新技术已投入使用,就比如占用网络。”赵捷举例来说,这项技术不再把物体看作一个框,而是把空间切分成无数微小的体素,标注每一个格子是否被占据,哪怕是一个形状怪异的掉落物,也能被精确感知,“这项新技术能够更精准地应对一些极端情况。”

从劳动密集到技术密集

在最初,数据标注还被认为是一个劳动密集型行业。“过去,数据标注员的工作,主要是给2D图片里的车和人画个框。行业内有一句笑谈:AI农民工。”赵捷说。2019年回国创业的契机,是发现国内智能驾驶产业,处在爆发式发展的前夜,且当时数据标注行业,依旧处于依赖人力的“手工作坊”阶段,结合在国外的学术和行业背景,赵捷看到了用算法、软件替代重复劳动、提升标注效率的巨大机会。

而这个算法就是AI辅助的自动化标注能力,俗称“大模型带小模型”,利用云端强大的离线模型自动生成标签,人类则退居幕后,负责校验和修正那些最难搞的“边缘场景”。

因此,博登智能也从单纯的数据标注公司,转型为“深度参与数据管理与模型训练流程的数据基础设施企业”。博登智能的公司口号AI For AI,即通过人工智能算法深度参与,降低纯人工参与度。赵捷表示,通过“叠帧”、算法预标注等技术,“以前一个人做7天的活,现在只要1天。”

缺数据、缺场景、缺监管

数据标注行业标准亟待建立

目前,不论是大模型还是具身智能行业,“数据饥渴”都是行业痛点,赵捷表示深有同感。他表示,在具身智能领域,包括真机数据、第一人称视角数据,以及仿真合成数据,难以满足需求。“具身智能行业的数据需求,跟五年前的智能驾驶行业类似,行业没有标准,数据极度匮乏,目前建立的一些数据采集工厂远远不够。”赵捷表示。

具身机器人技术创新中心,人类老师正在教具身机器人解锁自己的新技能

“有些数据采集,仅依赖人力并不能解决核心痛点。”赵捷说,为了解决一些极端场景的适配问题,在智能驾驶领域,一些企业会采用“合成数据”的方式。赵捷举例,比如要采集一辆车撞到电瓶车的场景,“现实中,我们不可能去制造事故,在背景不变的情况下,通过合成方式制造场景。”当然,验证需要海量测试,功能没有经过完整测试,很难定义能达到预期目标。

数据采集、“投喂”缺乏监管,也会有很大问题。针对今年315晚会曝光的“AI投毒”问题,赵捷表示针对行业乱象,需要技术+法律双轨治理,第一步是数据可溯源,建立端到端的数据源把控机制;第二步是加强数据质检流程;第三步是推动行业标准的制定。

2025年,发改委等部门下发文件,首次对数据标注行业进行了明确定义:对数据进行筛选、清洗、分类、注释、标记和质量检验等加工处理的新兴产业。文件明确指出,培育壮大数据标注产业对于提升数据供给质量,推动人工智能创新发展具有重要支撑作用。

编辑:毕真
相关新闻