图像数据标注在自动驾驶场景中的应用及标注方法

在人工智能计算机视觉技术中,图像数据标注是选择图像中的对象并按照名称进行标记的过程,图像数据标注有着广泛的细分应用,例如,医疗成像分析被用来提高疾病的预测、诊断和治疗;自动驾驶汽车可以准确的识别图像中的行人、车道线和交通指示牌等;同时人脸识别支付、AR/VR、城市安防和监控等领域,也有很多的应用。所以说,图像数据标注是人工智能计算机视觉的支柱。


01、自动驾驶汽车

1、边界框标注

边界框是最常见、应用最广泛的图像数据标注方法,又叫拉框标注,它是在目标对象周围拟合紧密矩形的过程。例如在自动驾驶场景中,我们的目标对象是路面上的各类,首先需要确定好标注对象的位置,再用贴合的矩形线框把对象框起来,同时用一个或多个独立标签来代表一个或多个不同的标注对象,从而实现计算机对图像内容的识别。

2、区域标注

与边界框标注相比,区域标注要求的更加精确。一般来说,图像的区域是基于图像分割的方式获取的,例如在自动驾驶场景中,对可行驶路面识别标注和区域划分,并标注上对应的属性标签,以帮助机器训练图像识别模型。

3、打点

又称关键点标注,对需要标注的元素(如人脸、肢体等)按照需求位置进行点位标注,从而实现特定部位关键点的识别。通常应用于美颜相机、视频贴纸等场景中,增加了智能应用的功能,丰富了用户的使用体验。


02、人脸识别

4、点云拉框

在数据标注软件中,对图像生成三维模型,针对标注对象进行外轮廓的3D拉框,与2D拉框相同,也需要对立体框添加特定的标签,从而实现机器训练中对空间感的识别。

5、2D/3D融合标注

对2D平面图与3D点云图映射的数据组进行标注,支持自动贴边、跨帧复制、测距、2/3D图片标注分离等多种功能。在自动驾驶应用场景中,使用激光雷达传感器和摄像机捕捉车辆周围物体3D位置数据和2D视觉数据,将位置数据和视觉数据进行融合,使自动驾驶汽车系统能够更准确的了解周围环境。

6、目标追踪

目标追踪是指视频、影像等动态的图像中,进行抽帧标注,在每一帧图片中精细准确地对目标对象数据进行标注,进而描述它们的运动轨迹,这类标注常应用于训练自动驾驶模型以及城市安防视频识别模型。


03、人工智能自动驾驶

图像数据标注和计算机视觉技术应用的增加,需要大量的训练数据以供机器学习,其中数据的采集和标注,就要占人工智能和机器学习项目80%的时间。因此,数据标注在计算机视觉技术中起到非常重要的作用,具体的标注方法取决于人工智能项目中,实际所使用到的图像标注类型。


本文转自: 淘丁集团,转载此文目的在于传递更多信息,版权归原作者所有。如不支持转载,请联系小编demi@eetrend.com删除。

最新文章