WO2022183685A1

WO2022183685A1 - 目标检测方法、电子介质和计算机存储介质

Info

Publication number: WO2022183685A1
Application number: PCT/CN2021/111973
Authority: WO
Inventors: 郑炜栋
Original assignee: 亿咖通（湖北）科技有限公司
Priority date: 2021-03-01
Filing date: 2021-08-11
Publication date: 2022-09-09
Also published as: CN112562093B; CN112562093A

Abstract

本公开提供了一种基于车载摄像头和激光雷达的目标检测方法，其包括：分别获取摄像头和激光雷达同步采集到的图像和点云，并且从点云中提取位于摄像头的视场角内的点云作为第一点云；将第一点云投影至图像坐标系中得到图像坐标系下的第二点云；检测图像中包含的各目标得到各目标的各目标检测信息；根据各像素位置确定各目标的目标框，根据位于各目标框内的第二点云确定与各目标对应的视锥点云；对各视锥点云进行坐标转换得到与各目标对应的目标视锥点云；提取各目标视锥点云中的第一目标点云，根据第一目标点云得到各目标的第一三维信息；根据各第一三维信息确定各目标在车辆坐标系下的第二三维信息，输出各目标检测信息和各第二三维信息。

Description

目标检测方法、电子介质和计算机存储介质

技术领域

本发明涉及智能汽车环境感知技术领域，特别是涉及一种目标检测方法、电子介质和计算机存储介质。

背景技术

随着时代的发展、技术的进步，如今，智能汽车成为交通运输工具领域的热门研究话题。对于智能汽车，其要具备可靠的实时环境感知能力和理解周围环境的能力，这样才能规划出正确路径、保证安全驾驶。

现有技术中，很多环境感知方法是基于单传感器的，但是单传感器检测方法无法突破传感器本身的数据特征，导致环境感知能力差，目标检测不准。因此基于多传感器的目标检测方法是目前的研究热点之一。对于基于多传感器的目标检测方法，一般是对摄像头和激光雷达各自输出的感知数据做目标级别的融合以达到对环境的感知，这样的方法在一定程度上提高了目标检测的准确性。但是却并没有在感知数据层面做到很好的融合，导致感知数据融合过程中损失了大量信息，对目标检测的准确性产生了影响。

发明内容

根据本发明的一个方面，提供了一种目标检测方法，其包括：

分别获取摄像头和激光雷达同步采集到的图像和点云，并且从所述点云中提取位于所述摄像头的视场角内的点云作为第一点云；

将所述第一点云投影至图像坐标系中得到所述图像坐标系下的第二点云；

检测所述图像中包含的各目标得到各所述目标的各目标检测信息，各所述目标检测信息包括各所述目标的像素位置；

根据各所述目标的所述像素位置确定各所述目标的目标框，根据位于各所述目标框内的所述第二点云确定与各所述目标对应的视锥点云；

对各所述视锥点云进行坐标转换得到与各所述目标对应的目标视锥点云；

提取各所述目标视锥点云中的第一目标点云，对各所述第一目标点云进行坐标转换得到与各所述目标对应的第二目标点云；

对各所述第二目标点云进行拟合回归得到各所述目标的第一三维信息；

根据各所述第一三维信息确定各所述目标在车辆坐标系下的第二三维信息，输出各所述目标检测信息和各所述第二三维信息。

根据一个或多个实施例，所述将所述第一点云投影至图像坐标系中得到所述图像坐标系下的第二点云，包括：

标定所述摄像头的内参数得到内参数矩阵；

以所述摄像头为参考点联合标定所述摄像头和所述激光雷达得到所述激光雷达到所述摄像头的第一坐标转换矩阵；

利用所述第一坐标转换矩阵对所述第一点云进行坐标转换得到摄像头坐标系下的第三点云；

利用所述内参数矩阵对所述第三点云进行坐标投影得到所述图像坐标系下的所述第二点云。

根据一个或多个实施例，所述根据位于各所述目标框内的所述第二点云确定与各所述目标对应的视锥点云包括：

对位于各所述目标框内的所述第二点云进行随机采样，得到与各所述目标对应的第四点云；

将与各所述第四点云对应的各所述第三点云确定为与各所述目标对应的所述视锥点云。

根据一个或多个实施例，所述对各所述视锥点云进行坐标转换得到与各所述目标对应的目标视锥点云包括：

确定各所述目标的中心轴与所述摄像头坐标系的Z轴间的夹角，利用各所述夹角对各所述视锥点云进行坐标转换得到与各所述目标对应的第一视锥点云，其中，所述中心轴为所述目标的中心与所述摄像头坐标系的原点间的连线；

计算各所述第一视锥点云的Y轴平均值，利用各所述Y轴平均值对各所述第一视锥点云进行坐标转换得到与各所述目标对应的所述目标视锥点云。

根据一个或多个实施例，各所述第一三维信息包括各所述目标的中心点的坐标、长宽高及航向角，所述根据各所述第一三维信息确定各所述目标在车辆坐标系下的第二三维信息包括：

以车辆的惯性测量装置为参考点标定所述摄像头的外参数得到外参数矩阵；

对于每一所述目标，根据所述中心点的坐标、所述长宽高及所述航向角确定所述目标的各角点的坐标；

利用所述第一目标点云的坐标平均值对所述中心点和各所述角点的坐标进行转换，得到第一中心点和各第一角点的坐标；

利用所述第一视锥点云的Y轴平均值对所述第一中心点和各所述第一角点的坐标进行转换，得到第二中心点和各第二角点的坐标；

利用所述目标的中心轴与所述摄像头坐标系的Z轴间的所述夹角对所述第二中心点和各所述第二角点的坐标进行转换，得到第三中心点和各第三角点的坐标；

利用所述外参数矩阵对所述第三中心点和各所述第三角点的坐标进行转换，得到第四中心点和各第四角点的坐标；

根据各所述第四角点的坐标计算所述目标的目标航向角，将所述第四中心点的坐标、所述长宽高及所述目标航向角确定为所述目标的所述第二三维信息；

遍历各所述目标的所述第一三维信息，确定各所述目标在所述车辆坐标系下的所述第二三维信息。

根据一个或多个实施例，所述提取各所述目标视锥点云中的第一目标点云包括：

将各所述目标视锥点云分别输出至点云分割网络得到各所述目标视锥点云中各点属于前景的第一概率和属于背景的第二概率；

对于各所述目标视锥点云，选取所述第一概率大于所述第二概率的所述点组成目标点云集合；

对各所述目标点云集合进行随机采样得到各所述第一目标点云。

根据一个或多个实施例，所述对各所述第一目标点云进行坐标转换得到与各所述目标对应的第二目标点云包括：

计算各所述第一目标点云的坐标平均值；

利用各所述第一目标点云的坐标平均值对各所述第一目标点云进行坐标转换，得到与各所述目标对应的所述第二目标点云。

根据一个或多个实施例，所述检测所述图像中包含的各目标得到各所述目标的各目标检测信息包括：

将所述图像输出至目标检测神经网络中以检测所述图像包含的各所述目标并得到各所述目标的各所述目标检测信息。

根据本发明的另一个方面，还提供了一种电子设备，其包括：

处理器；

存储有计算机程序的存储器；

当所述计算机程序被所述处理器运行时，导致所述电子设备执行如上述任意实施例所述的方法。

根据本发明的又一个方面，还提供了一种计算机存储介质，其中，所述存储介质中存储有至少一条指令、至少一段程序、代读码集或指令集，所述至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行如上述任意实施例所述的方法。

在本发明的一个或多个实施例中，首先分别获取摄像头和激光雷达同步采集到的图像和点云并从点云中提取出位于摄像头视场角内的点云作为第一点云。之后将第一点云投影至图像坐标系中得到图像坐标系下的第二点云，并且检测图像中包含的各目标得到各目标的各目标检测信息，其中，各目标检测信息包括各目标的像素位置。之后根据各目标的像素位置确定各目标的目标框，并且根据位于各目标框内的第二点云确定与各目标对应的视锥点云。在得到视锥点云后，再对各视锥点云进行坐标转换得到与各目标对应的目标视锥点云。之后再提取各目标视锥点云中的第一目标点云，对各第一目标点云进行坐标转换得到与各目标对应的第二目标点云，对各第二目标点云进行拟合回归得到各目标的第一三维信息。最后根据各第一三维信息确定各目标在车辆坐标系下的第二三维信息，输出各目标检测信息和各第二三维信息。

根据一个或多个实施例，通过将摄像头采集数据和激光雷达采集数据进行充分融合，从而可以得到智能车辆周围物体的精准的三维信息，从而在智能车辆自动驾驶行程中，可以根据周围物体的三维信息而规划出正确的路径，极大地保障了安全驾驶。

根据下文结合附图对本发明具体实施例的详细描述，本领域技术人员将会更加明了上述以及其他优点和特征。

附图说明

后文将参照附图以示例性而非限制性的方式详细描述本发明的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解，这些附图未必是按比例绘制的。附图中：

图1是根据本发明一个或多个实施例的目标检测方法的流程示意图；

图2是根据本发明一个或多个实施例的摄像头和激光雷达同步采集图像和点云的示意图；

图3是根据本发明一个或多个实施例的图像的示意图；

图4是根据本发明一个或多个实施例的图像和摄像头坐标系的示意图；

图5是根据本发明一个或多个实施例的目标和摄像头坐标系的示意图；

图6是根据本发明一个或多个实施例的电子设备的示意性结构框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

需要说明的是，在不冲突的前提下本发明实施例及可选实施例中的技术特征可以相互结合。

图1是根据本发明一个或多个实施例的目标检测方法的流程示意图。如图1所示，该方法可以至少包括如下步骤：

步骤S102：分别获取摄像头和激光雷达同步采集到的图像和点云，并且从点云中提取位于摄像头的视场角内的点云作为第一点云。

步骤S104：将第一点云投影至图像坐标系中得到图像坐标系下的第二点云。

步骤S106：检测图像中包含的各目标得到各目标的各目标检测信息，各目标检测信息包括各目标的像素位置。

步骤S108：根据各目标的像素位置确定各目标的目标框，根据位于各目标框内的第二点云确定与各目标对应的视锥点云。

步骤S110：对各视锥点云进行坐标转换得到与各目标对应的目标视锥点云。

步骤S112：提取各目标视锥点云中的第一目标点云，对各第一目标点云进行坐标转换得到与各目标对应的第二目标点云。

步骤S114：对各第二目标点云进行拟合回归得到各目标的第一三维信息。

步骤S116：根据各第一三维信息确定各目标在车辆坐标系下的第二三维信息，输出各目标检测信息和各第二三维信息。

在本发明一个或多个实施例中，首先分别获取摄像头和激光雷达同步采集到的图像和点云并从点云中提取出位于摄像头视场角内的点云作为第一点云。之后将第一点云投影至图像坐标系中得到图像坐标系下的第二点云，并且检测图像中包含的各目标得到各目标的各目标检测信息。之后根据各目标的像素位置确定各目标的目标框，并且根据位于各目标框内的第二点云确定与各目标对应的视锥点云。在得到视锥点云后，再对各视锥点云进行坐标转换得到与各目标对应的目标视锥点云。之后再提取各目标视锥点云中的第一目标点云，对各第一目标点云进行坐标转换得到与各目标对应的第二目标点云，对各第二目标点云进行拟合回归得到各目标的第一三维信息。最后根据各第一三维信息确定各目标在车辆坐标系下的第二三维信息，输出各目标检测信息和各第二三维信息。根据本发明一个或多个实施例，通过将摄像头采集数据和激光雷达采集数据进行充分融合，从而可以得到智能车辆周围物体的精准的三维信息，从而在智能车辆自动驾驶行程中，可以根据周围物体的三维信息而规划出正确的路径，极大地保障了安全驾驶。

图2是根据本发明一个或多个实施例的摄像头和激光雷达同步采集图像和点云的示意图。如图2所示，可以将摄像头和激光雷达的触发时间同步到同一时间轴以保证分别获取摄像头和激光雷达同步采集到的图像和点云。例如，可以以激光雷达的时间轴为基准，控制摄像头的触发时间尽量与激光雷达的触发时间一致，例如每隔10ms同时触发摄像头和激光雷达。

在得到摄像头和激光雷达同步采集到的图像和点云并且从点云中提取出位于摄像头的视场角内的第一点云后，接下来，在本发明一些实施例中，先标定摄像头的内参数得到内参数矩阵，然后以摄像头为参考点联合标定摄像头和激光雷达得到激光雷达到摄像头的第一坐标转换矩阵。最后利用第一坐标转换矩阵对第一点云进行坐标转换得到摄像头坐标系下的第三点云，再利用内参数矩阵对第三点云进行坐标投影得到图像坐标系下的第二点云。

根据一个实施例，内参数矩阵

其中，f _x、f _y分别表示摄像头的横、纵焦距，u、v表示图像坐标系中光轴投影坐标即主点坐标。对于电脑上存储的照片或图像，图像坐标系一般是以左上角为原点，向右为x正方向，向下为y正方向的二维坐标系，单位常用“像素”。

第一坐标转换矩阵

其中，R _ef′(e，f＝1，2，3)表示激光雷达坐标系相对于摄像头坐标系的旋转矩阵元素，激光雷达坐标系一般以激光发射中心为坐标原点，向上为z轴正方向，x轴和y轴构成平面。摄像头坐标系一般以镜头主光轴中心为原点，向右为x正方向，向下为y正方向，向前为z正方向。向量[T _11′，T _12′，T _12′] ^b表示激光雷达坐标系相对于摄像头坐标系的平移关系，b表示转置符号。

利用上述矩阵将第一点云转换为第二点云的具体过程如下：

其中，

表示第一点云的坐标，

表示第三点云的坐标，

表示第二点云的坐标。

在将第一点云转换为第二点云后，接下来，在本发明一些实施例中，可以将图像输出至目标检测神经网络中以检测图像包含的各目标并得到各目标的目标检测信息，目标检测信息例如包括分类信息、像素位置及置信度等。

图3是根据本发明一个或多个实施例的图像的示意图。如图3所示，目标检测信息如下：

Object _i＝[box(px，py，h，w)，class，confidence]

其中，Object _i为目标，i代表目标的序号，box(px，py，h，w)为目标的像素位置参数，(px，py)为目标的像素坐标，h、w分别为目标框的高和宽，class为分类信息，confidence为置信度。

在得到各目标的目标检测信息后，接下来，可以根据各像素位置确定各目标的目标框，然后对位于各目标框内的第二点云进行随机采样，得到与各目标对应的第四点云，然后将与各第四点云对应的各第三点云确定为与各目标对应的视锥点云。

图4是根据本发明一个或多个实施例的图像和摄像头坐标系的示意图。如图4所示，为了使所有视锥点云的坐标分布最大程度上相似以便于后续点云分割网络处理，因此在得到视锥点云后，首先确定各目标的中心轴与摄像头坐标系的Z轴间的夹角θ，然后利用各夹角θ对各视锥点云进行坐标转换得到与各目标对应的第一视锥点云，其中，中心轴为目标的中心(cx，cy)与摄像头坐标系的原点间的连线。最后计算各第一视锥点云的Y轴平均值，利用各Y轴的平均值对各第一视锥点云进行坐标转换得到与各目标对应的目标视锥点云。

根据一个实施例，将视锥点云转换为目标视锥点云的具体过程可以如下：

其中，

表示第一视锥点云的坐标，

表示目标视锥点云的坐标。

得到目标视锥点云后，接下来，可以将各目标视锥点云分别输出至点云分割网络得到各目标视锥点云中各点属于前景的第一概率和属于背景的第二概率。对于各目标视锥点云，然后选取第一概率大于第二概率的点组成目标点云集合，对各目标点云集合进行随机采样得到各第一目标点云。

由于后续提到的点云拟合回归网络对输入的点云数量有要求，因此，此处对各目标点云集合进行随机采样得到各第一目标点云。

为了使第一目标点云的坐标分布最大程度上相似以便于后续点云拟合回归网络处理。接下来，计算各第一目标点云的坐标平均值，然后利用各第一目标点云的坐标平均值对各第一目标点云进行坐标转换得到与各目标对应的第二目标点云。

根据一个实施例，第一目标点云的坐标的平均值如下：

其中，k1为第一目标点云的点云个数。

将第一目标点云转换为第二目标点云的具体过程如下：

其中，

为第二目标点云的坐标。

将第二目标点云输出至点云拟合回归网络中可以得到目标的第一三维信息。第一三维信息的形式可以为：

[x，y，z，l，w，h，heading_angle]

其中，(x，y，z)为目标的中心点的坐标，(l，w，h)为目标的长宽高，(heading_angle)为目标的航向角。

图5是根据本发明一个或多个实施例的目标和摄像头坐标系的示意图。如图5所示，为了得到目标在车辆坐标系下的第二三维信息，接下来，首先以车辆的惯性测量装置为参考点标定摄像头的外参数得到外参数矩阵。第一三维信息包括目标的中心点的坐标、长宽高及航向角。对于每一目标，根据中心点的坐标、长宽高及航向角确定目标的各角点的坐标，其中，角点通常指极值点，即某方面特别突出的点，在本发明一些实施例中，角点可以指的是线与线之间的角点，如图5所示，例如目标为长方体状，则目标的各角点指的是长方体的各顶点。之后利用第一目标点云的坐标平均值对中心点和各角点的坐标进行转换，得到第一中心点和各第一角点的坐标。再利用第一视锥点云的Y轴的平均值对第一中心点和各第一角点的坐标进行转换，得到第二中心点和各第二角点的坐标。再利用目标的中心轴与摄像头坐标系的Z轴间的夹角对第二中心点和各第二角点的坐标进行转换，得到第三中心点和各第三角点的坐标。再利用外参数矩阵对第三中心点和各第三角点的坐标进行转换，得到第四中心点和各第四角点的坐标。最后根据各第四角点的坐标计算目标的目标航向角，将第四中心点的坐标、长宽高及目标航向角确定为目标的第二三维信息，遍历各目标的第一三维信息，确定各目标在车辆坐标系下的第二三维信息。

根据一个实施例，外参数矩阵

其中，R _ij(i，j＝1，2，3)表示旋转矩阵，[T ₁₁，T ₁₂，T ₁₃] ^b表示平移向量。

将目标的中心点和角点的坐标分别转换为车辆坐标系下的第四中心点和第四角点的坐标的具体过程如下：

最终输出的信息的形式如下：

其中，pos(x，y，z)为目标的中心点在车辆坐标系下的坐标，size(l，w，h)为目标的长、宽、高，heading_angle1为目标航向角。

基于同一发明构思，本发明的一个或多个实施例还提出了一种电子设备600。图6是根据本发明一个或多个实施例的电子设备的示意性结构框图。如图6所示，电子设备600包括：处理器610和存储有计算机程序621的存储器620.当计算机程序621被处理器610运行时，导致电子设备600执行如上述任意实施例的方法。

基于同一发明构思，本发明的一个或多个实施还提出了一种计算机存储介质，存储介质中存储有至少一条指令、至少一段程序、代读码集或指令集，至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行如上述任意实施例所述的方法。

本发明的一个或多个实施提供了一种基于车载摄像头和激光雷达的目标检测方法。在本发明一个或多个实施例中，首先分别获取摄像头和激光雷达同步采集到的图像和点云并从点云中提取出位于摄像头视场角内的点云作为第一点云。之后将第一点云投影至图像坐标系中得到图像坐标系下的第二点云，并且检测图像中包含的各目标得到各目标的各目标检测信息，其中，各目标检测信息包括各目标的像素位置。之后根据各目标的像素位置确定各目标的目标框，并且根据位于各目标框内的第二点云确定与各目标对应的视锥点云。在得到视锥点云后，再对各视锥点云进行坐标转换得到与各目标对应的目标视锥点云。之后再提取各目标视锥点云中的第一目标点云，对各第一目标点云进行坐标转换得到与各目标对应的第二目标点云，对各第二目标点云进行拟合回归得到各目标的第一三维信息。最后根据各第一三维信息确定各目标在车辆坐标系下的第二三维信息，输出各目标检测信息和各第二三维信息。根据本发明一个或多个实施例，通过将摄像头采集数据和激光雷达采集数据进行充分融合，从而可以得到智能车辆周围物体的精准的三维信息，从而在智能车辆自动驾驶行程中，可以根据周围物体的三维信息而规划出正确的路径，极大地保障了安全驾驶。

尽管已经针对有限数量的实施例描述了本发明，但是受益于本公开的本领域技术人员将理解，可以设计其他实施例而不脱离本文所公开的本发明的范围。因此，本发明的范围应仅由所附权利要求书限制。

Claims

一种目标检测方法，包括：

分别获取摄像头和激光雷达同步采集到的图像和点云，并且从所述点云中提取位于所述摄像头的视场角内的点云作为第一点云；

将所述第一点云投影至图像坐标系中得到所述图像坐标系下的第二点云；

检测所述图像中包含的各目标得到各所述目标的各目标检测信息，各所述目标检测信息包括各所述目标的像素位置；

根据各所述目标的所述像素位置确定各所述目标的目标框，根据位于各所述目标框内的所述第二点云确定与各所述目标对应的视锥点云；

对各所述视锥点云进行坐标转换得到与各所述目标对应的目标视锥点云；

提取各所述目标视锥点云中的第一目标点云，对各所述第一目标点云进行坐标转换得到与各所述目标对应的第二目标点云；

对各所述第二目标点云进行拟合回归得到各所述目标的第一三维信息；

根据各所述第一三维信息确定各所述目标在车辆坐标系下的第二三维信息，输出各所述目标检测信息和各所述第二三维信息。
根据权利要求1所述的方法，其中，所述将所述第一点云投影至图像坐标系中得到所述图像坐标系下的第二点云，包括：

标定所述摄像头的内参数得到内参数矩阵；

以所述摄像头为参考点联合标定所述摄像头和所述激光雷达得到所述激光雷达到所述摄像头的第一坐标转换矩阵；

利用所述第一坐标转换矩阵对所述第一点云进行坐标转换得到摄像头坐标系下的第三点云；

利用所述内参数矩阵对所述第三点云进行坐标投影得到所述图像坐标系下的所述第二点云。
根据权利要求2所述的方法，其中，所述根据位于各所述目标框内的所述第二点云确定与各所述目标对应的视锥点云包括：

对位于各所述目标框内的所述第二点云进行随机采样，得到与各所述目标对应的第四点云；

将与各所述第四点云对应的各所述第三点云确定为与各所述目标对应的所述视锥点云。
根据权利要求2所述的方法，其中，所述对各所述视锥点云进行坐标转换得到与各所述目标对应的目标视锥点云包括：

确定各所述目标的中心轴与所述摄像头坐标系的Z轴间的夹角，利用各所述夹角对各所述视锥点云进行坐标转换得到与各所述目标对应的第一视锥点云，其中，所述中心轴为所述目标的中心与所述摄像头坐标系的原点间的连线；

计算各所述第一视锥点云的Y轴平均值，利用各所述Y轴平均值对各所述第一视锥点云进行坐标转换得到与各所述目标对应的所述目标视锥点云。
根据权利要求4所述的方法，其中，各所述第一三维信息包括各所述目标的中心点的坐标、长宽高及航向角，所述根据各所述第一三维信息确定各所述目标在车辆坐标系下的第二三维信息包括：

以车辆的惯性测量装置为参考点标定所述摄像头的外参数得到外参数矩阵；

对于每一所述目标，根据所述中心点的坐标、所述长宽高及所述航向角确定所述目标的各角点的坐标；

利用所述第一目标点云的坐标平均值对所述中心点和各所述角点的坐标进行转换，得到第一中心点和各第一角点的坐标；

利用所述第一视锥点云的Y轴平均值对所述第一中心点和各所述第一角点的坐标进行转换，得到第二中心点和各第二角点的坐标；

利用所述目标的中心轴与所述摄像头坐标系的Z轴间的所述夹角对所述第二中心点和各所述第二角点的坐标进行转换，得到第三中心点和各第三角点的坐标；

利用所述外参数矩阵对所述第三中心点和各所述第三角点的坐标进行转换，得到第四中心点和各第四角点的坐标；

根据各所述第四角点的坐标计算所述目标的目标航向角，将所述第四中心点的坐标、所述长宽高及所述目标航向角确定为所述目标的所述第二三维信息；

遍历各所述目标的所述第一三维信息，确定各所述目标在所述车辆坐标系下的所述第二三维信息。
根据权利要求1至5中任一项所述的方法，其中，所述提取各所述目标视锥点云中的第一目标点云包括：

将各所述目标视锥点云分别输出至点云分割网络得到各所述目标视锥点云中各点属于前景的第一概率和属于背景的第二概率；

对于各所述目标视锥点云，选取所述第一概率大于所述第二概率的所述点组成目标点云集合；

对各所述目标点云集合进行随机采样得到各所述第一目标点云。
根据权利要求1至6中任一项所述的方法，其中，所述对各所述第一目标点云进行坐标转换得到与各所述目标对应的第二目标点云包括：

计算各所述第一目标点云的坐标平均值；

利用各所述第一目标点云的坐标平均值对各所述第一目标点云进行坐标转换，得到与各所述目标对应的所述第二目标点云。
根据权利要求1至7中任一项所述的方法，其中，所述检测所述图像中包含的各目标得到各所述目标的各目标检测信息包括：

将所述图像输出至目标检测神经网络中以检测所述图像包含的各所述目标并得到各所述目标的各所述目标检测信息。
根据权利要求8所述的方法，其中，所述目标检测信息包括分类信息、像素位置及置信度中的至少一个。
根据权利要求1所述的方法，其中，所述对各所述第二目标点云进行拟合回归得到各所述目标的第一三维信息包括：

将各所述第二目标点云输出至点云拟合回归网络中得到各所述目标的所述第一三维信息。
一种电子设备，包括：

处理器；

存储有计算机程序的存储器，

其中，当所述计算机程序被所述处理器运行时，导致所述电子设备执行如权利要求1-10任一项所述的方法。
一种计算机存储介质，其中，所述存储介质中存储有至少一条指令、至少一段程序、代读码集或指令集，所述至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行如权利要求1-10中任意一项所述的方法。