CN109409318A - 统计模型的训练方法、统计方法、装置及存储介质 - Google Patents
统计模型的训练方法、统计方法、装置及存储介质 Download PDFInfo
- Publication number
- CN109409318A CN109409318A CN201811322334.5A CN201811322334A CN109409318A CN 109409318 A CN109409318 A CN 109409318A CN 201811322334 A CN201811322334 A CN 201811322334A CN 109409318 A CN109409318 A CN 109409318A
- Authority
- CN
- China
- Prior art keywords
- loss
- function
- regression
- sample picture
- penalty
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013179 statistical model Methods 0.000 title claims abstract description 54
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000012549 training Methods 0.000 title claims abstract description 26
- 238000007619 statistical method Methods 0.000 title claims abstract description 11
- 238000004590 computer program Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 description 64
- 230000008569 process Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 238000005457 optimization Methods 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 241000282326 Felis catus Species 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供一种统计模型的训练方法、统计方法、装置及存储介质,包括:获取样本图片和用于表征所述样本图片中目标对象数量的真实值的标签;将所述样本图片输入到待训练统计模型,以获取所述样本图片的回归密度图;基于所述回归密度图,获取所述样本图片中目标对象数量的预测函数以及用于表征所述样本图片中每个像素点上否出现所述目标对象的回归函数;基于所述预测函数、所述样本图片中目标对象数量的真实值、所述回归函数以及预设规则,更新所述待训练统计模型的网络参数。本发明实施例能够减少标记的难度,具有更广泛的适应能力。
Description
技术领域
本发明涉及图像处理领域,具体而言,涉及一种统计模型的训练方法、统计方法、装置及存储介质。
背景技术
密度图:密度图(Density Map)又称密度分布图,是一种二维空间图,也是表示目标对象分布情况的一种主要工具。密度图由一系列不同的值表示人群分布的情况,没有人的密度点处值为0,有人的密度点处值为非0值。通过对密度图求和,便可以得到原来图像中的人的数量。
为了防止踩踏事故悲剧的再次发生,有必要对公共场合的行人数目进行实时监控,方便相关工作人员及时获得行人数量信息,当行人数目过多时以采取相关措施,以防止踩踏事件的发生。
行人检测方法—基于目标检测的方法。利用特征提取的对视频图像中的行人进行检测,从而获取行人的数量。然而,该方案无法解决人头遮挡问题,并且对于视角误差无法及时反映,比如说距离摄像头较远的目标显示得很小,而距离摄像头较近的目标显示得比较大,速度较慢。
基于密度图的回归方法。通过(Multi-Column Convolutional Neural Network,MCNN)多柱卷积神经网络提取相关的上下文信息,可以减少视觉误差的影响,联立回归出行人数目,从而提高回归质量。然而,该方案标注数据集难度较大,并且很容易标注出错,从而影响人群预测质量。
发明内容
鉴于此,本发明实施例的目的在于提供一种统计模型的训练方法、统计方法、装置及存储介质,以缓解上述问题。
第一方面,本发明实施例提供一种统计模型的训练方法,所述方法包括:获取样本图片和用于表征所述样本图片中目标对象数量的真实值的标签;将所述样本图片输入到待训练统计模型,以获取所述样本图片的回归密度图;基于所述回归密度图,获取所述样本图片中目标对象数量的预测函数以及用于表征所述样本图片中每个像素点上否出现所述目标对象的回归函数;基于所述预测函数、所述样本图片中目标对象数量的真实值、所述回归函数以及预设规则,更新所述待训练统计模型的网络参数。
第二方面,本发明实施例提供一种统计方法,获取待检测的图片;将所述待检测图片输入到上述统计模型,获取与所述待检测图片对应的密度图;基于所述密度图,计算所述待检测图片中目标对象的数量。
第三方面,本发明实施例提供一种统计模型的训练装置,所述装置包括:第一获取模块,用于获取样本图片和用于表征所述样本图片中目标对象数量的真实值的标签;第一输入模块,用于将所述样本图片输入到待训练统计模型,以获取所述样本图片的回归密度图;函数获取模块,用于基于所述回归密度图,获取所述样本图片中目标对象数量的预测函数以及用于表征所述样本图片中每个像素点上否出现所述目标对象的回归函数;更新模块,用于基于所述预测函数、所述样本图片中目标对象数量的真实值、所述回归函数以及预设规则,更新所述待训练统计模型的网络参数。
第四方面,本发明实施例提供一种统计装置,第二获取模块,用于获取待检测的图片;第二输入模块,用于将所述待检测图片输入到上述统计模型,获取与所述待检测图片对应的密度图;计算模块,用于基于所述密度图,计算所述待检测图片中目标对象的数量。
第五方面,本发明实施例提供一种存储介质,所述存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行第一方面和第二方面所述的方法。
与现有技术相比,本发明各实施例提出的一种统计模型的训练方法、统计方法、装置及存储介质能够达到的有益效果包括:通过只标记图片中有多少个目标对象(获取样本图片和用于表征所述样本图片中目标对象数量的真实值的标签),不需要标记目标对象的分布情况,这样在目标对象数目不变而分布改变的情况下,可以减少标记的难度。同时考虑回归密度图估计的目标对象的数量和真实值之间的差值,以及回归密度图的统计特性的损失(例如:回归函数的值被回归为一些很小的值),提高目标对象的估计精度。为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的电子设备的结构示意图;
图2为本发明实施例提供的一种统计模型的训练方法的流程图;
图3为本发明实施例提供的一种统计方法的流程图;
图4为本发明实施例提供的一种统计模型的训练装置的模块示意图;
图5为本发明实施例提供的一种统计装置的模块示意图。
图标:100-电子设备;110-存储器;120-存储控制器;130-处理器;140-外设接口;150-输入输出单元;170-显示单元;210-第一获取模块;220-第一输入模块;230-函数获取模块;240-更新模块;310-第二获取模块;320-第二输入模块;330-计算模块。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
本发明实施例提供一种电子设备100的结构示意图,所述电子设备100可以是个人电脑(personal computer,PC)、平板电脑、智能手机、个人数字助理(personal digitalassistant,PDA)等。
如图1所示,所述电子设备100可以包括:统计模型的训练装置、统计装置、存储器110、存储控制器120、处理器130、外设接口140、输入输出单元150、显示单元170。
所述存储器110、存储控制器120、处理器130、外设接口140、输入输出单元150以及显示单元170各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述统计模型的训练装置和所述统计装置包括至少一个可以软件或固件(firmware)的形式存储于所述存储器110中或固化在客户端设备的操作系统(operating system,OS)中的软件功能模块。所述处理器130用于执行存储器110中存储的可执行模块,例如所述统计模型的训练装置和所述统计装置包括的软件功能模块或计算机程序。
其中,存储器110可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器110用于存储程序,所述处理器130在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流程定义的电子设备100所执行的方法可以应用于处理器130中,或者由处理器130实现。
处理器130可能是一种集成电路芯片,具有信号的处理能力。上述的处理器130可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述外设接口140将各种输入/输出装置耦合至处理器130以及存储器110。在一些实施例中,外设接口140,处理器130以及存储控制器120可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
输入输出单元150用于提供给用户输入数据实现用户与电子设备100的交互。所述输入输出单元150可以是,但不限于,鼠标和键盘等。
显示单元170在电子设备100与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据给用户参考。在本实施例中,所述显示单元170可以是液晶显示器或触控显示器。若为触控显示器,其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处同时产生的触控操作,并将该感应到的触控操作交由处理器130进行计算和处理。
实施例
请参照图2,图2是本发明实施例提供的一种统计模型的训练方法的流程图。该训练方法可以应用于如图1所示的电子设备100。下面将对图2所示的流程进行详细阐述,所述方法包括:
S100:获取样本图片和用于表征所述样本图片中目标对象数量的真实值的标签。
在实际实施过程中,样本图片为能够输入具有图像处理能力的电子设备100的电子图片,样本图片里面的内容可以为猫、狗、人等目标对象,其中,样本图片的数量为多张,样本图片数量越多,统计模型的性能越佳。将样本图片和用于表征所述样本图片中目标对象数量的真实值的标签输入具有图像处理能力的电子设备100。其中,作为一种实施方式,所述标签可以为样本图片中目标对象数量的真实值。作为一种实施方式,通过在数据库中提前存储所有样本图片中每张样本图片中目标对象的数量以及与每张样本图片一一对应的标签信息,继而能够利用获取的标签信息从数据库中查询出对应的样本图片中目标对象的真实值。
S200:将所述样本图片输入到待训练统计模型,以获取所述样本图片的回归密度图。
在实际实施过程中,通过将所述样本图片输入到存储在存储器110中的待训练统计模型,通过待训练统计模型,电子设备100能够获取所述样本图片的回归密度图。在本实施例中,密度图的生成方式包括:
在原始图片中目标对象出现的位置产生一个标准正态分布,使得密度图具有更好的平滑性与连续性。在本实施例中,所述目标对象为人,在其他实施例中,所述目标对象可以为狗、猫等。
假设在原始图片中每个人头点周围人群是均匀分布的,那么根据第i个人头点与第i个人头点近邻的所有人头点的平均距离di能够估算由于视角引起的几何偏差。因此需引入基于人头大小的分布参数σ,那么密度图的函数表达式为:
在上式中,x是密度图中的点,xi是人头出现的点,σ(.)是单位冲激函数,*是卷积操作,Gσi是一个均值为0,方差为σi的二维正态分布。σi的值由调节因子β与di共同决定。
S300:基于所述回归密度图,获取所述样本图片中目标对象数量的预测函数以及用于表征所述样本图片中每个像素点上否出现所述目标对象的回归函数。
其中,在所述目标对象为人时,S300包括:
基于所述回归密度图,获取所述样本图片中人数的预测函数以及用于表征所述样本图片中每个像素点上否出现人头的回归函数。其中,每个像素点和回归密度图中每个密度点的位置一一对应。
基于所述回归密度图的函数表达式,针对每个密度点x的坐标位置,并将每个密度点的坐标位置代入所述回归密度图的函数表达式,获取所述样本图片中每个像素点x上是否出现人的回归函数,基于每个回归函数,获取所述样本图片中目标对象数量的预测函数,可以理解的是,对回归密度图中每个密度点对应的值进行求和操作,获得目标对象估计值,并对所述目标对象估计值进行四舍五入,获得所述样本图片中目标对象数量的预测值。
S400:基于所述预测函数、所述样本图片中目标对象数量的真实值、所述回归函数以及预设规则,更新所述待训练统计模型的网络参数。
其中,所述预设规则为:Losstotal=Lossmse(w)+λLosspenalty(w),其中,λ为惩罚项系数,w为网络参数,S400包括:
将所述样本图片中目标对象数量的真实值与所述预测函数作差值运算,获取所述样本图片中目标对象数量的损失函数Lossmse(w)。
为了提高网络的泛化性能,可以利用回归得到的密度图与真实密度图之间的统计特性,利用其不等式关系,可以防止回归时遇到的一些极端情况,比如说回归函数的值全部都被回归为一些很小的值。因此,在训练过程中定义的回归损失函数Losspenalty(w)就会加入到网络参数更新的过程之中,以提高网络训练的水平。具体实现方式如下:
将所述回归函数与预设值作差值运算,获取回归损失函数Losspenalty(w),可以理解的是,并将所述回归函数与预设值做差值运算后,获得回归损失函数Losspenalty(w),其中,所述预设值为通过所述样本图片的真实密度图的函数表达式计算出的回归值。
将所述损失函数Lossmse(w)和所述回归损失函数Losspenalty(w)分别带入损失函数Losstotal=Lossmse(w)+λLosspenalty(w),通过调整w和λ的值,在Losstotal满足预设门限值时,获得所述待训练统计模型的网络参数w和惩罚项系数λ。可以理解的是,通过调整w和λ的值,在Losstotal满足预设门限值时,将此时w的取值和λ的取值分别用于更新网络参数的值和惩罚项系数的值。
作为一种实施方式,将所述损失函数Lossmse(w)和所述回归损失函数Losspenalty(w)分别带入损失函数Losstotal=Lossmse(w)+λLosspenalty(w),其中,通过求解损失函数最小值的问题,可以理解为寻找最佳的惩罚项系数和网络参数的问题,然而对于惩罚项系数的优化,是一个超参数优化的问题,由于惩罚项系数的分布是处于离散空间的,因此,如何寻找最佳的惩罚项系数无法使用传统的梯度下降方法。作为一种实施方式,利用训练集数据(人头数)验证集数据(密度图)联立更新网络参数与惩罚项系数的。因此,上述优化问题就变为了一个二重优化问题:通过联合求解获得所述待训练统计模型的网络参数w和惩罚项系数λ。
其中,可以通过如下方式求解:
首先针对训练集,计算损失函数Losstotal=Lossmse(w)+λLosspenalty(w)对网络参数w的梯度,获得第一梯度函数▽wLTrain(w,λ),然后对网络参数进行模拟更新:w′=w-ξ▽wLTrain(w,λ),并将w'代入并计算Lossmse(w)对惩罚项系数λ的梯度,获得第二梯度函数▽λLVal(w'),最后更新惩罚项系数λ′=λ-ξ1▽λLval(w′)其中,ξ1和ξ均为预设虚拟步长,重复执行上述更新过程,直到Losstotal=Lossmse(w)+λLosspenalty(w)的值满足预设门限值,停止参数更新过程。作为一种实施方式,在参数更新次数满足预设值,停止参数更新过程。
作为一种实施方式,图3是本发明实施例提供的一种统计方法的流程图。下面将对图3所示的流程进行详细阐述,所述方法包括:
S500:获取待检测的图片。
其中,待检测图片可以为可为摄像头拍摄的图片,将待检测图片输入具有图像处理能力的终端设备,其中,待检测图片中的目标对象可以是人、猫、狗等,在本实施例中,待检测图片中的目标对象为人,该终端设备能够通过预先训练好的统计模型实现对待检测图片中的目标对象的数量进行统计并输出。
S600:将所述待检测图片输入到上述统计模型,获取与所述待检测图片对应的密度图。
S700:基于所述密度图,计算所述待检测图片中目标对象的数量。
针对所述密度图的每个密度点的回归函数的值,在回归函数的值大于预设值时,表征该密度点处有人。
总之,同时考虑回归密度图估计的目标对象的数量和真实值之间的差值,以及回归密度图的统计特性的损失(例如:回归函数的值全部都被回归为一些很小的值),提高目标对象的估计精度。
请参照图4,图4是本发明实施例提供的一种统计模型的训练装置的结构框图。下面将对图4所示的结构框图进行阐述,所示装置包括:
第一获取模块210,用于获取样本图片和用于表征所述样本图片中目标对象数量的真实值的标签。
第一输入模块220,用于将所述样本图片输入到待训练统计模型,以获取所述样本图片的回归密度图。
函数获取模块230,用于基于所述回归密度图,获取所述样本图片中目标对象数量的预测函数以及用于表征所述样本图片中每个像素点上否出现所述目标对象的回归函数。
更新模块240,用于基于所述预测函数、所述样本图片中目标对象数量的真实值、所述回归函数以及预设规则,更新所述待训练统计模型的网络参数。
作为一种实施方式,所述预设规则为:Losstotal=Lossmse(w)+λLosspenalty(w),其中,λ为惩罚项系数,w为网络参数,所述更新模块240包括:
第一差值运算模块,用于将所述样本图片中目标对象数量的真实值与所述预测函数作差值运算,获取所述样本图片中目标对象数量的损失函数Lossmse(w)。
第二差值运算模块,用于将所述回归函数与预设值作差值运算,获取回归损失函数Losspenalty(w)。
参数获取模块,用于将所述损失函数Lossmse(w)和所述回归损失函数Losspenalty(w)分别带入损失函数Losstotal=Lossmse(w)+λLosspenalty(w),通过调整和的值,在Losstotal满足预设门限值时,获得所述待训练统计模型的网络参数w和惩罚项系数λ。
作为一种实施方式,所述参数获取模块用于将所述损失函数Lossmse(w)和所述回归损失函数Losspenalty(w)分别带入损失函数Losstotal=Lossmse(w)+λLosspenalty(w),并通过联合求解获得所述待训练统计模型的网络参数w和惩罚项系数λ。
请参照图5,图5是本发明实施例提供的一种统计装置的结构框图。下面将对图5所示的结构框图进行阐述,所示装置包括:
第二获取模块310,用于获取待检测的片。
第二输入模块320,用于将所述待检测图片输入到上述统计模型,获取与所述待检测图片对应的密度图。
计算模块330,用于基于所述密度图,计算所述待检测图片中目标对象的数量。
此外,本发明实施例还提供了一种存储介质,在该存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行本发明任一项实施方式所提供的统计模型的训练方法和统计方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的训练装置和三维形状检索装置的具体工作过程,可以参考前述训练方法和三维形状检索方法中的对应过程,在此不再过多赘述。
综上所述,本发明实施例提出的统计模型的训练方法、统计方法、装置及存储介质:获取样本图片和用于表征所述样本图片中目标对象数量的真实值的标签;将所述样本图片输入到待训练统计模型,以获取所述样本图片的回归密度图;基于所述回归密度图,获取所述样本图片中目标对象数量的预测函数以及用于表征所述样本图片中每个像素点上否出现所述目标对象的回归函数;基于所述预测函数、所述样本图片中目标对象数量的真实值、所述回归函数以及预设规则,更新所述待训练统计模型的网络参数。通过只标记图片中有多少个目标对象,不需要标记目标对象的分布情况,这样在目标对象数目不变而分布改变的情况下,可以减少标记的难度。同时考虑回归密度图估计的目标对象的数量和真实值之间的差值,以及回归密度图的统计特性的损失(例如:回归函数的值全部都被回归为一些很小的值),提高目标对象的估计精度。
在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (10)
1.一种统计模型的训练方法,其特征在于,所述方法包括:
获取样本图片和用于表征所述样本图片中目标对象数量的真实值的标签;
将所述样本图片输入到待训练统计模型,以获取所述样本图片的回归密度图;
基于所述回归密度图,获取所述样本图片中目标对象数量的预测函数以及用于表征所述样本图片中每个像素点上否出现所述目标对象的回归函数;
基于所述预测函数、所述样本图片中目标对象数量的真实值、所述回归函数以及预设规则,更新所述待训练统计模型的网络参数。
2.根据权利要求1所述的方法,其特征在于,所述预设规则为:Losstotal=Lossmse(w)+λLosspenalty(w),其中,λ为惩罚项系数,w为网络参数,所述基于所述预测函数、所述样本图片中目标对象数量的真实值、所述回归函数以及预设规则,更新所述待训练统计模型的网络参数,包括:
将所述样本图片中目标对象数量的真实值与所述预测函数作差值运算,获取所述样本图片中目标对象数量的损失函数Lossmse(w);
将所述回归函数与预设值作差值运算,获取回归损失函数Losspenalty(w);
将所述损失函数Lossmse(w)和所述回归损失函数Losspenalty(w)分别带入损失函数Losstotal=Lossmse(w)+λLosspenalty(w),通过调整w和λ的值,在Losstotal满足预设门限值时,获得所述待训练统计模型的网络参数w和惩罚项系数λ。
3.根据权利要求2所述的方法,其特征在于,所述将所述损失函数Lossmse(w)和所述回归损失函数Losspenalty(w)分别带入损失函数Losstotal=Lossmse(w)+λLosspenalty(w),通过调整w和λ的值,在Losstotal满足预设门限值时,获得所述待训练统计模型的网络参数w和惩罚项系数λ,包括:
将所述损失函数Lossmse(w)和所述回归损失函数Losspenalty(w)分别带入损失函数Losstotal=Lossmse(w)+λLosspenalty(w),并通过联立更新求解获得所述待训练统计模型的网络参数w和惩罚项系数λ。
4.根据权利要求1所述的方法,其特征在于,所述目标对象为人,所述基于所述回归密度图,获取所述样本图片中目标对象数量的预测函数以及用于表征所述样本图片中每个像素点上否出现所述目标对象的回归函数,包括:
基于所述回归密度图,获取所述样本图片中人数的预测函数以及用于表征所述样本图片中每个像素点上否出现人头的回归函数。
5.一种统计方法,其特征在于,所述方法包括:
获取待检测图片;
将所述待检测图片输入到如权利要求1-4中任一权项所述的统计模型,获取与所述待检测图片对应的密度图;
基于所述密度图,计算所述待检测图片中目标对象的数量。
6.一种统计模型的训练装置,其特征在于,所述装置包括:
第一获取模块,用于获取样本图片和用于表征所述样本图片中目标对象数量的真实值的标签;
第一输入模块,用于将所述样本图片输入到待训练统计模型,以获取所述样本图片的回归密度图;
函数获取模块,用于基于所述回归密度图,获取所述样本图片中目标对象数量的预测函数以及用于表征所述样本图片中每个像素点上否出现所述目标对象的回归函数;
更新模块,用于基于所述预测函数、所述样本图片中目标对象数量的真实值、所述回归函数以及预设规则,更新所述待训练统计模型的网络参数。
7.根据权利要求6所述的装置,其特征在于,所述预设规则为:Losstotal=Lossmse(w)+λLosspenalty(w),其中,λ为惩罚项系数,w为网络参数,所述更新模块包括:
第一差值运算模块,用于将所述样本图片中目标对象数量的真实值与所述预测函数作差值运算,获取所述样本图片中目标对象数量的损失函数Lossmse(w);
第二差值运算模块,用于分别将所述回归函数与预设值作差值运算,获取回归损失函数Losspenalty(w);
参数获取模块,用于将所述损失函数Lossmse(w)和所述回归损失函数Losspenalty(w)分别带入损失函数Losstotal=Lossmse(w)+λLosspenalty(w),通过调整w和λ的值,在Losstotal满足预设门限值时,获得所述待训练统计模型的网络参数w和惩罚项系数λ。
8.根据权利要求7所述的装置,其特征在于,所述参数获取模块用于,将所述损失函数Lossmse(w)和所述回归损失函数Losspenalty(w)分别带入损失函数Losstotal=Lossmse(w)+λLosspenalty(w),通过联立更新求解获得所述待训练统计模型的网络参数w和惩罚项系数λ。
9.一种统计装置,其特征在于,所述装置包括:
第二获取模块,用于获取待检测图片;
第二输入模块,用于将所述待检测图片输入到如权利要求1-4中任一权项所述的统计模型,获取与所述待检测图片对应的密度图;
计算模块,用于基于所述密度图,计算所述待检测图片中目标对象的数量。
10.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行如权利要求1-5中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811322334.5A CN109409318B (zh) | 2018-11-07 | 2018-11-07 | 统计模型的训练方法、统计方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811322334.5A CN109409318B (zh) | 2018-11-07 | 2018-11-07 | 统计模型的训练方法、统计方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109409318A true CN109409318A (zh) | 2019-03-01 |
CN109409318B CN109409318B (zh) | 2021-03-02 |
Family
ID=65472255
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811322334.5A Active CN109409318B (zh) | 2018-11-07 | 2018-11-07 | 统计模型的训练方法、统计方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109409318B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110728227A (zh) * | 2019-10-09 | 2020-01-24 | 北京百度网讯科技有限公司 | 图像处理的方法及装置 |
CN111461329A (zh) * | 2020-04-08 | 2020-07-28 | 中国银行股份有限公司 | 一种模型的训练方法、装置、设备及可读存储介质 |
CN111738136A (zh) * | 2020-06-19 | 2020-10-02 | 新希望六和股份有限公司 | 显微对象的数量确定方法、装置、计算机设备和存储介质 |
CN113011532A (zh) * | 2021-04-30 | 2021-06-22 | 平安科技(深圳)有限公司 | 分类模型训练方法、装置、计算设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104992223A (zh) * | 2015-06-12 | 2015-10-21 | 安徽大学 | 基于深度学习的密集人数估计方法 |
US20150310275A1 (en) * | 2012-11-28 | 2015-10-29 | Zte Corporation | Method and device for calculating number and moving direction of pedestrians |
WO2016183766A1 (en) * | 2015-05-18 | 2016-11-24 | Xiaogang Wang | Method and apparatus for generating predictive models |
CN106326937A (zh) * | 2016-08-31 | 2017-01-11 | 郑州金惠计算机系统工程有限公司 | 基于卷积神经网络的人群密度分布估计方法 |
CN106845621A (zh) * | 2017-01-18 | 2017-06-13 | 山东大学 | 基于深度卷积神经网络的密集人群人数计数方法及系统 |
CN107563349A (zh) * | 2017-09-21 | 2018-01-09 | 电子科技大学 | 一种基于VGGNet的人数估计方法 |
CN107742099A (zh) * | 2017-09-30 | 2018-02-27 | 四川云图睿视科技有限公司 | 一种基于全卷积网络的人群密度估计、人数统计的方法 |
CN108021852A (zh) * | 2016-11-04 | 2018-05-11 | 株式会社理光 | 一种人数统计方法、人数统计系统及电子设备 |
-
2018
- 2018-11-07 CN CN201811322334.5A patent/CN109409318B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150310275A1 (en) * | 2012-11-28 | 2015-10-29 | Zte Corporation | Method and device for calculating number and moving direction of pedestrians |
WO2016183766A1 (en) * | 2015-05-18 | 2016-11-24 | Xiaogang Wang | Method and apparatus for generating predictive models |
CN107624189A (zh) * | 2015-05-18 | 2018-01-23 | 北京市商汤科技开发有限公司 | 用于生成预测模型的方法和设备 |
CN104992223A (zh) * | 2015-06-12 | 2015-10-21 | 安徽大学 | 基于深度学习的密集人数估计方法 |
CN106326937A (zh) * | 2016-08-31 | 2017-01-11 | 郑州金惠计算机系统工程有限公司 | 基于卷积神经网络的人群密度分布估计方法 |
CN108021852A (zh) * | 2016-11-04 | 2018-05-11 | 株式会社理光 | 一种人数统计方法、人数统计系统及电子设备 |
CN106845621A (zh) * | 2017-01-18 | 2017-06-13 | 山东大学 | 基于深度卷积神经网络的密集人群人数计数方法及系统 |
CN107563349A (zh) * | 2017-09-21 | 2018-01-09 | 电子科技大学 | 一种基于VGGNet的人数估计方法 |
CN107742099A (zh) * | 2017-09-30 | 2018-02-27 | 四川云图睿视科技有限公司 | 一种基于全卷积网络的人群密度估计、人数统计的方法 |
Non-Patent Citations (4)
Title |
---|
JIAWEN LI ET AL.: "An end-to-end generative adversarial network for crowd counting under complicated scenes", 《2017 IEEE INTERNATIONAL SYMPOSIUM ON BROADBAND MULTIMEDIA SYSTEMS AND BROADCASTING (BMSB)》 * |
VISHWANATH A ET.AL: "A survey of recent advances in CNN-based single image crowd counting and density estimation", 《PATTERN RECOGNITION LETTERS》 * |
包灵: "基于深度学习的智能人数统计技术研究与系统设计", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
马海军: "监控场景中人数统计算法的研究与应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110728227A (zh) * | 2019-10-09 | 2020-01-24 | 北京百度网讯科技有限公司 | 图像处理的方法及装置 |
CN110728227B (zh) * | 2019-10-09 | 2022-12-06 | 北京百度网讯科技有限公司 | 图像处理的方法及装置 |
CN111461329A (zh) * | 2020-04-08 | 2020-07-28 | 中国银行股份有限公司 | 一种模型的训练方法、装置、设备及可读存储介质 |
CN111461329B (zh) * | 2020-04-08 | 2024-01-23 | 中国银行股份有限公司 | 一种模型的训练方法、装置、设备及可读存储介质 |
CN111738136A (zh) * | 2020-06-19 | 2020-10-02 | 新希望六和股份有限公司 | 显微对象的数量确定方法、装置、计算机设备和存储介质 |
CN113011532A (zh) * | 2021-04-30 | 2021-06-22 | 平安科技(深圳)有限公司 | 分类模型训练方法、装置、计算设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109409318B (zh) | 2021-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109409318B (zh) | 统计模型的训练方法、统计方法、装置及存储介质 | |
US11798174B2 (en) | Method, device, equipment and storage medium for locating tracked targets | |
CN108805898B (zh) | 视频图像处理方法和装置 | |
JP6740033B2 (ja) | 情報処理装置、計測システム、情報処理方法及びプログラム | |
EP3971684A1 (en) | Vision-based tactile measurement method, apparatus, chip and storage medium | |
CN112857268B (zh) | 对象面积测量方法、装置、电子设备和存储介质 | |
CN110348412B (zh) | 一种关键点定位方法、装置、电子设备及存储介质 | |
US20120027277A1 (en) | Interactive iterative closest point algorithm for organ segmentation | |
CN112965645B (zh) | 页面拖拽方法、装置、计算机设备及存储介质 | |
CN108921898B (zh) | 摄像机位姿确定方法、装置、电子设备和计算机可读介质 | |
CN108427941B (zh) | 用于生成人脸检测模型的方法、人脸检测方法和装置 | |
CN110956131A (zh) | 单目标追踪方法、装置及系统 | |
CN109448018B (zh) | 跟踪目标的定位方法、装置、设备及存储介质 | |
CN110517221B (zh) | 基于现实坐标的缝隙定位方法、装置和存储介质 | |
CN114821140A (zh) | 基于曼哈顿距离的图像聚类方法、终端设备及存储介质 | |
US20240273807A1 (en) | Virtual scene generation method, electronic device and storage medium | |
CN114641795A (zh) | 物体检索装置及物体检索方法 | |
CN117726862A (zh) | 应用于工业检测的模型训练方法、装置及存储介质 | |
CN111240622A (zh) | 一种绘制方法及装置 | |
CN116467896A (zh) | 一种口腔正畸疗效模拟系统及方法 | |
US20180025479A1 (en) | Systems and methods for aligning measurement data to reference data | |
CN114638921A (zh) | 动作捕捉方法、终端设备及存储介质 | |
KR102066862B1 (ko) | Rgb-d 카메라를 이용한 컨베이어용 고속 박스 크기 측정 장치 및 방법 | |
CN116543425A (zh) | 基于YOLOv4的手掌检测方法、装置、计算机设备及存储介质 | |
CN101799925A (zh) | 一种图像自动分割结果的性能分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |