CN112101481A - 目标物的影响因子筛选方法、装置、设备及存储介质 - Google Patents
目标物的影响因子筛选方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112101481A CN112101481A CN202011097292.7A CN202011097292A CN112101481A CN 112101481 A CN112101481 A CN 112101481A CN 202011097292 A CN202011097292 A CN 202011097292A CN 112101481 A CN112101481 A CN 112101481A
- Authority
- CN
- China
- Prior art keywords
- influence
- target
- factor
- influence factors
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000012216 screening Methods 0.000 title claims abstract description 45
- 238000013145 classification model Methods 0.000 claims abstract description 78
- 230000006870 function Effects 0.000 claims description 29
- 238000012896 Statistical algorithm Methods 0.000 claims description 17
- 238000011176 pooling Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 238000013527 convolutional neural network Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 11
- 230000004913 activation Effects 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 9
- 239000013076 target substance Substances 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 238000013136 deep learning model Methods 0.000 abstract description 8
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000007405 data analysis Methods 0.000 abstract description 2
- 102000003712 Complement factor B Human genes 0.000 description 10
- 108090000056 Complement factor B Proteins 0.000 description 10
- 235000013399 edible fruits Nutrition 0.000 description 10
- 241000220324 Pyrus Species 0.000 description 6
- 238000007726 management method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 4
- 235000014443 Pyrus communis Nutrition 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000012800 visualization Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000013481 data capture Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 235000021017 pears Nutrition 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及数据分析技术,揭露了一种目标物的影响因子筛选方法,包括:将标准图像输入至分类模型中得到标准图像为目标类别的类别预测值;对所述类别预测值进行计算得到待选取的影响因子的数量;利用分类模型对多个影响因子进行计算得到各个影响因子的影响预测值,根据影响预测值从预设的多个影响因子中选取所述数量的影响因子作为目标因子集合;计算目标因子集合中每个影响因子的标签值,从目标因子集合中选取标签值为预设标签阈值的影响因子作为标准影响因子。本发明还提出了目标物的影响因子筛选装置及计算机可读存储介质。此外,本发明还涉及区块链技术,标准图像可存储于区块链节点中。本发明可获取深度学习模型的输入数据中的影响因素。
Description
技术领域
本发明涉及数据分析技术领域,尤其涉及一种目标物的影响因子筛选方法、装置、电子设备及计算机可读存储介质。
背景技术
用于图像的深度学习模型的可解释性一直是机器学习所关注的重点问题。具体的,深度学习模型的可解释性对于模型的改进、模型的可信性及模型透明度均有着重要的作用。
特征可视化是目前常用的用于图像的深度学习模型的解释方法,特征可视化过程中寻找模型输入数据中影响因素,以及各影响因素对模型预测结果的影响并进行可视化,可在一定程度上说明模型在作出预测的过程中对输入数据的关注点。但实际应用中,特征可视化仅可显示出模型在对输入数据作出数据标签的预测时所关注的输入数据中影响因子的涉及的范围(如位置坐标),却无法反映模型具体是根据输入数据中的哪些具体影响因子作出的预测。例如,对图像识别生成预测标签时,特征可视化仅可显示出图像中模型所关注的影响因子的像素位置,却无法反映模型具体是根据图像中的哪些具体影响因子作出的标签预测。
发明内容
本发明提供一种目标物的影响因子筛选方法、装置、电子设备及计算机可读存储介质,其主要目的在于获取深度学习模型的输入数据中的影响因素。
为实现上述目的,本发明提供的一种目标物的影响因子筛选方法,包括:
获取标准图像,将所述标准图像输入至预先构建的分类模型中得到所述标准图像为目标类别的类别预测值;
利用预设的数量统计算法对所述类别预测值进行计算得到待选取的影响因子的数量;
利用所述分类模型对预设的多个影响因子进行计算得到各个影响因子的影响预测值,并根据所述影响预测值从所述预设的多个影响因子中选取所述数量的影响因子作为目标因子集合;
计算所述目标因子集合中每个影响因子的标签值,并从所述目标因子集合中选取标签值为预设标签阈值的影响因子作为标准影响因子。
可选地,所述分类模型为卷积神经网络,所述将所述标准图像输入至预先构建的分类模型中得到所述标准图像为目标类别的类别预测值,包括:
利用所述卷积神经网络的主任务网络对所述标准图像进行卷积,得到卷积图像;
对所述卷积图像进行池化,得到特征图像;
对所述特征图像进行全连接处理,得到全连接图像;
利用激活函数计算所述全连接图像为目标类别的类别预测值。
可选地,所述根据所述影响预测值从所述预设的多个影响因子中选取所述数量的影响因子作为目标因子集合,包括:
将所述多个影响因子按照所述影响预测值从大到小的顺序进行排序,得到影响因子序列;
从所述影响因子序列中按照从前到后从大到小的顺序选取所述数量的影响因子作为目标因子集合。
可选地,所述利用预设的数量统计算法对所述类别预测值进行计算得到待选取的影响因子的数量,包括:
利用如下数量统计算法对所述类别预测值进行计算得到待选取的影响因子的数量:
w=ceil(m×sk)
其中,ceil为取整数运算,w为所述待选取数量,m为-预设多个影响因子的数量,sk为标准图像为目标类别k的类别预测值。
可选地,所述计算所述目标因子集合中每个影响因子的标签值,包括:
利用如下标签值算法计算所述目标因子集合中每个影响因子的标签值:
其中,Ai为所述目标因子的标签值,i为所述目标因子的标签,qi为预设标准标签。
可选地,所述将所述标准图像输入至预先构建的分类模型中得到所述标准图像为目标类别的类别预测值之后,所述方法还包括:
计算所述类别预测值与所述目标类别之间的损失值;
根据所述损失值对所述分类模型的参数进行更新;
通过更新后的分类模型的主任务网络计算标准图像为目标类别的类别预测值。
可选地,所述选取所述标签值为预设标签阈值的目标因子为标准影响因子之后,所述方法还包括:
获取推送队列任务,其中,所述推送队列任务中包括预先设定的推送顺序;
按照所述推送顺序向用户推送所述标准影响因子。
为了解决上述问题,本发明还提供一种目标物的影响因子筛选装置,所述装置包括:
类别预测模块,用于获取标准图像,将所述标准图像输入至预先构建的分类模型中得到所述标准图像为目标类别的类别预测值;
数量计算模块,用于利用预设的数量统计算法对所述类别预测值进行计算得到待选取的影响因子的数量;
目标因子筛选模块,用于利用所述分类模型对预设的多个影响因子进行计算得到各个影响因子的影响预测值,并根据所述影响预测值从所述预设的多个影响因子中选取所述数量的影响因子作为目标因子集合;
标准影响因子选取模块,用于计算所述目标因子集合中每个影响因子的标签值,并从所述目标因子集合中选取标签值为预设标签阈值的影响因子作为标准影响因子。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的目标物的影响因子筛选方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,包括存储数据区和存储程序区,其中,所述存储数据区存储创建的数据,所述存储程序区存储有计算机程序;其中,所述计算机程序被处理器执行时实现如上所述的目标物的影响因子筛选方法。
本发明实施例通过分类模型的主任务网络计算标准图像为目标类别的类别预测值,根据类别预测值和数量统计算法计算预设多个影响因子的待选取数量,从而确定输入数据中对分类模型输出有影响的影响因素的数量;利用分类模型的多个子任务网络分别计算预设多个影响因子的影响预测值,根据影响预测值选取待选取数量的预设多个影响因子为目标因子集合,利用影响预测值筛选预设多个影响因子,可提高选取出的影响因子的准确率,计算目标因子集合中各目标因子的标签值,选取标签值为预设标签阈值的目标因子为标准影响因子,实现了获取分类模型的影响因素的目的。因此本发明提出的目标物的影响因子筛选方法、装置及计算机可读存储介质,可以获取深度学习模型的输入数据中的影响因素。
附图说明
图1为本发明一实施例提供的目标物的影响因子筛选方法的流程示意图;
图2为本发明一实施例提供的目标物的影响因子筛选装置的模块示意图;
图3为本发明一实施例提供的实现目标物的影响因子筛选方法的电子设备的内部结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供的目标物的影响因子筛选方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述目标物的影响因子筛选方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。
本发明提供一种目标物的影响因子筛选方法。参照图1所示,为本发明一实施例提供的目标物的影响因子筛选方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,目标物的影响因子筛选方法包括:
S1、获取标准图像,将所述标准图像输入至预先构建的分类模型中得到所述标准图像为目标类别的类别预测值。
本发明实施例中,所述标准图像为带有目标物及目标物标签的图像。例如,带有水果(如苹果)的图像,目标物为水果(苹果)目标物标签为水果的名称(如苹果)。
本发明实施例中,可利用具有数据抓取功能的python语句从用于存储标准图像的区块链节点中获取标准图像。由于区块链对数据的高吞吐性,将标准图像存储于区块链中,进而从区块链中获取标准图像,可提高获取标准图像的效率。
本发明实施例中,所述预先构建的分类模型为具有图像分类功能的卷积神经网络,所述卷积神经网络包括卷积层、池化层和全连接层。
卷积层,用于对图像进行卷积处理,对于图片中的每一个特征首先局部感知,然后更高层次对局部进行综合操作,从而得到全局信息;
池化层,对卷积后的图像进行池化处理,用于特征降维,有利于减小数据和参数的数量,以及提高模型的容错性;
全连接层,用于线性分类,具体用于在提取的高层特征向量上进行线性组合并且输出最后的图像分类结果。
较佳地,本发明实施例中,所述分类模型中包含一个主任务网络与多个子任务网络。其中,所述主任务网络用于计算所述标准图像为目标类别的类别预测值;子任务网络用于计算分类模型的影响因子的影响预测值。
本发明实施例中,所述分类模型为卷积神经网络,所述将所述标准图像输入至预先构建的分类模型中得到所述标准图像为目标类别的类别预测值,包括:
利用所述卷积神经网络的主任务网络对所述标准图像进行卷积,得到卷积图像;
对所述卷积图像进行池化,得到特征图像;
对所述特征图像进行全连接处理,得到全连接图像;
利用激活函数计算所述全连接图像为目标类别的类别预测值。
详细地,所述利用所述分类模型的主任务网络对所述标准图像进行卷积包括利用预设的卷积核矩阵对所述标准图像中的像素值进行乘积。所述激活函数包括但不限于softmax激活函数、sigmoid激活函数。
进一步地,所述将所述标准图像输入至预先构建的分类模型中得到所述标准图像为目标类别的类别预测值之后,所述方法还包括:
计算所述类别预测值与所述目标类别之间的损失值;
根据所述损失值对所述分类模型的参数进行更新;
通过更新后的分类模型的主任务网络计算标准图像为目标类别的类别预测值。
详细地,本发明实施例中,利用损失函数计算所述类别预测值与所述目标类别之间的损失值,所述损失函数包括交叉熵损失函数、均方差损失函数等。
本发明实施例利用Adam优化算法根据所述损失值对所述分类模型的参数进行更新,Adam优化算法可自适应调节分类模型训练过程中的学习率,使得分类检测模型更加精确,进而提高影响因子的精确度。
S2、利用预设的数量统计算法对所述类别预测值进行计算得到待选取的影响因子的数量。
本发明实施例中,所述预设多个影响因子为多个可能对分类模型的分类结果具有影响的影响因子。例如,分类模型对含有水果的图像进行分类时,图像中水果的形状,颜色,尺寸等影响因子均可能对分类模型的分类结果产生影响。
所述利用预设的数量统计算法对所述类别预测值进行计算得到待选取的影响因子的数量,包括:
利用如下数量统计算法对所述类别预测值进行计算得到待选取的影响因子的数量:
w=ceil(m×sk)
其中,ceil为取整数运算,w为所述待选取数量,m为-预设多个影响因子的数量,sk为标准图像为目标类别k的类别预测值。
本发明实施例利用数量统计算法计算从预设多个影响因子中进行影响因子选取的待选取数量,进而确定预设多个影响因子中能够对分类模型的分类结果产生影响的影响因子的数量,避免后续筛选出多余的无法对分类模型的分类结果产生影响的影响因子。
S3、利用所述分类模型对预设的多个影响因子进行计算得到各个影响因子的影响预测值,并根据所述影响预测值从所述预设的多个影响因子中选取所述数量的影响因子作为目标因子集合。
本发明实施例中,所述利用所述分类模型对预设的多个影响因子进行计算得到各个影响因子的影响预测值,包括:
利用所述分类模型的多个子任务网络对所述预设的多个影响因子进行卷积,得到卷积因子;
对所述卷积因子进行池化,得到特征因子;
对所述特征因子进行全连接处理,得到全连接因子;
计算得到所述全连接因子的影响预测值。
详细地,所述分类模型中包含多个子任务网络,每个子任务网络用于计算主任务网络输出的分类结果中不同类别预测值相应的影响因子的影响预测值。
例如,分类模型中包括第一子任务网络和第二子任务网络,分类模型的主任务网络输出的分类结果中包括梨子和苹果,第一子任务网络用于计算主任务网络输出的分类结果是梨子的影响因子的影响预测值,第二子任务网络用于计算主任务网络输出的分类结果是苹果的影响因子的影响预测值。
例如,分类模型的主任务网络输出的分类结果是梨子的预设多个影响因子包括:影响因子A、影响因子B和影响因子C。第一子任务网络用于分别计算影响因子A的影响预测值、影响因子B的影响预测值、影响因子C的影响预测值。
本发明实施例中,所述根据所述影响预测值从所述预设的多个影响因子中选取所述数量的影响因子作为目标因子集合,包括:
将所述多个影响因子按照所述影响预测值从大到小的顺序进行排序,得到影响因子序列;
从所述影响因子序列中按照从前到后从大到小的顺序选取所述数量的影响因子作为目标因子集合。
例如,待选取的影响因子的数量为2;预设多个影响因子中包括影响因子A、影响因子B、影响因子C;其中,影响因子A的影响预测值为50,影响因子B的影响预测值为30,影响因子C的影响预测值为90;则将预设多个影响因子按照影响预测值从大到小的顺序排列为:影响因子C、影响因子A和影响因子B;选取影响因子C、影响因子A为目标因子集合。
本发明实施例根据预设多个影响因子的影响预测值选取待选取数量的多个影响因子为目标因子集合,去除了预设多个影响因子中影响预测值较低的影响因子,提高了影响因子选取的准确性。
S4、计算所述目标因子集合中每个影响因子的标签值,并从所述目标因子集合中选取标签值为预设标签阈值的影响因子作为标准影响因子。
本发明实施例中,所述计算所述目标因子集合中每个影响因子的标签值,包括:
利用如下标签值算法计算所述目标因子集合中每个影响因子的标签值:
其中,Ai为所述目标因子的标签值,i为所述目标因子的标签,qi为预设标准标签。
由于目标因子集合中各目标因子均可能对分类模型的分类结果产生影响,因此,本发明实施例计算所述目标因子集合中各目标因子的标签值,选取所述标签值为预设标签阈值的目标因子为标准影响因子。
较佳地,所述预设标签阈值为1。
例如,目标因子集合中包括影响因子A与影响因子C,其中,影响因子A的标签为颜色,影响因子C的标签为尺寸;影响因子A的标签值为1,影响因子C的标签值为0,预设标签阈值为1。因此,根据标签值选取选取影响因子A为标准影响因子。
进一步地,所述选取所述标签值为预设标签阈值的目标因子为标准影响因子之后,所述方法还包括:
获取推送队列任务,其中,所述推送队列任务中包括预先设定的推送顺序;
按照所述推送顺序向用户推送所述标准影响因子。
详细地,所述推送队列任务可由用户上传。
详细地,所述推送队列任务可由用户上传,根据所述推送顺序向用户推送所述标准影响因子包括将标准影响因子按照推送顺序以可视化图表的形式推送给用户。
本发明实施例通过分类模型的主任务网络计算标准图像为目标类别的类别预测值,根据类别预测值和数量统计算法计算预设多个影响因子的待选取数量,从而确定输入数据中对分类模型输出有影响的影响因素的数量;利用分类模型的多个子任务网络分别计算预设多个影响因子的影响预测值,根据影响预测值选取待选取数量的预设多个影响因子为目标因子集合,利用影响预测值筛选预设多个影响因子,可提高选取出的影响因子的准确率,计算目标因子集合中各目标因子的标签值,选取标签值为预设标签阈值的目标因子为标准影响因子,实现了获取分类模型的影响因素的目的。因此本发明提出的目标物的影响因子筛选方法,可以获取深度学习模型的输入数据中的影响因素。
如图2所示,是本发明目标物的影响因子筛选装置的模块示意图。
本发明所述目标物的影响因子筛选装置100可以安装于电子设备中。根据实现的功能,所述目标物的影响因子筛选装置可以包括类别预测模块101、数量计算模块102、目标因子筛选模块103和标准影响因子选取模块104。本发所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述类别预测模块101,用于获取标准图像,将所述标准图像输入至预先构建的分类模型中得到所述标准图像为目标类别的类别预测值;
所述数量计算模块102,用于利用预设的数量统计算法对所述类别预测值进行计算得到待选取的影响因子的数量;
所述目标因子筛选模块103,用于利用所述分类模型对预设的多个影响因子进行计算得到各个影响因子的影响预测值,并根据所述影响预测值从所述预设的多个影响因子中选取所述数量的影响因子作为目标因子集合;
所述标准影响因子选取模块104,用于计算所述目标因子集合中每个影响因子的标签值,并从所述目标因子集合中选取标签值为预设标签阈值的影响因子作为标准影响因子。
详细地,所述目标物的影响因子筛选装置各模块的具体实施方式如下:
所述类别预测模块101,用于获取标准图像,将所述标准图像输入至预先构建的分类模型中得到所述标准图像为目标类别的类别预测值。
本发明实施例中,所述标准图像为带有目标物及目标物标签的图像。例如,带有水果(如苹果)的图像,目标物为水果(苹果)目标物标签为水果的名称(如苹果)。
本发明实施例中,可利用具有数据抓取功能的python语句从用于存储标准图像的区块链节点中获取标准图像。由于区块链对数据的高吞吐性,将标准图像存储于区块链中,进而从区块链中获取标准图像,可提高获取标准图像的效率。
本发明实施例中,所述预先构建的分类模型为具有图像分类功能的卷积神经网络,所述卷积神经网络包括卷积层、池化层和全连接层。
卷积层,用于对图像进行卷积处理,对于图片中的每一个特征首先局部感知,然后更高层次对局部进行综合操作,从而得到全局信息;
池化层,对卷积后的图像进行池化处理,用于特征降维,有利于减小数据和参数的数量,以及提高模型的容错性;
全连接层,用于线性分类,具体用于在提取的高层特征向量上进行线性组合并且输出最后的图像分类结果。
较佳地,本发明实施例中,所述分类模型中包含一个主任务网络与多个子任务网络。其中,所述主任务网络用于计算所述标准图像为目标类别的类别预测值;子任务网络用于计算分类模型的影响因子的影响预测值。
本发明实施例中,所述类别预测模块101具体用于:
获取标准图像;
利用所述卷积神经网络的主任务网络对所述标准图像进行卷积,得到卷积图像;
对所述卷积图像进行池化,得到特征图像;
对所述特征图像进行全连接处理,得到全连接图像;
利用激活函数计算所述全连接图像为目标类别的类别预测值。
详细地,所述利用所述分类模型的主任务网络对所述标准图像进行卷积包括利用预设的卷积核矩阵对所述标准图像中的像素值进行乘积。所述激活函数包括但不限于softmax激活函数、sigmoid激活函数。
进一步地,所述目标物的影响因子筛选装置还包括更新模块,所述更新模块具体用于:
计算所述类别预测值与所述目标类别之间的损失值;
根据所述损失值对所述分类模型的参数进行更新;
通过更新后的分类模型的主任务网络计算标准图像为目标类别的类别预测值。
详细地,本发明实施例中,利用损失函数计算所述类别预测值与所述目标类别之间的损失值,所述损失函数包括交叉熵损失函数、均方差损失函数等。
本发明实施例利用Adam优化算法根据所述损失值对所述分类模型的参数进行更新,Adam优化算法可自适应调节分类模型训练过程中的学习率,使得分类检测模型更加精确,进而提高影响因子的精确度。
所述数量计算模块102,用于利用预设的数量统计算法对所述类别预测值进行计算得到待选取的影响因子的数量。
本发明实施例中,所述预设多个影响因子为多个可能对分类模型的分类结果具有影响的影响因子。例如,分类模型对含有水果的图像进行分类时,图像中水果的形状,颜色,尺寸等影响因子均可能对分类模型的分类结果产生影响。
所述数量计算模块102具体用于:
利用如下数量统计算法对所述类别预测值进行计算得到待选取的影响因子的数量:
w=ceil(m×sk)
其中,ceil为取整数运算,w为所述待选取数量,m为-预设多个影响因子的数量,sk为标准图像为目标类别k的类别预测值。
本发明实施例利用数量统计算法计算从预设多个影响因子中进行影响因子选取的待选取数量,进而确定预设多个影响因子中能够对分类模型的分类结果产生影响的影响因子的数量,避免后续筛选出多余的无法对分类模型的分类结果产生影响的影响因子。
所述目标因子筛选模块103,用于利用所述分类模型对预设的多个影响因子进行计算得到各个影响因子的影响预测值,并根据所述影响预测值从所述预设的多个影响因子中选取所述数量的影响因子作为目标因子集合。
本发明实施例中,所述目标因子筛选模块103具体用于:
利用所述分类模型的多个子任务网络对所述预设的多个影响因子进行卷积,得到卷积因子;
对所述卷积因子进行池化,得到特征因子;
对所述特征因子进行全连接处理,得到全连接因子;
计算得到所述全连接因子的影响预测值;
将所述多个影响因子按照所述影响预测值从大到小的顺序进行排序,得到影响因子序列;
从所述影响因子序列中按照从前到后从大到小的顺序选取所述数量的影响因子作为目标因子集合。
详细地,所述分类模型中包含多个子任务网络,每个子任务网络用于计算主任务网络输出的分类结果中不同类别预测值相应的影响因子的影响预测值。
例如,分类模型中包括第一子任务网络和第二子任务网络,分类模型的主任务网络输出的分类结果中包括梨子和苹果,第一子任务网络用于计算主任务网络输出的分类结果是梨子的影响因子的影响预测值,第二子任务网络用于计算主任务网络输出的分类结果是苹果的影响因子的影响预测值。
例如,分类模型的主任务网络输出的分类结果是梨子的预设多个影响因子包括:影响因子A、影响因子B和影响因子C。第一子任务网络用于分别计算影响因子A的影响预测值、影响因子B的影响预测值、影响因子C的影响预测值。
例如,待选取的影响因子的数量为2;预设多个影响因子中包括影响因子A、影响因子B、影响因子C;其中,影响因子A的影响预测值为50,影响因子B的影响预测值为30,影响因子C的影响预测值为90;则将预设多个影响因子按照影响预测值从大到小的顺序排列为:影响因子C、影响因子A和影响因子B;选取影响因子C、影响因子A为目标因子集合。
本发明实施例根据预设多个影响因子的影响预测值选取待选取数量的多个影响因子为目标因子集合,去除了预设多个影响因子中影响预测值较低的影响因子,提高了影响因子选取的准确性。
所述标准影响因子选取模块104,用于计算所述目标因子集合中每个影响因子的标签值,并从所述目标因子集合中选取标签值为预设标签阈值的影响因子作为标准影响因子。
本发明实施例中,所述标准影响因子选取模块104具体用于:
利用如下标签值算法计算所述目标因子集合中每个影响因子的标签值:
其中,Ai为所述目标因子的标签值,i为所述目标因子的标签,qi为预设标准标签。
由于目标因子集合中各目标因子均可能对分类模型的分类结果产生影响,因此,本发明实施例计算所述目标因子集合中各目标因子的标签值,选取所述标签值为预设标签阈值的目标因子为标准影响因子。
较佳地,所述预设标签阈值为1。
例如,目标因子集合中包括影响因子A与影响因子C,其中,影响因子A的标签为颜色,影响因子C的标签为尺寸;影响因子A的标签值为1,影响因子C的标签值为0,预设标签阈值为1。因此,根据标签值选取选取影响因子A为标准影响因子。
进一步地,所述选取所述标签值为预设标签阈值的目标因子为标准影响因子之后,所述方法还包括:
获取推送队列任务,其中,所述推送队列任务中包括预先设定的推送顺序;
按照所述推送顺序向用户推送所述标准影响因子。
详细地,所述推送队列任务可由用户上传。
详细地,所述推送队列任务可由用户上传,根据所述推送顺序向用户推送所述标准影响因子包括将标准影响因子按照推送顺序以可视化图表的形式推送给用户。
本发明实施例通过分类模型的主任务网络计算标准图像为目标类别的类别预测值,根据类别预测值和数量统计算法计算预设多个影响因子的待选取数量,从而确定输入数据中对分类模型输出有影响的影响因素的数量;利用分类模型的多个子任务网络分别计算预设多个影响因子的影响预测值,根据影响预测值选取待选取数量的预设多个影响因子为目标因子集合,利用影响预测值筛选预设多个影响因子,可提高选取出的影响因子的准确率,计算目标因子集合中各目标因子的标签值,选取标签值为预设标签阈值的目标因子为标准影响因子,实现了获取分类模型的影响因素的目的。因此本发明提出的目标物的影响因子筛选装置,可以获取深度学习模型的输入数据中的影响因素。
如图3所示,是本发明实现目标物的影响因子筛选方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如目标物的影响因子筛选程序12。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如目标物的影响因子筛选程序12的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如执行目标物的影响因子筛选程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图3仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的目标物的影响因子筛选程序12是多个计算机程序的组合,在所述处理器10中运行时,可以实现:
获取标准图像,将所述标准图像输入至预先构建的分类模型中得到所述标准图像为目标类别的类别预测值;
利用预设的数量统计算法对所述类别预测值进行计算得到待选取的影响因子的数量;
利用所述分类模型对预设的多个影响因子进行计算得到各个影响因子的影响预测值,并根据所述影响预测值从所述预设的多个影响因子中选取所述数量的影响因子作为目标因子集合;
计算所述目标因子集合中每个影响因子的标签值,并从所述目标因子集合中选取标签值为预设标签阈值的影响因子作为标准影响因子。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
进一步地,所述计算机可用存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图表记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种目标物的影响因子筛选方法,其特征在于,所述方法包括:
获取标准图像,将所述标准图像输入至预先构建的分类模型中得到所述标准图像为目标类别的类别预测值;
利用预设的数量统计算法对所述类别预测值进行计算得到待选取的影响因子的数量;
利用所述分类模型对预设的多个影响因子进行计算得到各个影响因子的影响预测值,并根据所述影响预测值从所述预设的多个影响因子中选取所述数量的影响因子作为目标因子集合;
计算所述目标因子集合中每个影响因子的标签值,并从所述目标因子集合中选取标签值为预设标签阈值的影响因子作为标准影响因子。
2.如权利要求1所述的目标物的影响因子筛选方法,其特征在于,所述分类模型为卷积神经网络,所述将所述标准图像输入至预先构建的分类模型中得到所述标准图像为目标类别的类别预测值,包括:
利用所述卷积神经网络的主任务网络对所述标准图像进行卷积,得到卷积图像;
对所述卷积图像进行池化,得到特征图像;
对所述特征图像进行全连接处理,得到全连接图像;
利用激活函数计算所述全连接图像为目标类别的类别预测值。
3.如权利要求1所述的目标物的影响因子筛选方法,其特征在于,所述根据所述影响预测值从所述预设的多个影响因子中选取所述数量的影响因子作为目标因子集合,包括:
将所述多个影响因子按照所述影响预测值从大到小的顺序进行排序,得到影响因子序列;
从所述影响因子序列中按照从前到后从大到小的顺序选取所述数量的影响因子作为目标因子集合。
4.如权利要求1所述的目标物的影响因子筛选方法,其特征在于,所述利用预设的数量统计算法对所述类别预测值进行计算得到待选取的影响因子的数量,包括:
利用如下数量统计算法对所述类别预测值进行计算得到待选取的影响因子的数量:
w=ceil(m×sk)
其中,ceil为取整数运算,w为所述待选取数量,m为-预设多个影响因子的数量,sk为标准图像为目标类别k的类别预测值。
6.如权利要求1至5中任一项所述的目标物的影响因子筛选方法,其特征在于,所述将所述标准图像输入至预先构建的分类模型中得到所述标准图像为目标类别的类别预测值之后,所述方法还包括:
计算所述类别预测值与所述目标类别之间的损失值;
根据所述损失值对所述分类模型的参数进行更新;
通过更新后的分类模型的主任务网络计算标准图像为目标类别的类别预测值。
7.如权利要求1所述的目标物的影响因子筛选方法,其特征在于,所述选取所述标签值为预设标签阈值的目标因子为标准影响因子之后,所述方法还包括:
获取推送队列任务,其中,所述推送队列任务中包括预先设定的推送顺序;
按照所述推送顺序向用户推送所述标准影响因子。
8.一种目标物的影响因子筛选装置,其特征在于,所述装置包括:
类别预测模块,用于获取标准图像,将所述标准图像输入至预先构建的分类模型中得到所述标准图像为目标类别的类别预测值;
数量计算模块,用于利用预设的数量统计算法对所述类别预测值进行计算得到待选取的影响因子的数量;
目标因子筛选模块,用于利用所述分类模型对预设的多个影响因子进行计算得到各个影响因子的影响预测值,并根据所述影响预测值从所述预设的多个影响因子中选取所述数量的影响因子作为目标因子集合;
标准影响因子选取模块,用于计算所述目标因子集合中每个影响因子的标签值,并从所述目标因子集合中选取标签值为预设标签阈值的影响因子作为标准影响因子。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一项所述的目标物的影响因子筛选方法。
10.一种计算机可读存储介质,包括存储数据区和存储程序区,其特征在于,所述存储数据区存储创建的数据,所述存储程序区存储有计算机程序;其中,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的目标物的影响因子筛选方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011097292.7A CN112101481B (zh) | 2020-10-14 | 2020-10-14 | 目标物的影响因子筛选方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011097292.7A CN112101481B (zh) | 2020-10-14 | 2020-10-14 | 目标物的影响因子筛选方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112101481A true CN112101481A (zh) | 2020-12-18 |
CN112101481B CN112101481B (zh) | 2024-03-19 |
Family
ID=73783359
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011097292.7A Active CN112101481B (zh) | 2020-10-14 | 2020-10-14 | 目标物的影响因子筛选方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112101481B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114819590A (zh) * | 2022-04-20 | 2022-07-29 | 平安科技(深圳)有限公司 | 策略智能推荐方法、装置、设备及存储介质 |
CN116664016A (zh) * | 2023-07-27 | 2023-08-29 | 北京中关村科金技术有限公司 | Esg子议题的筛选方法、装置、电子设备和可读存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180137338A1 (en) * | 2016-11-16 | 2018-05-17 | The Governing Council Of The University Of Toronto | System and method for classifying and segmenting microscopy images with deep multiple instance learning |
CN110147878A (zh) * | 2018-11-28 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置及设备 |
-
2020
- 2020-10-14 CN CN202011097292.7A patent/CN112101481B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180137338A1 (en) * | 2016-11-16 | 2018-05-17 | The Governing Council Of The University Of Toronto | System and method for classifying and segmenting microscopy images with deep multiple instance learning |
CN110147878A (zh) * | 2018-11-28 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置及设备 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114819590A (zh) * | 2022-04-20 | 2022-07-29 | 平安科技(深圳)有限公司 | 策略智能推荐方法、装置、设备及存储介质 |
CN114819590B (zh) * | 2022-04-20 | 2023-07-18 | 平安科技(深圳)有限公司 | 策略智能推荐方法、装置、设备及存储介质 |
CN116664016A (zh) * | 2023-07-27 | 2023-08-29 | 北京中关村科金技术有限公司 | Esg子议题的筛选方法、装置、电子设备和可读存储介质 |
CN116664016B (zh) * | 2023-07-27 | 2023-09-26 | 北京中关村科金技术有限公司 | Esg子议题的筛选方法、装置、电子设备和可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112101481B (zh) | 2024-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112465071A (zh) | 图像多标签分类方法、装置、电子设备及介质 | |
CN111814962A (zh) | 识别模型的参数获取方法、装置、电子设备及存储介质 | |
CN112465060A (zh) | 图像中目标物检测方法、装置、电子设备及可读存储介质 | |
CN112541745A (zh) | 用户行为数据分析方法、装置、电子设备及可读存储介质 | |
CN112380859A (zh) | 舆情信息的推荐方法、装置、电子设备及计算机存储介质 | |
CN113516417A (zh) | 基于智能建模的业务评估方法、装置、电子设备及介质 | |
CN114491047A (zh) | 多标签文本分类方法、装置、电子设备及存储介质 | |
CN113487621A (zh) | 医学图像分级方法、装置、电子设备及可读存储介质 | |
CN111783982A (zh) | 攻击样本的获取方法、装置、设备及介质 | |
CN113298159A (zh) | 目标检测方法、装置、电子设备及存储介质 | |
CN112990374A (zh) | 图像分类方法、装置、电子设备及介质 | |
CN113656690A (zh) | 产品推荐方法、装置、电子设备及可读存储介质 | |
CN112885423A (zh) | 疾病标签检测方法、装置、电子设备及存储介质 | |
CN113157739A (zh) | 跨模态检索方法、装置、电子设备及存储介质 | |
CN112101481B (zh) | 目标物的影响因子筛选方法、装置、设备及存储介质 | |
CN113868529A (zh) | 知识推荐方法、装置、电子设备及可读存储介质 | |
CN113268665A (zh) | 基于随机森林的信息推荐方法、装置、设备及存储介质 | |
CN112579621A (zh) | 数据展示方法、装置、电子设备及计算机存储介质 | |
CN113657385B (zh) | 一种电子计量装置的数据检测方法、装置及电子设备 | |
CN111652282A (zh) | 基于大数据的用户偏好分析方法、装置及电子设备 | |
CN111460293B (zh) | 信息推送方法、装置及计算机可读存储介质 | |
CN113705686B (zh) | 图像分类方法、装置、电子设备及可读存储介质 | |
CN113822379B (zh) | 工艺制程异常分析方法、装置、电子设备及存储介质 | |
CN113706019B (zh) | 基于多维数据的业务能力分析方法、装置、设备及介质 | |
CN112215336B (zh) | 基于用户行为的数据标注方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |