CN115358348B - 一种车辆直通率影响特征确定方法、装置、设备及介质 - Google Patents
一种车辆直通率影响特征确定方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN115358348B CN115358348B CN202211276843.5A CN202211276843A CN115358348B CN 115358348 B CN115358348 B CN 115358348B CN 202211276843 A CN202211276843 A CN 202211276843A CN 115358348 B CN115358348 B CN 115358348B
- Authority
- CN
- China
- Prior art keywords
- vehicle
- shap
- data
- detection
- screening
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 103
- 238000001514 detection method Methods 0.000 claims abstract description 131
- 230000008569 process Effects 0.000 claims abstract description 64
- 238000012549 training Methods 0.000 claims abstract description 56
- 238000013145 classification model Methods 0.000 claims abstract description 55
- 238000010801 machine learning Methods 0.000 claims abstract description 48
- 238000012216 screening Methods 0.000 claims abstract description 40
- 238000007781 pre-processing Methods 0.000 claims abstract description 22
- 238000012545 processing Methods 0.000 claims abstract description 11
- 238000012360 testing method Methods 0.000 claims description 19
- 238000012795 verification Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 9
- 238000012163 sequencing technique Methods 0.000 claims description 8
- 230000015654 memory Effects 0.000 claims description 5
- 238000003860 storage Methods 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 2
- 238000002372 labelling Methods 0.000 claims 2
- 238000004458 analytical method Methods 0.000 abstract description 7
- 238000007405 data analysis Methods 0.000 abstract description 2
- 238000004519 manufacturing process Methods 0.000 description 6
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000003324 Six Sigma (6σ) Methods 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000007257 malfunction Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- Software Systems (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Primary Health Care (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Manufacturing & Machinery (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种车辆直通率影响特征确定方法、训练方法、装置、设备及介质,旨在解决汽车直通率影响因素分析过程中,车辆首次下线检测未通过,但重启检测通过的原因分析困难的问题,涉及车辆检测数据分析领域。所述车辆直通率影像特征确定方法,包括以下步骤:对下线检测不通过的车辆检测数据进行预处理;基于所述预处理的数据构建并训练机器学习分类模型;基于所述机器学习分类模型计算所述预处理的数据中特征的SHAP值;对若干SHAP值通过预设的处理方式进行筛选,基于筛选结果优化车辆的检测过程。
Description
技术领域
本申请涉及车辆检测数据分析领域,尤其涉及一种车辆直通率影响特征确定方法、装置、设备及介质。
背景技术
车辆下线一次性合格率(即直通率)是车辆智能生产中最重要的评价指标,在实际车辆检测过程中,一些在首次检测中判定为不合格的产品,在重启检测过程中未发现任何问题,重新检测也可以正常通过,严重影响了车辆直通率。仅靠传统统计方法及专家经验难以找到导致这种情况的根本原因。
发明内容
本申请的主要目的是提供一种车辆直通率影响特征确定方法、装置、设备及介质,旨在解决汽车直通率影响因素分析过程中,车辆首次下线检测未通过,但重启检测通过的原因分析困难的问题。
为解决上述问题,本申请实施例提出了:一种车辆直通率影响特征确定方法,包括以下步骤:
对下线检测不通过的车辆检测数据进行预处理;
基于所述预处理的数据构建并训练机器学习分类模型;
基于所述机器学习分类模型计算所述预处理的数据中特征的SHAP值;
对若干SHAP值通过预设的处理方式进行筛选,基于筛选结果优化车辆的检测过程。
作为本申请的一种可选实施方式,所述预处理过程包括标记所述车辆检测数据。
在具体应用中,通过标记车辆检测数据用于机器学习分类模型的训练。
作为本申请的一种可选实施方式,所述机器学习分类模型训练过程包括:将所述车辆检测数据集划分为训练数据集和验证数据集,所述训练数据集用于训练所述机器学习分类模型,所述验证数据集用于验证所述机器学习分类模型是否达到可用标准。
在具体应用中,通过训练所述机器学习分类模型,在机器学习分类模型投入应用之前,需要对其进行训练,通过训练调整模型参数,训练后的模型针对发明中的应用场景数据更加适用。
作为本申请的一种可选实施方式,所述SHAP值筛选过程包括:将所述筛选后的SHAP值排序,根据所述排序结果筛选符合条件的SHAP值,其对应的特征为可用于优化车辆检测过程的特征。
在具体应用中,通过对SHAP值的筛选确认检测特征对车辆质量的影响排序。
作为本申请的一种可选实施方式,所述的标记所述车辆检测数据过程为:将所述下线检测不通过但重启测试通过的车辆检测数据定义为正样本,将所述下线检测不通过且重启测试仍未通过的数据定义为负样本。
在具体应用中,要将所述车辆检测数据用于机器学习分类模型的训练,需要将所述车辆检测数据按照需要标记为对应类型,在本方式中标记为正样本和副样本。
作为本申请的一种可选实施方式,所述预处理过程包括对所述车辆检测数据进行one-hot编码。
在具体应用中,由于车辆检测数据中,每个特征的参数均为离散数据,数据本身并没有大小含义(例:如测试区域编号:1,2,3等),因此需要对车辆检测数据进行one-hot编码。
作为本申请的一种可选实施方式,所述筛选后的SHAP值排序方式为降序排列。
在具体应用中,影响车辆质量的检测特征是根据SHAP值确定的,要确定最容易影响车辆质量的检测特征,需要从SHAP值中定位影响较大的部分特征,将SHAP值降序排序后,根据其排序顺序可以判定影响的大小。
作为本申请的一种可选实施方式,筛选符合条件的SHAP值过程为:筛选所述排序结果中SHAP值为正且均值排序Top-K的特征及SHAP值为负且均值排序Last-K的特征。
在具体应用中,SHAP值为正且均值排序Top-k的特征,即为最容易导致正样本出现的重要特征。而SHAP值为负且均值排序Last-k的特征,即为最容易导致汽车出现故障的重要特征。
作为本申请中的一种可选实施方式,所述的SHAP值为正且均值排序Top-K的特征为最容易产生正样本数据的特征,所述SHAP值为负且均值排序Last-K的特征为最容易导致汽车出故障的特征。
在具体应用中,SHAP值为正且均值排序Top-k的特征,即为最容易导致正样本出现的重要特征,将这部分特征有针对性地忽略,即可直接提升汽车直通率。而SHAP值为负且均值排序Last-k的特征,即为最容易导致汽车出现故障的重要特征,对这部分特征的检测流程进行优化与改善,也可以提升汽车检测的直通率。
为解决上述技术问题,本申请实施例还提出了:一种车辆直通率影响特征确定模型训练方法包括步骤:对下线检测不通过的车辆检测数据进行预处理;构建机器学习分类模型;基于所述预处理的数据训练机器学习分类模型。
在具体应用中,通过训练所述机器学习分类模型,在机器学习分类模型投入应用之前,需要对其进行训练,通过训练调整模型参数,训练后的模型针对发明中的应用场景数据更加适用。
作为本申请的一种可选实施方式,所述机器学习分类模型训练过程包括:将所述车辆检测数据集划分为训练数据集和验证数据集,所述训练数据集用于训练所述机器学习分类模型,所述验证数据集用于验证所述机器学习分类模型是否达到可用标准。
为解决上述技术问题,本申请实施例还提出了:一种车辆直通率影响特征确定装置,包括:
数据预处理模块,用于对下线检测不通过的车辆检测数据进行预处理;
模型训练模块,用于基于所述预处理的数据构建并训练机器学习分类模型;
检测过程优化模块,用于基于所述机器学习分类模型计算所述预处理的数据中特征的SHAP值,对若干SHAP值通过预设的处理方式进行筛选,基于筛选结果优化车辆的检测过程。
在具体应用中,其效果与本申请提出的一种车辆直通率影响特征确定方法效果相同。
作为本申请的一种可选实施方式,所述预处理过程包括标记所述车辆检测数据。
在具体应用中,通过标记车辆检测数据用于机器学习分类模型的训练。
作为本申请的一种可选实施方式,所述机器学习分类模型训练过程包括:将所述车辆检测数据集划分为训练数据集和验证数据集,所述训练数据集用于训练所述机器学习分类模型,所述验证数据集用于验证所述机器学习分类模型是否达到可用标准。
在具体应用中,通过训练所述机器学习分类模型,在机器学习分类模型投入应用之前,需要对其进行训练,通过训练调整模型参数,训练后的模型针对发明中的应用场景数据更加适用。
作为本申请的一种可选实施方式,所述SHAP值筛选过程包括:将所述筛选后的SHAP值排序,根据所述排序结果筛选符合条件的SHAP值,其对应的特征为可用于优化车辆检测过程的特征。
在具体应用中,通过对SHAP值的筛选确认检测特征对车辆质量的影响排序。
作为本申请的一种可选实施方式,所述的标记所述车辆检测数据过程为:将所述下线检测不通过但重启测试通过的车辆检测数据定义为正样本,将所述下线检测不通过且重启测试仍未通过的数据定义为负样本。
在具体应用中,要将所述车辆检测数据用于机器学习分类模型的训练,需要将所述车辆检测数据按照需要标记为对应类型,在本方式中标记为正样本和副样本。
作为本申请的一种可选实施方式,所述预处理过程包括对所述车辆检测数据进行one-hot编码。
在具体应用中,由于车辆检测数据中,每个特征的参数均为离散数据,数据本身并没有大小含义(例:如测试区域编号:1,2,3等),因此需要对车辆检测数据进行one-hot编码。
作为本申请的一种可选实施方式,所述筛选后的SHAP值排序方式为降序排列。
在具体应用中,影响车辆质量的检测特征是根据SHAP值确定的,要确定最容易影响车辆质量的检测特征,需要从SHAP值中定位影响较大的部分特征,将SHAP值降序排序后,根据其排序顺序可以判定影响的大小。
作为本申请的一种可选实施方式,筛选符合条件的SHAP值过程为:筛选所述排序结果中SHAP值为正且均值排序Top-K的特征及SHAP值为负且均值排序Last-K的特征。
在具体应用中,SHAP值为正且均值排序Top-k的特征,即为最容易导致正样本出现的重要特征。而SHAP值为负且均值排序Last-k的特征,即为最容易导致汽车出现故障的重要特征。
作为本申请中的一种可选实施方式,所述的SHAP值为正且均值排序Top-K的特征为最容易产生正样本数据的特征,所述SHAP值为负且均值排序Last-K的特征为最容易导致汽车出故障的特征。
在具体应用中,SHAP值为正且均值排序Top-k的特征,即为最容易导致正样本出现的重要特征,将这部分特征有针对性地忽略,即可直接提升汽车直通率。而SHAP值为负且均值排序Last-k的特征,即为最容易导致汽车出现故障的重要特征,对这部分特征的检测流程进行优化与改善,也可以提升汽车检测的直通率。
为解决上述技术问题,本申请实施例还提出了:一种电子设备,该电子设备包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序,实现如上所述的方法。
在具体应用中,其效果与本申请提出的一种车辆直通率影响特征确定方法效果相同。
为解决上述技术问题,本申请实施例还提出了:一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,处理器执行所述计算机程序,实现如上所述的方法。
在具体应用中,其效果与本申请提出的一种车辆直通率影响特征确定方法效果相同。
与现有技术相比,本申请实施所述车辆直通率影响特征确定方法,包括步骤:对下线检测不通过的车辆检测数据进行预处理;基于所述预处理的数据构建并训练机器学习分类模型;基于所述机器学习分类模型计算所述预处理的数据中特征的SHAP值;对若干SHAP值通过预设的处理方式进行筛选,基于筛选结果优化车辆的检测过程。所述预处理过程包括标记所述车辆检测数据。所述机器学习分类模型训练过程包括:将所述车辆检测数据集划分为训练数据集和验证数据集,所述训练数据集用于训练所述机器学习分类模型,所述验证数据集用于验证所述机器学习分类模型是否达到可用标准。所述SHAP值进行筛选过程包括:将所述筛选后的SHAP值排序,根据所述排序结果筛选符合条件的SHAP值,其对应的特征为可用于优化车辆检测过程的特征。可以看出,本申请实施例基于车辆下线前的测试数据进行建模,以各个流程的测试数据为特征,测试通过与否的状态参数为标签,通过机器学习分类算法建立分类模型,使用基于SHAP值的改进方案对模型进行分析,最终得到车辆下线前检测直通率影响因素的分析结果。通过算法模型分析车辆检测过程中,系统首次检测不通过但人工检测或重新检测能够通过的主要影响因素,辅助优化检测流程,最终达到提升车辆检测直通率的目的。
附图说明
图1是本申请的实施例车辆直通率影响特征确定方法步骤示意图。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施所述车辆直通率影响特征确定方法,包括步骤:对下线检测不通过的车辆检测数据进行预处理;基于所述预处理的数据构建并训练机器学习分类模型;基于所述机器学习分类模型计算所述预处理的数据中特征的SHAP值;对若干SHAP值通过预设的处理方式进行筛选,基于筛选结果优化车辆的检测过程。所述预处理过程包括标记所述车辆检测数据。所述机器学习分类模型训练过程包括:将所述车辆检测数据集划分为训练数据集和验证数据集,所述训练数据集用于训练所述机器学习分类模型,所述验证数据集用于验证所述机器学习分类模型是否达到可用标准。所述SHAP值进行筛选过程包括:将所述筛选后的SHAP值排序,根据所述排序结果筛选符合条件的SHAP值,其对应的特征为可用于优化车辆检测过程的特征。
由于现有技术中,处理流程过度依赖业务专家的人工经验,同时参数剔除过程受阈值设置影响较大。此外参数剔除处理流程比较繁琐。例如,申请公布号为:CN111159645A的专利。针对实时运行的汽车生产线故障信息进行诊断,并给出相应的处理方案,但未对产生故障的原因进行分析,无法直接改善汽车生产流程,从而无法直接提升直通率。例如,申请公布号为:CN202210148272的专利。方法为手机生产线测试流程的管理方法,是一种手机故障的检测方法,该方法用于发现手机生产的不良产品,并不能分析找到造成手机故障的根本原因,也无法通过历史数据分析测试系统存在什么问题,也就无法有针对性的提升手机直通率。例如,申请公布号为CN201310268793的专利。某生产线的异常结果改进方法,只是简单的将连续异常次数过多的设备进行了替换,并没有深层次的分析异常的原因。例如,申请公布号为202110961318 .6的专利。主要运用基于精益六西格玛的 DMAIC 流程改进方法对F公司A产品在SMT工段存在的直通率低的问题进行分析优化,所用分析方法严重依赖行业专家的专业知识,且很难分析导致生产直通率低的根本原因。(基于精益六西格玛的A产品直通率改进研究[D],熊传斌)。因此,本方法基于车辆下线前的测试数据进行建模,以各个流程的测试数据为特征,测试通过与否的状态参数为标签,通过机器学习分类算法建立分类模型,使用基于SHAP值的改进方案对模型进行分析,最终得到车辆下线前检测直通率影响因素的分析结果。通过算法模型分析车辆检测过程中,系统首次检测不通过但人工检测或重新检测能够通过的主要影响因素,辅助优化检测流程,最终达到提升车辆检测直通率的目的。
本申请实施所述车辆直通率影响特征确定方法,包括步骤:
对下线检测不通过的车辆检测数据进行预处理;
基于所述预处理的数据构建并训练机器学习分类模型;
基于所述机器学习分类模型计算所述预处理的数据中特征的SHAP值;
对若干SHAP值通过预设的处理方式进行筛选,基于筛选结果优化车辆的检测过程。
具体实施方式参照图1,如图1所示,
S01:对下线检测不通过的车辆检测数据进行预处理;
将车辆检测数据中下线检测未通过的样本中重启检测通过的样本标注为1(即未经修理,重启即可通过的汽车样本为正样本,定义为resetOK),其余样本标注为0(即汽车质量有问题的样本为负样本,定义为realNOK)。
由于车辆检测数据中,每个特征的参数均为离散数据,数据本身并没有大小含义(例:如测试区域编号:1,2,3等),因此需要对标记过的数据进行one-hot编码,定义处理后的数据为车辆检测数据集。
S02:基于所述预处理的数据构建并训练机器学习分类模型;
将车辆检测数据集按照8:2的比例分为训练集与验证集;使用XGBoost(或其他机器学习分类模型)技术,利用训练集对模型进行训练,获取分类模型;使用验证集对算法模型进行评价,调整训练参数,根据训练结果,即正样本的召回率、准确率等指标计算F1-score,使用控制变量法,依次调整训练参数,直到获取一个最高的F1-score值,则训练结束,保存模型。F1-score定义如下:
表1 检测结果混淆矩阵
负样本 | 正样本 | |
识别为负样本 | True Negatives(TN) | False Negatives(FN) |
识别为正样本 | False Positives(FP) | True Positives(TP) |
S03:基于所述机器学习分类模型计算所述预处理的数据中特征的SHAP值;
对车辆检测数据集中的每个样本,计算每个特征的SHAP值。
车辆检测数据集中,任意样本(每个样本为一辆车辆的检测过程中所有项目的检测结果值)的第j个特征的SHAP值按如下公式计算:
其中是车辆检测所有流程的特征集合,p为所有特征的种类,表示不包括/>的所有特征的集合,S为所有特征的任意一个子集,为训练后的XGBoost模型对/>的预测值,/>为训练后的XGBoost模型对S的预测值。
S04:对若干SHAP值通过预设的处理方式进行筛选,基于筛选结果优化车辆的检测过程。
车辆检测数据集为one-hot编码后的数据,该编码数据中值为1表示特征参数出现,值为0表示特征参数没有出现。本发明分析的是哪些特征影响了车辆的直通率,因此只有对出现的特征,即特征值为1的值进行分析才更具备说服力,而特征值为0表示该特征在车辆检修过程中并未出现,因此这部分特征值计算得到的SHAP值对车辆检测不通过因素分析并无实际意义,将这部分SHAP值删除,只保留使用特征值为1的特征参数计算得到的SHAP值。
由于部分特征在车辆检测中出现频次太少,缺少统计意义,因此本发明设定阈值N,特征出现少于N次的,将其删除,根据实际经验,建议N取为100。
对所有特征的SHAP值取均值并按降序进行排序,SHAP值为正且均值排序Top-k的特征,即为最容易导致resetOK出现的重要特征,将这部分特征有针对性地忽略,即可直接提升汽车直通率。而SHAP值为负且均值排序Last-k的特征,即为最容易导致汽车出现故障的重要特征,对这部分特征的检测流程进行优化与改善,也可以提升汽车检测的直通率。
此外,在一种实施例中,本申请的实施例还提供一种计算机程序产品,所述计算机程序产品在被处理器时,实现前述的方法。
此外,在一种实施例中,本申请的实施例还提供一种计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器运行时实现前述实施例中方法的步骤。
在一些实施例中,计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。计算机可以是包括智能终端和服务器在内的各种计算设备。
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(HTML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,可执行指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述 实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通 过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的 技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体 现出来,该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器、磁碟、光 盘)中,包括若干指令用以使得一台多媒体终端设备(可以是手机,计算机,电视接收机,或者网络设备等)执行本申请各个实施例所述的方法。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (12)
1.一种车辆直通率影响特征确定方法,包括以下步骤:
对下线检测不通过的车辆检测数据进行预处理;
基于所述预处理的数据构建并训练机器学习分类模型;
基于所述机器学习分类模型计算所述预处理的数据中特征的SHAP值;
对若干SHAP值通过预设的处理方式进行筛选,基于筛选结果优化车辆的检测过程;
其中,SHAP值进行筛选过程包括:将所述筛选后的SHAP值排序,根据所述排序结果筛选符合条件的SHAP值,其对应的特征为可用于优化车辆检测过程的特征;所述筛选后的SHAP值排序方式为降序排列;
其中,筛选符合条件的SHAP值过程为:筛选所述排序结果中SHAP值为正且均值排序Top-K的特征及SHAP值为负且均值排序Last-K的特征;所述的SHAP值为正且均值排序Top-K的特征为最容易产生正样本数据的特征,所述SHAP值为负且均值排序Last-K的特征为最容易导致汽车出故障的特征。
2.如权利要求1所述的车辆直通率影响特征确定方法,其特征在于,所述预处理过程包括标记所述车辆检测数据。
3.如权利要求1所述的车辆直通率影响特征确定方法,其特征在于,所述机器学习分类模型训练过程包括:
将所述车辆检测数据集划分为训练数据集和验证数据集,所述训练数据集用于训练所述机器学习分类模型,所述验证数据集用于验证所述机器学习分类模型是否达到可用标准。
4.如权利要求2所述的车辆直通率影响特征确定方法,其特征在于:
标记所述车辆检测数据过程为:将所述下线检测不通过但重启测试通过的车辆检测数据定义为正样本,将所述下线检测不通过且重启测试仍未通过的数据定义为负样本。
5.如权利要求2所述的车辆直通率影响特征确定方法,其特征在于,所述预处理过程包括对所述车辆检测数据进行one-hot编码。
6.一种车辆直通率影响特征确定装置,其特征在于,包括:
数据预处理模块,用于对下线检测不通过的车辆检测数据进行预处理;
模型训练模块,用于基于所述预处理的数据构建并训练机器学习分类模型;
检测过程优化模块,用于基于所述机器学习分类模型计算所述预处理的数据中特征的SHAP值,对若干SHAP值通过预设的处理方式进行筛选,基于筛选结果优化车辆的检测过程;
其中,所述SHAP值进行筛选过程包括:将所述筛选后的SHAP值排序,根据所述排序结果筛选符合条件的SHAP值,其对应的特征为可用于优化车辆检测过程的特征;所述筛选后的SHAP值排序方式为降序排列;
其中,筛选符合条件的SHAP值过程为:筛选所述排序结果中SHAP值为正且均值排序Top-K的特征及SHAP值为负且均值排序Last-K的特征;所述的SHAP值为正且均值排序Top-K的特征为最容易产生正样本数据的特征,所述SHAP值为负且均值排序Last-K的特征为最容易导致汽车出故障的特征。
7.如权利要求6所述的车辆直通率影响特征确定装置,其特征在于,所述预处理过程包括标记所述车辆检测数据。
8.如权利要求6所述的车辆直通率影响特征确定装置,其特征在于,所述机器学习分类模型训练过程包括:
将所述车辆检测数据集划分为训练数据集和验证数据集,所述训练数据集用于训练所述机器学习分类模型,所述验证数据集用于验证所述机器学习分类模型是否达到可用标准。
9.如权利要求7所述的车辆直通率影响特征确定装置,其特征在于:
标记所述车辆检测数据过程为:将所述下线检测不通过但重启测试通过的车辆检测数据定义为正样本,将所述下线检测不通过且重启测试仍未通过的数据定义为负样本。
10.如权利要求7所述的车辆直通率影响特征确定装置,其特征在于,所述预处理过程包括对所述车辆检测数据进行one-hot编码。
11.一种电子设备,其特征在于,该电子设备包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序,实现如权利要求1-5中任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,处理器执行所述计算机程序,实现如权利要求1-5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211276843.5A CN115358348B (zh) | 2022-10-19 | 2022-10-19 | 一种车辆直通率影响特征确定方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211276843.5A CN115358348B (zh) | 2022-10-19 | 2022-10-19 | 一种车辆直通率影响特征确定方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115358348A CN115358348A (zh) | 2022-11-18 |
CN115358348B true CN115358348B (zh) | 2023-03-24 |
Family
ID=84008439
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211276843.5A Active CN115358348B (zh) | 2022-10-19 | 2022-10-19 | 一种车辆直通率影响特征确定方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115358348B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117745720B (zh) * | 2024-02-19 | 2024-05-07 | 成都数之联科技股份有限公司 | 一种车辆外观检测方法、装置、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113360845A (zh) * | 2021-05-25 | 2021-09-07 | 浙江大搜车软件技术有限公司 | 车源成交概率预测方法、装置、电子装置和存储介质 |
CN114841468A (zh) * | 2022-06-06 | 2022-08-02 | 兰州理工大学 | 一种汽油质量指标预测及致因解析方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20240177536A9 (en) * | 2018-09-30 | 2024-05-30 | Strong Force Tp Portfolio 2022, Llc | Intelligent transportation systems including digital twin interface for a passenger vehicle |
CN111325353A (zh) * | 2020-02-28 | 2020-06-23 | 深圳前海微众银行股份有限公司 | 训练数据集的贡献度计算方法、装置、设备及存储介质 |
CN111476296A (zh) * | 2020-04-07 | 2020-07-31 | 上海优扬新媒信息技术有限公司 | 样本生成方法、分类模型训练方法、识别方法及对应装置 |
CN111523677B (zh) * | 2020-04-17 | 2024-02-09 | 第四范式(北京)技术有限公司 | 实现对机器学习模型的预测结果进行解释的方法及装置 |
CN111737067A (zh) * | 2020-05-29 | 2020-10-02 | 苏州浪潮智能科技有限公司 | 一种硬盘故障预测模型解释方法及装置 |
US20220044133A1 (en) * | 2020-08-07 | 2022-02-10 | Sap Se | Detection of anomalous data using machine learning |
CN113469241B (zh) * | 2021-06-29 | 2023-05-26 | 中国航空规划设计研究总院有限公司 | 基于工艺网络模型与机器学习算法的产品质量控制方法 |
CN114841250A (zh) * | 2022-04-11 | 2022-08-02 | 浙江工业大学 | 基于多维传感数据的工业系统生产异常检测与诊断方法 |
CN114444986B (zh) * | 2022-04-11 | 2022-06-03 | 成都数之联科技股份有限公司 | 产品分析方法及系统及装置及介质 |
-
2022
- 2022-10-19 CN CN202211276843.5A patent/CN115358348B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113360845A (zh) * | 2021-05-25 | 2021-09-07 | 浙江大搜车软件技术有限公司 | 车源成交概率预测方法、装置、电子装置和存储介质 |
CN114841468A (zh) * | 2022-06-06 | 2022-08-02 | 兰州理工大学 | 一种汽油质量指标预测及致因解析方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115358348A (zh) | 2022-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112668172B (zh) | 考虑车型和驾驶风格异质性的跟驰行为建模方法及其模型 | |
CN105577440A (zh) | 一种网络故障时间定位方法和分析设备 | |
CN115358348B (zh) | 一种车辆直通率影响特征确定方法、装置、设备及介质 | |
CN115049019B (zh) | 金属有机框架对砷的吸附性能评估方法、装置及相关设备 | |
CN115907279A (zh) | 基于物联网的工业生产产品用质量检测系统及方法 | |
CN115184193B (zh) | 线缆的自动化测试方法、装置、设备及存储介质 | |
CN111796957A (zh) | 基于应用日志的交易异常根因分析方法及系统 | |
CN112015779A (zh) | 学生偏好预测的方法、系统和装置 | |
CN116187861A (zh) | 基于同位素的水质溯源监测方法及相关装置 | |
CN117540826A (zh) | 机器学习模型的优化方法、装置、电子设备及存储介质 | |
CN110620760A (zh) | 一种SVM和贝叶斯网络的FlexRay总线融合入侵检测方法和检测装置 | |
CN115809622A (zh) | 具有自动优化配置功能的芯片仿真加速系统 | |
CN111488939A (zh) | 模型训练方法、分类方法、装置及设备 | |
CN115795021A (zh) | 一种大数据风险监测识别预警装置及系统 | |
CN117238276B (zh) | 一种基于智能化语音数据识别的分析纠正系统 | |
CN113239989A (zh) | 气体浓度识别方法、系统、电子设备及存储介质 | |
CN110808947B (zh) | 一种自动化的脆弱性量化评估方法及系统 | |
CN118312658A (zh) | 一种大数据处理展示单元控制方法及系统 | |
CN114077663A (zh) | 应用日志的分析方法及装置 | |
CN112434651A (zh) | 一种基于图像识别的信息分析方法、装置及计算机设备 | |
CN112199295A (zh) | 一种基于频谱的深度神经网络缺陷定位方法及系统 | |
CN117474529A (zh) | 一种电网智慧运维系统 | |
CN115222145A (zh) | 基于新能源汽车运行大数据的续驶里程预测方法及系统 | |
CN117349151A (zh) | 一种基于聚类的测试用例优先级排序方法、装置及存储介质 | |
CN115203014A (zh) | 一种基于深度学习的生态服务异常修复系统及修复方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |