Nothing Special   »   [go: up one dir, main page]

CN112907035A - 基于K-means的交通运输主体信用评级方法及装置 - Google Patents

基于K-means的交通运输主体信用评级方法及装置 Download PDF

Info

Publication number
CN112907035A
CN112907035A CN202110114076.7A CN202110114076A CN112907035A CN 112907035 A CN112907035 A CN 112907035A CN 202110114076 A CN202110114076 A CN 202110114076A CN 112907035 A CN112907035 A CN 112907035A
Authority
CN
China
Prior art keywords
credit
indexes
data
values
adopting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110114076.7A
Other languages
English (en)
Other versions
CN112907035B (zh
Inventor
苏敏咸
效鹏
黄栋良
沈益艺
陈明波
张艳
连娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Gnss Development & Application Co ltd
Original Assignee
Xiamen Gnss Development & Application Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Gnss Development & Application Co ltd filed Critical Xiamen Gnss Development & Application Co ltd
Priority to CN202110114076.7A priority Critical patent/CN112907035B/zh
Publication of CN112907035A publication Critical patent/CN112907035A/zh
Application granted granted Critical
Publication of CN112907035B publication Critical patent/CN112907035B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Development Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Evolutionary Biology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于K‑means的交通运输主体信用评级方法及装置,其中,方法包括:获取交通运输主体的原始信用数据并进行预处理,以得到多维度指标;采用因子分析法对多维度指标进行降维处理,以便对多维度指标进行分类并获取每一类对应的因子;采用K‑means聚类算法对降维后的各类因子进行处理,以获取聚类后的最优数据集;根据获得的聚类后的最优数据集分别采用因子分析法、熵值法和critic权重法计算各类指标对应的权重,并采用列求和归一化方法获取各类指标的权重值;获取预先设置的评分分值和对应的评分等级,以及根据各类指标的权重值获取各类指标的信用评分分值,以便根据3sigma原则匹配出各类指标的信用评分分值对应的评分等级,从而大大提高评级效果。

Description

基于K-means的交通运输主体信用评级方法及装置
技术领域
本发明涉及信息处理技术领域,特别涉及一种基于K-means的交通运输主体信用评级方法、一种计算机可读存储介质、一种计算机设备和一种基于K-means的交通运输主体信用评级装置。
背景技术
相关技术中,交通运输主体由于涉及到交通运输领域的方方面面,使得获取的数据资源分散,且难以有效应用,各个相关部门的数据资源无法互联互通,大大影响了需要相关部门协同工作的事项的进度和效率,在进行信用评级时由于获取的原始数据不够真实,且获取的原始数据难以与其相关数据进行关联,从而容易使评级结果产生偏差,导致评级效果差。
发明内容
本发明旨在至少在一定程度上解决上述技术中的技术问题之一。为此,本发明的一个目的在于提出一种基于K-means的交通运输主体信用评级方法,能够实现对交通运输主体信用进行有效评级,从而大大提高评级效果。
本发明的第二个目的在于提出一种计算机可读存储介质。
本发明的第三个目的在于提出一种计算机设备。
本发明的第四个目的在于提出一种基于K-means的交通运输主体信用评级装置。
为达到上述目的,本发明第一方面实施例提出了一种基于K-means的交通运输主体信用评级方法,包括以下步骤:获取交通运输主体的原始信用数据,并对所述原始信用数据进行预处理,以获取交通运输主体的多维度指标;采用因子分析法对所述多维度指标进行降维处理,以便对所述多维度指标进行分类并获取每一类对应的因子;采用K-means聚类算法对所述降维后的各类因子进行处理,以获取聚类后的最优数据集;根据所述获得的聚类后的最优数据集分别采用因子分析法、熵值法和critic权重法计算各类指标对应的权重,并采用列求和归一化方法获取各类指标的权重值;获取预先设置的评分分值和对应的评分等级,以及根据所述各类指标的权重值获取各类指标的信用评分分值,以便根据3sigma原则匹配出所述各类指标的信用评分分值对应的评分等级。
根据本发明实施例的基于K-means的交通运输主体信用评级方法,首先,获取交通运输主体的原始信用数据,并对原始信用数据进行预处理,以获取交通运输主体的多维度指标,接着,采用因子分析法对多维度指标进行降维处理,以便对多维度指标进行分类并获取每一类对应的因子,再接着,采用K-means聚类算法对降维后的各类因子进行处理,以获取聚类后的最优数据集,然后,根据获得的聚类后的最优数据集分别采用因子分析法、熵值法和critic权重法计算各类指标对应的权重,并采用列求和归一化方法获取各类指标的权重值,最后,获取预先设置的评分分值和对应的评分等级,以及根据各类指标的权重值获取各类指标的信用评分分值,以便根据3sigma原则匹配出所述各类指标的信用评分分值对应的评分等级;从而实现对交通运输主体信用进行有效评级,大大提高评级效果。
另外,根据本发明上述实施例提出的基于K-means的交通运输主体信用评级方法还可以具有如下附加的技术特征:
可选地,在采用K-means聚类算法对所述降维后的各类因子进行处理时,以对应维度上的平均值为第一个聚类中心运行K-means聚类算法以获得聚类结果,接下去的每个聚类中心由前一个聚类中心获得的聚类结果及一个随机聚类样本点组成,并根据聚类中心依次运行K-means聚类算法直至得到最优数据集。
可选地,根据以下公式获取各类指标的权重值:
Figure BDA0002919970640000021
Figure BDA0002919970640000022
其中,w11、w21…wm1表示通过因子分析法获取的m个指标对应的权重;w12、w22…wm2表示通过熵值法获取的m个指标对应的权重;w13、w23…wm3表示通过critic权重法获取的m个指标对应的权重;W为各类指标对应的权重构成的矩阵,i=1,2,…,m;j=1,2,3;
Figure BDA0002919970640000023
表示各类指标的权重值。
可选地,采用数据清洗与统计对所述原始信用数据进行预处理,以便剔除所述原始信用数据中的异常数据,并通过各个字段值对剔除异常数据后的原始信用数据进行统计。
为达到上述目的,本发明第二方面实施例提出的一种计算机可读存储介质,其上存储有基于K-means的交通运输主体信用评级程序,该基于K-means的交通运输主体信用评级程序被处理器执行时实现如上述的基于K-means的交通运输主体信用评级方法。
根据本发明实施例的计算机可读存储介质,通过存储基于K-means的交通运输主体信用评级程序,以便处理器在执行该该基于K-means的交通运输主体信用评级程序时实现如上述的基于K-means的交通运输主体信用评级方法,从而实现对交通运输主体信用进行有效评级,大大提高评级效果。
为达到上述目的,本发明第三方面实施例提出的一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如上述的基于K-means的交通运输主体信用评级方法。
根据本发明实施例的计算机设备,通过存储器存储可在处理器上运行的计算机程序,以便处理器在执行该计算机程序时,实现如上述的基于K-means的交通运输主体信用评级方法,从而实现对交通运输主体信用进行有效评级,大大提高评级效果。
为达到上述目的,本发明第四方面实施例提出的一种基于K-means的交通运输主体信用评级装置,包括获取模块,所述获取模块用于获取交通运输主体的原始信用数据,并对所述原始信用数据进行预处理,以获取交通运输主体的多维度指标;第一处理模块,所述第一处理模块用于采用因子分析法对所述多维度指标进行降维处理,以便对所述多维度指标进行分类并获取每一类对应的因子;第二处理模块,所述第二处理模块用于采用K-means聚类算法对所述降维后的各类因子进行处理,以获取聚类后的最优数据集;权重计算模块,所述权重计算模块用于根据所述获得的聚类后的最优数据集分别采用因子分析法、熵值法和critic权重法计算各类指标对应的权重,并采用列求和归一化方法获取各类指标的权重值;信用评级模块,所述信用评级模块用于获取预先设置的评分分值和对应的评分等级,以及根据所述各类指标的权重值获取各类指标的信用评分分值,以便根据3sigma原则匹配出所述各类指标的信用评分分值对应的评分等级。
根据本发明实施例的一种基于K-means的交通运输主体信用评级装置,设置获取模块获取交通运输主体的原始信用数据,并对原始信用数据进行预处理,以获取交通运输主体的多维度指标,第一处理模块采用因子分析法对多维度指标进行降维处理,以便对多维度指标进行分类并获取每一类对应的因子;第二处理模块采用K-means聚类算法对降维后的各类因子进行处理,以获取聚类后的最优数据集;权重计算模块根据获得的聚类后的最优数据集分别采用因子分析法、熵值法和critic权重法计算各类指标对应的权重,并采用列求和归一化方法获取各类指标的权重值;信用评级模块获取预先设置的评分分值和对应的评分等级,以及根据各类指标的权重值获取各类指标的信用评分分值,以便根据3sigma原则匹配出各类指标的信用评分分值对应的评分等级;从而实现对交通运输主体信用进行有效评级,大大提高评级效果。
另外,根据本发明上述实施例提出的基于K-means的交通运输主体信用评级装置还可以具有如下附加的技术特征:
可选地,所述第二处理模块还用于,在采用K-means聚类算法对所述降维后的各类因子进行处理时,以对应维度上的平均值为第一个聚类中心运行K-means聚类算法以获得聚类结果,接下去的每个聚类中心由前一个聚类中心获得的聚类结果及一个随机聚类样本点组成,并根据聚类中心依次运行K-means聚类算法直至得到最优数据集。
可选地,根据以下公式获取各类指标的权重值:
Figure BDA0002919970640000041
Figure BDA0002919970640000042
其中,w11、w21…wm1表示通过因子分析法获取的m个指标对应的权重;w12、w22…wm2表示通过熵值法获取的m个指标对应的权重;w13、w23…wm3表示通过critic权重法获取的m个指标对应的权重;W为各类指标对应的权重构成的矩阵,i=1,2,…,m;j=1,2,3;
Figure BDA0002919970640000043
表示各类指标的权重值。
可选地,所述获取模块还用于采用数据清洗与统计对所述原始信用数据进行预处理,以便剔除所述原始信用数据中的异常数据,并通过各个字段值对剔除异常数据后的原始信用数据进行统计。
附图说明
图1为根据本发明实施例的基于K-means的交通运输主体信用评级方法的流程示意图;
图2为根据本发明实施例的基于K-means的交通运输主体信用评级装置的方框示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
为了更好的理解上述技术方案,下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
请参阅图1,图1为根据本发明实施例的基于K-means的交通运输主体信用评级方法的流程示意图,如图1所示,该基于K-means的交通运输主体信用评级方法包括以下步骤:
步骤101,获取交通运输主体的原始信用数据,并对原始信用数据进行预处理,以获取交通运输主体的多维度指标。
需要说明的是,可在实际需要评级的交通运输主体所在的城市的交通信用信息平台导出原始信用数据。
作为一个实施例,采用数据清洗与统计对原始信用数据进行预处理,以便剔除原始信用数据中的异常数据,并通过各个字段值对剔除异常数据后的原始信用数据进行统计。
也就是说,在采集完原始信用数据后,采用数据清洗与统计对原始信用数据进行预处理,去掉不完整和无效的原始信用数据后,对原始信用数据进行各个字段值统计。
步骤102,采用因子分析法对多维度指标进行降维处理,以便对多维度指标进行分类并获取每一类对应的因子。
需要说明的是,因子分析法可在SPASS软件上实现,并且通过KMO和Bartlett检验结果获取多维度指标之间的相关性。
作为一个具体实施例,因子分析法通过提取的因子(隐变量)能够显式地表达变量与变量之间的关系,具备易于理解现实的优点,其各个观测变量与隐变量之间关系如下公式(1)所示:
xi=ai1z1+ai2z2+…+aimzmi,(i=1,2,…n) 式(1)
其中,n为观测变量的类别数,m为公共因子的类别数,且为了达到降维的目的m<n;xi为第i类观测变量;zm为第m个公共因子数;aim为第i类x对应第m个公共因子的载荷系数,εi为第i类观测误差;且aim构成因子载荷矩阵A,因子载荷矩阵A如下公式(2)所示:
Figure BDA0002919970640000051
其中,Am为n维的列向量。
因子分析法主要是求载荷矩阵A和因子向量Z,根据本发明的要求,基于以下三点合理假设:
(1)m<n,为了满足降维的目的。
(2)误差向量ε的均值为0且与因子向量Z不相关。即cov(Z,ε)=0,其中cov代表协方差,且误差向量的协方差矩阵为对角阵
Figure BDA0002919970640000052
其中,diag代表对角阵,即各个误差变量不相关,但方差不要求相等。
(3)公共因子Z的协方差矩阵为单位矩阵I,即各个公共因子不相关,且方差为1,可以表示为I=E(ZZT)=diag(1,1,…,1)。
将式(1)写成矩阵形式得到公式(3),如下所示:
X=AZ=ε 式(3)
其中,X为n维的观测向量,A为n*m的载荷矩阵,z为因子向量,ε为n维的误差向量。
基于式(3)可推出如下所示的公式(4):
XXT=(AZ+ε)(AZ+ε)T=AZZTAT+εZTAT+AZεT+εεT 式(4)
其中,XT代表X的转置矩阵。
对式(4)两边求数学期望,基于假设(1),可得到如下所示的公式(5):
E[XXT]=AE[ZZT]AT+E[εεT]式(5)其中,E[*]代表期望。
基于假设(3),可得到如下所示的公式(6):
cov(X)=AAT+cov(ε) 式(6)
进而通过式(6)可得出载荷矩阵A为X与ε协方差的一种分解,并计算出载荷矩阵A和公共因子Z,具体如下公式(7)所示:
Z=ATcov(X)-1X 式(7)
其中,cov(X)-1为X协方差矩阵的逆。
步骤103,采用K-means聚类算法对降维后的各类因子进行处理,以获取聚类后的最优数据集。
需要说明的是,K-means聚类算法作为全局K-means算法的局部搜索算法,其算法步骤如下:
(1)选取K个点作为初始质心。(2)将每个点按照距离公式指派到最近的质心,样本数据集被划分为K个簇。(3)重新计算每个簇的质心,通过簇内平均值计算。(4)达到最大迭代数。
由上述可知,原始K-means聚类算法会受到初始点的数量以及位置影响,为了避免选取参数导致的局部最优问题,此处引入全局思想,思路如下:
(1)令K=1,此时的聚类质心点满足式(8),即将对应维度上的平均值作为第一簇的质心。
Figure BDA0002919970640000061
(2)令K=2时,以第一个所得的聚类中心以及样本数据随机选取一个点,组合为第二簇,以此为K=2时的初始样本聚类质心点,运行K-means算法得到结果。
(3)以上述方法以此类推,即K个聚类中心由前K-1个聚类中心时获得的最优结果以及一个随机聚类样本点组成,然后依次为初始聚类中心运行K-means算法N次即可求得最优结果。
步骤104,根据获得的聚类后的最优数据集分别采用因子分析法、熵值法和critic权重法计算各类指标对应的权重,并采用列求和归一化方法获取各类指标的权重值。
作为一个示例,首先,因子分析法与主成分分析法类似均是利用信息浓缩的思想,但因子分析法通过“旋转”,让因子更具备解释意义,因子分析法通过共性因子来表达观测变量,反之,也可以通过观测变量来表达共性因子,如下公式(9),其中xi为观测因子,fp为共性因子,εi为特殊因子,fp和εi均为不可直接观测的随机变量。其矩阵形式可以写为:X=AF+ε,即将m维的x变量压缩至p维。
xi=ai1f1+ai2f2+…+aipfpi,(i=1,2,…m) 式(9)
另外,熵值法是依据数据携带的信息量的大小进行权重计算,熵是一种不确定性的度量,其衡量了信息的混乱程度,信息量越小,不确定性越大,熵值越大,相对应该指标获得的权重也越小,其核心计算流程如式(10)-(13)。其中,z下标代表数据集的索引,一共n条数据集;下标i代表指标索引,一共m个指标,wi为第i项指标的权重。
Figure BDA0002919970640000071
Figure BDA0002919970640000072
gi=1-ei 式(12)
Figure BDA0002919970640000073
其中,Pzi表示第i项指标下第Z个数据集占该指标的比重,ei表示第i项指标的熵值,gi表示信息熵冗余度。
另外,基于指标对比强度和冲突性的critic权重法,在对数据进行归一化处理后,以标准差形式来表现指标的变异性,见式(14)。下标i,j分别代表行索引和列索引,n为行数,即样本的条数;
Figure BDA0002919970640000074
为对应指标的均值,Sj为对应指标的方差。
Figure BDA0002919970640000075
根据式(14),计算指标的信息量,见式(15),其中rij为指标间的相关系数,Cj越大则代表对应指标下的作用越大,权重则越高,则最终权重计算,根据式(16)得出。
Figure BDA0002919970640000076
Figure BDA0002919970640000077
需要说明的是,结合得出的多类权重,如下式(17)所示:
Figure BDA0002919970640000081
其中下标m为指标的索引,考虑不同的客观赋权方法针对相同的指标具有不同的权重,采用列求和归一化方法得到各个指标的权重,见式(18):
Figure BDA0002919970640000082
其中,w11、w21…wm1表示通过因子分析法获取的m个指标对应的权重;w12、w22…wm2表示通过熵值法获取的m个指标对应的权重;w13、w23…wm3表示通过critic权重法获取的m个指标对应的权重;W为各类指标对应的权重构成的矩阵,i=1,2,…,m;j=1,2,3;
Figure BDA0002919970640000083
表示各类指标的权重值。
步骤105,获取预先设置的评分分值和对应的评分等级,以及根据各类指标的权重值获取各类指标的信用评分分值,以便根据3sigma原则匹配出各类指标的信用评分分值对应的评分等级。
作为一个具体实施例,可设置信用评分分值总分950,其中600分为基础分值,350分为加减浮动分值。
信用评分等级按照信用评分从高至低划分为五等,分别用AA、A、B、C、D表示。信用等级的含义如下:
AA——信用评分大于等于800分,表示信用良好;
A——信用评分大于等于700分,且小于800分,表示信用较好;
B——信用评分大于等于600分,且小于700分,表示信用一般;
C——信用评分大于等于500分,且小于600分,表示信用较差;
D——信用评分小于500分,表示信用差。
如下表一所示,信用信息包含中性、正面、一般负面、严重负面、特定严重负面五个类别的信息。在信用报告中,将对应类别的信息分别展示。
表一:
Figure BDA0002919970640000084
Figure BDA0002919970640000091
正态分布中“sigma原则”、“2sigma原则”、“3sigma原则”分别是:
sigma原则:数值分布在(μ-σ,μ+σ)中的概率为0.6526;
2sigma原则:数值分布在(μ-2σ,μ+2σ)中的概率为0.9544;
3sigma原则:数值分布在(μ-3σ,μ+3σ)中的概率为0.9974;
其中在正态分布中σ代表标准差,μ代表均值x=μ即为图像的对称轴。将获取的信用评分值依据正态分布3sigma原则匹配出相应的评级。
综上所述,根据本发明实施例的基于K-means的交通运输主体信用评级方法,首先,获取交通运输主体的原始信用数据,并对原始信用数据进行预处理,以获取交通运输主体的多维度指标,接着,采用因子分析法对多维度指标进行降维处理,以便对多维度指标进行分类并获取每一类对应的因子,再接着,采用K-means聚类算法对降维后的各类因子进行处理,以获取聚类后的最优数据集,然后,根据获得的聚类后的最优数据集分别采用因子分析法、熵值法和critic权重法计算各类指标对应的权重,并采用列求和归一化方法获取各类指标的权重值,最后,获取预先设置的评分分值和对应的评分等级,以及根据各类指标的权重值获取各类指标的信用评分分值,以便根据3sigma原则匹配出所述各类指标的信用评分分值对应的评分等级;从而实现对交通运输主体信用进行有效评级,大大提高评级效果。
为了实现上述实施例,本发明第二方面实施例提出的一种计算机可读存储介质,其上存储有基于K-means的交通运输主体信用评级程序,该基于K-means的交通运输主体信用评级程序被处理器执行时实现如上述的基于K-means的交通运输主体信用评级方法。
根据本发明实施例的计算机可读存储介质,通过存储基于K-means的交通运输主体信用评级程序,以便处理器在执行该该基于K-means的交通运输主体信用评级程序时实现如上述的基于K-means的交通运输主体信用评级方法,从而实现对交通运输主体信用进行有效评级,大大提高评级效果。
为了实现上述实施例,本发明第三方面实施例提出的一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如上述的基于K-means的交通运输主体信用评级方法。
根据本发明实施例的计算机设备,通过存储器存储可在处理器上运行的计算机程序,以便处理器在执行该计算机程序时,实现如上述的基于K-means的交通运输主体信用评级方法,从而实现对交通运输主体信用进行有效评级,大大提高评级效果。
为了实现上述实施例,本发明实施例还提出了一种基于K-means的交通运输主体信用评级装置,如图2所示,该基于K-means的交通运输主体信用评级装置,包括:获取模块10、第一处理模块20、第二处理模块30、权重计算模块40和信用评级模块50。
其中,获取模块10用于获取交通运输主体的原始信用数据,并对原始信用数据进行预处理,以获取交通运输主体的多维度指标;
第一处理模块20用于采用因子分析法对多维度指标进行降维处理,以便对多维度指标进行分类并获取每一类对应的因子;
第二处理模块30用于采用K-means聚类算法对降维后的各类因子进行处理,以获取聚类后的最优数据集;
权重计算模块40用于根据获得的聚类后的最优数据集分别采用因子分析法、熵值法和critic权重法计算各类指标对应的权重,并采用列求和归一化方法获取各类指标的权重值;
信用评级模块50用于获取预先设置的评分分值和对应的评分等级,以及根据各类指标的权重值获取各类指标的信用评分分值,以便根据3sigma原则匹配出各类指标的信用评分分值对应的评分等级。
在一些实施例中,为了提高本发明实施例提出的基于K-means的交通运输主体信用评级装置对于交通运输主体信用的评级效果,第二处理模块30还用于在采用K-means聚类算法对降维后的各类因子进行处理时,以对应维度上的平均值为第一个聚类中心运行K-means聚类算法以获得聚类结果,接下去的每个聚类中心由前一个聚类中心获得的聚类结果及一个随机聚类样本点组成,并根据聚类中心依次运行K-means聚类算法直至得到最优数据集。
在一些实施例中,根据以下公式获取各类指标的权重值:
Figure BDA0002919970640000101
Figure BDA0002919970640000111
其中,w11、w21…wm1表示通过因子分析法获取的m个指标对应的权重;w12、w22…wm2表示通过熵值法获取的m个指标对应的权重;w13、w23…wm3表示通过critic权重法获取的m个指标对应的权重;W为各类指标对应的权重构成的矩阵,i=1,2,…,m;j=1,2,3;
Figure BDA0002919970640000112
表示各类指标的权重值。
在一些实施例中,获取模块10还用于采用数据清洗与统计对原始信用数据进行预处理,以便剔除原始信用数据中的异常数据,并通过各个字段值对剔除异常数据后的原始信用数据进行统计。
需要说明的是,需要说明的是,前述对于基于K-means的交通运输主体信用评级方法的实施例的解释说明同样适用于本实施例的基于K-means的交通运输主体信用评级装置,此处不再赘述。
综上所述,根据本发明实施例的一种基于K-means的交通运输主体信用评级装置,设置获取模块获取交通运输主体的原始信用数据,并对原始信用数据进行预处理,以获取交通运输主体的多维度指标,第一处理模块采用因子分析法对多维度指标进行降维处理,以便对多维度指标进行分类并获取每一类对应的因子;第二处理模块采用K-means聚类算法对降维后的各类因子进行处理,以获取聚类后的最优数据集;权重计算模块根据获得的聚类后的最优数据集分别采用因子分析法、熵值法和critic权重法计算各类指标对应的权重,并采用列求和归一化方法获取各类指标的权重值;信用评级模块获取预先设置的评分分值和对应的评分等级,以及根据各类指标的权重值获取各类指标的信用评分分值,以便根据3sigma原则匹配出各类指标的信用评分分值对应的评分等级;从而实现对交通运输主体信用进行有效评级,大大提高评级效果。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不应理解为必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种基于K-means的交通运输主体信用评级方法,其特征在于,包括以下步骤:
获取交通运输主体的原始信用数据,并对所述原始信用数据进行预处理,以获取交通运输主体的多维度指标;
采用因子分析法对所述多维度指标进行降维处理,以便对所述多维度指标进行分类并获取每一类对应的因子;
采用K-means聚类算法对所述降维后的各类因子进行处理,以获取聚类后的最优数据集;
根据所述获得的聚类后的最优数据集分别采用因子分析法、熵值法和critic权重法计算各类指标对应的权重,并采用列求和归一化方法获取各类指标的权重值;
获取预先设置的评分分值和对应的评分等级,以及根据所述各类指标的权重值获取各类指标的信用评分分值,以便根据3sigma原则匹配出所述各类指标的信用评分分值对应的评分等级。
2.如权利要求1所述的基于K-means的交通运输主体信用评级方法,其特征在于,在采用K-means聚类算法对所述降维后的各类因子进行处理时,以对应维度上的平均值为第一个聚类中心运行K-means聚类算法以获得聚类结果,接下去的每个聚类中心由前一个聚类中心获得的聚类结果及一个随机聚类样本点组成,并根据聚类中心依次运行K-means聚类算法直至得到最优数据集。
3.如权利要求1所述的基于K-means的交通运输主体信用评级方法,其特征在于,根据以下公式获取各类指标的权重值:
Figure FDA0002919970630000011
Figure FDA0002919970630000012
其中,w11、w21…wm1表示通过因子分析法获取的m个指标对应的权重;w12、w22…wm2表示通过熵值法获取的m个指标对应的权重;w13、w23…wm3表示通过critic权重法获取的m个指标对应的权重;W为各类指标对应的权重构成的矩阵,i=1,2,…,m;j=1,2,3;
Figure FDA0002919970630000013
表示各类指标的权重值。
4.如权利要求1所述的基于K-means的交通运输主体信用评级方法,其特征在于,采用数据清洗与统计对所述原始信用数据进行预处理,以便剔除所述原始信用数据中的异常数据,并通过各个字段值对剔除异常数据后的原始信用数据进行统计。
5.一种计算机可读存储介质,其特征在于,其上存储有基于K-means的交通运输主体信用评级程序,该基于K-means的交通运输主体信用评级程序被处理器执行时实现如权利要求1-4中任一项所述的基于K-means的交通运输主体信用评级方法。
6.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时,实现如权利要求1-4中任一项所述的基于K-means的交通运输主体信用评级方法。
7.一种基于K-means的交通运输主体信用评级装置,其特征在于,包括:
获取模块,所述获取模块用于获取交通运输主体的原始信用数据,并对所述原始信用数据进行预处理,以获取交通运输主体的多维度指标;
第一处理模块,所述第一处理模块用于采用因子分析法对所述多维度指标进行降维处理,以便对所述多维度指标进行分类并获取每一类对应的因子;
第二处理模块,所述第二处理模块用于采用K-means聚类算法对所述降维后的各类因子进行处理,以获取聚类后的最优数据集;
权重计算模块,所述权重计算模块用于根据所述获得的聚类后的最优数据集分别采用因子分析法、熵值法和critic权重法计算各类指标对应的权重,并采用列求和归一化方法获取各类指标的权重值;
信用评级模块,所述信用评级模块用于获取预先设置的评分分值和对应的评分等级,以及根据所述各类指标的权重值获取各类指标的信用评分分值,以便根据3sigma原则匹配出所述各类指标的信用评分分值对应的评分等级。
8.如权利要求7所述的基于K-means的交通运输主体信用评级装置,其特征在于,所述第二处理模块还用于,在采用K-means聚类算法对所述降维后的各类因子进行处理时,以对应维度上的平均值为第一个聚类中心运行K-means聚类算法以获得聚类结果,接下去的每个聚类中心由前一个聚类中心获得的聚类结果及一个随机聚类样本点组成,并根据聚类中心依次运行K-means聚类算法直至得到最优数据集。
9.如权利要求7所述的基于K-means的交通运输主体信用评级装置,其特征在于,根据以下公式获取各类指标的权重值:
Figure FDA0002919970630000021
Figure FDA0002919970630000022
其中,w11、w21…wm1表示通过因子分析法获取的m个指标对应的权重;w12、w22…wm2表示通过熵值法获取的m个指标对应的权重;w13、w23…wm3表示通过critic权重法获取的m个指标对应的权重;W为各类指标对应的权重构成的矩阵,i=1,2,…,m;j=1,2,3;
Figure FDA0002919970630000031
表示各类指标的权重值。
10.如权利要求7所述的基于K-means的交通运输主体信用评级装置,其特征在于,所述获取模块还用于采用数据清洗与统计对所述原始信用数据进行预处理,以便剔除所述原始信用数据中的异常数据,并通过各个字段值对剔除异常数据后的原始信用数据进行统计。
CN202110114076.7A 2021-01-27 2021-01-27 基于K-means的交通运输主体信用评级方法及装置 Active CN112907035B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110114076.7A CN112907035B (zh) 2021-01-27 2021-01-27 基于K-means的交通运输主体信用评级方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110114076.7A CN112907035B (zh) 2021-01-27 2021-01-27 基于K-means的交通运输主体信用评级方法及装置

Publications (2)

Publication Number Publication Date
CN112907035A true CN112907035A (zh) 2021-06-04
CN112907035B CN112907035B (zh) 2022-08-05

Family

ID=76119123

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110114076.7A Active CN112907035B (zh) 2021-01-27 2021-01-27 基于K-means的交通运输主体信用评级方法及装置

Country Status (1)

Country Link
CN (1) CN112907035B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113569901A (zh) * 2021-06-07 2021-10-29 飞友科技有限公司 一种航空企业满意度质量评价分析方法及系统
CN113569902A (zh) * 2021-06-07 2021-10-29 飞友科技有限公司 一种基于李克特量表分析航空企业满意度评价质量的方法及系统
CN114549178A (zh) * 2022-02-23 2022-05-27 中国工商银行股份有限公司 信用度评价方法、装置、电子设备和介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897461A (zh) * 2017-03-16 2017-06-27 南京大学 一种基于rfmw模型的货主信用等级评价方法
CN107480187A (zh) * 2017-07-10 2017-12-15 北京京东尚科信息技术有限公司 基于聚类分析的用户价值分类方法和装置
US20180276291A1 (en) * 2017-03-27 2018-09-27 Alibaba Group Holding Limited Method and device for constructing scoring model and evaluating user credit
US20180308158A1 (en) * 2016-04-19 2018-10-25 Dalian University Of Technology An optimal credit rating division method based on maximizing credit similarity
CN109345117A (zh) * 2018-09-30 2019-02-15 北京工业大学 一种多维数据驱动的交通运输主体综合画像方法
CN109685321A (zh) * 2018-11-26 2019-04-26 山东师范大学 基于数据挖掘的事件风险预警方法、电子设备及介质
CN110533341A (zh) * 2019-09-04 2019-12-03 东北大学 一种基于bp神经网络的城市宜居性评价方法
CN111104975A (zh) * 2019-12-10 2020-05-05 恒瑞通(福建)信息技术有限公司 一种基于广度学习的信用评估模型
CN111460161A (zh) * 2020-04-02 2020-07-28 西安邮电大学 面向不均衡大数据集的无监督文本主题相关基因提取方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180308158A1 (en) * 2016-04-19 2018-10-25 Dalian University Of Technology An optimal credit rating division method based on maximizing credit similarity
CN106897461A (zh) * 2017-03-16 2017-06-27 南京大学 一种基于rfmw模型的货主信用等级评价方法
US20180276291A1 (en) * 2017-03-27 2018-09-27 Alibaba Group Holding Limited Method and device for constructing scoring model and evaluating user credit
CN107480187A (zh) * 2017-07-10 2017-12-15 北京京东尚科信息技术有限公司 基于聚类分析的用户价值分类方法和装置
CN109345117A (zh) * 2018-09-30 2019-02-15 北京工业大学 一种多维数据驱动的交通运输主体综合画像方法
CN109685321A (zh) * 2018-11-26 2019-04-26 山东师范大学 基于数据挖掘的事件风险预警方法、电子设备及介质
CN110533341A (zh) * 2019-09-04 2019-12-03 东北大学 一种基于bp神经网络的城市宜居性评价方法
CN111104975A (zh) * 2019-12-10 2020-05-05 恒瑞通(福建)信息技术有限公司 一种基于广度学习的信用评估模型
CN111460161A (zh) * 2020-04-02 2020-07-28 西安邮电大学 面向不均衡大数据集的无监督文本主题相关基因提取方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
奚胜田等: "因子分析与聚类分析在企业信用评级中的应用", 《中国农机化》, no. 01, 25 January 2009 (2009-01-25), pages 44 - 47 *
左子叶等: "基于数据挖掘聚类技术的信用评分评级", 《计算机应用与软件》, no. 04, 12 April 2004 (2004-04-12), pages 1 - 3 *
温瑞英等: "基于因子分析和K-means聚类的空中交通复杂性评价", 《太原理工大学学报》, no. 03, 15 May 2016 (2016-05-15), pages 384 - 388 *
王磊等: "基于改进CRITIC权的灰色关联评价模型及其应用", 《现代计算机(专业版)》, no. 23, 15 August 2016 (2016-08-15), pages 8 - 12 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113569901A (zh) * 2021-06-07 2021-10-29 飞友科技有限公司 一种航空企业满意度质量评价分析方法及系统
CN113569902A (zh) * 2021-06-07 2021-10-29 飞友科技有限公司 一种基于李克特量表分析航空企业满意度评价质量的方法及系统
CN114549178A (zh) * 2022-02-23 2022-05-27 中国工商银行股份有限公司 信用度评价方法、装置、电子设备和介质

Also Published As

Publication number Publication date
CN112907035B (zh) 2022-08-05

Similar Documents

Publication Publication Date Title
CN112907035B (zh) 基于K-means的交通运输主体信用评级方法及装置
Qu et al. An experimental study of data heterogeneity in federated learning methods for medical imaging
CN113111063B (zh) 一种应用于多数据源的医疗患者主索引发现方法
CN109816646A (zh) 一种基于退化决策逻辑的无参考图像质量评价方法
CN109272056B (zh) 基于伪负样本的数据平衡方法及提高数据分类性能的方法
CN116958020A (zh) 异常图像检测方法、模型训练方法、装置、设备和介质
CN117591953A (zh) 基于多组学数据的癌症分类方法、系统及电子设备
Saha et al. Best-item learning in random utility models with subset choices
CN114818969A (zh) 变点位置及类别的检测方法及装置
De Sabbata et al. Deep learning geodemographics with autoencoders and geographic convolution
CN113035279B (zh) 基于miRNA测序数据的帕金森疾病演化关键模块识别方法
Biswas et al. Large scale image clustering with active pairwise constraints
Finch A comparison of clustering methods when group sizes are unequal, outliers are present, and in the presence of noise variables
CN113409889A (zh) 一种sgRNA的靶标活性预测方法、装置、设备和存储介质
Hamoodi et al. Identification of biometrics based on a classical mathematical methods in forensic medicine
Dong et al. Using undersampling with ensemble learning to identify factors contributing to preterm birth
Sivakumar et al. Feature selection using genetic algorithm with mutual information
CN116844649B (zh) 一种可解释的基于基因选择的细胞数据分析方法
Varghese et al. Efficient Feature Subset Selection Techniques for High Dimensional Data
Jyothirmayi et al. An Algorithm for Better Decision Tree
Laroutis et al. Discriminant Analysis versus Random Forests on Qualitative Data: Contingent Valuation Method applied to Seine Estuary Wetlands
Li et al. Prediction of splice site using support vector machine with feature selection
Lee CLASSIFICATION OF HEALTHY PEOPLE AND PD PATIENTS USING TAKAGI–SUGENO FUZZY MODEL-BASED INSTANCE SELECTION AND WAVELET TRANSFORMS
Cheng et al. Check for updates Disentangled Hyperspherical Clustering for Sepsis Phenotyping
Hassan et al. Effective classification using artificial bee colony based feature selector

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Su Minxian

Inventor after: He Xiaopeng

Inventor after: Huang Dongliang

Inventor after: Shen Yiyi

Inventor after: Chen Mingbo

Inventor after: Zhang Yan

Inventor after: Lian Na

Inventor before: Su Minxian

Inventor before: Xiao Peng

Inventor before: Huang Dongliang

Inventor before: Shen Yiyi

Inventor before: Chen Mingbo

Inventor before: Zhang Yan

Inventor before: Lian Na

GR01 Patent grant
GR01 Patent grant