CN113269154B - 一种图像识别方法、装置、设备及存储介质 - Google Patents
一种图像识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113269154B CN113269154B CN202110729630.2A CN202110729630A CN113269154B CN 113269154 B CN113269154 B CN 113269154B CN 202110729630 A CN202110729630 A CN 202110729630A CN 113269154 B CN113269154 B CN 113269154B
- Authority
- CN
- China
- Prior art keywords
- image
- template
- identified
- feature
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 87
- 230000004044 response Effects 0.000 claims description 53
- 230000006870 function Effects 0.000 claims description 33
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 7
- 238000012549 training Methods 0.000 description 7
- 238000010276 construction Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 239000003086 colorant Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 206010048245 Yellow skin Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 210000000697 sensory organ Anatomy 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
- G06V40/173—Classification, e.g. identification face re-identification, e.g. recognising unknown faces across different face tracks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Collating Specific Patterns (AREA)
Abstract
本申请涉及一种图像识别方法、装置、设备及存储介质,所述图像识别方法包括:获取待识别图像;响应于所述待识别图像与第一模板呈特定关系,获取与所述第一模板匹配的第二模板,所述第一模板为用于图像识别的参考图像或所述参考图像的特征,且所述第一模板与所述第二模板满足预设相似关系;基于所述待识别图像、所述第一模板以及所述第二模板,得到所述待识别图像对应的识别结果。
Description
技术领域
本申请涉及图像识别技术领域,尤其涉及一种图像识别方法、装置、设备及存储介质。
背景技术
随着人工智能技术的发展,图像识别的精度越来越高,应用范围也越来越广。图像识别中的人脸识别能够应用到生活中非常多的场景,为生活带来了方便。人脸识别可以应用在解锁、支付等对安全级别要求较高的功能中,而人脸识别的精度将直接影响这些功能的安全。目前相关技术中的人脸识别精度虽然较高,但是对于亲属等具有特定关系的人的区分精度还较差。
发明内容
本申请提供一种图像识别方法、装置、设备及存储介质,以解决相关技术中的缺陷。
根据本申请实施例的第一方面,提供一种图像识别方法,所述方法包括:
获取待识别图像;
响应于所述待识别图像与第一模板呈特定关系,获取与所述第一模板匹配的第二模板,所述第一模板为用于图像识别的参考图像或所述参考图像的特征,且所述第一模板与所述第二模板满足预设相似关系;
基于所述待识别图像、所述第一模板以及所述第二模板,得到所述待识别图像对应的识别结果。
在一个实施例中,在所述待识别图像与所述第一模板呈所述特定关系的情况下,所述方法还包括如下至少一项:
响应于不存在与所述第一模板匹配的第二模板,基于所述待识别图像生成所述第二模板;
响应于接收到指示生成第二模板的触发指令,基于所述待识别图像生成所述第二模板;
响应于存在的第二模板满足更新周期或更新条件,基于所述待识别图像更新所述第二模板。
在一个实施例中,在所述基于所述待识别图像生成所述第二模板之前,所述方法还包括:
获取存储的图像集合或特征集合,所述图像集合中每一图像与所述第一模板呈所述特定关系,所述特征集合中每一特征为与所述第一模板呈所述特定关系的图像的特征;
所述基于所述待识别图像生成所述第二模板,包括如下至少一项:
基于获取的所述图像集合以及所述待识别图像,生成所述第二模板;
基于获取的所述图像集合中每一图像对应的特征或获取的所述特征集合,以及所述待识别图像的特征,生成所述第二模板。
在一个实施例中,还包括:
获取所述待识别图像或所述待识别图像的特征与所述第一模板的第一相似度;
响应于所述第一相似度处于预设范围内,确定所述待识别图像与所述第一模板呈所述特定关系。
在一个实施例中,还包括:
将图像组合或特征组合输入至特定关系识别网络中,响应于所述特定关系识别网络的输出为特定关系,确定所述图像组合中的待识别图像或所述特征组合中的特征所属的待识别图像,与所述第一模板呈所述特定关系,其中,所述图像组合包括所述待识别图像和所述参考图像,所述特征组合包括所述待识别图像的特征和所述参考图像的特征,所述特定关系识别网络使用经过标注的特定图像预先训练。
在一个实施例中,还包括:
获取所述待识别图像的属性与所述参考图像的属性之间的匹配信息;
响应于所述待识别图像的属性与所述参考图像的属性的匹配信息符合预设要求,确定所述待识别图像或所述待识别图像的特征与所述第一模板呈所述特定关系。
在一个实施例中,所述基于获取的所述图像集合中每一图像对应的特征或获取的所述特征集合,以及所述待识别图像的特征,生成所述第二模板,包括:
将所述图像集合中每一图像对应的特征或所述特征集合中的每一特征,以及所述待识别图像的特征进行两个类别的聚类处理;
获取所述两个类别的中心特征分别与所述参考图像的特征的第二相似度;
将所述第二相似度中最高第二相似度对应的中心特征,或所述最高第二相似度对应的中心特征所属的图像,确定为所述第二模板。
在一个实施例中,在所述将所述图像集合中每一图像对应的特征或所述特征集合中的每一特征,以及所述待识别图像的特征进行两个类别的聚类处理之后,还包括:
从所述图像集合中各图像对应的特征或所述特征集合,以及所述待识别图像的特征中,获取与所述两个类别的中心特征的距离均大于距离阈值的特征,确定为离散特征;
去除所述离散特征。
在一个实施例中,还包括如下至少一项:
响应于所述待识别图像与所述第一模板呈所述特定关系,且所述图像集合中的图像数量小于第一数量阈值,将所述待识别图像增加至所述图像集合中;
响应于所述待识别图像与所述第一模板呈所述特定关系,且所述特征集合中的特征数量小于第二数量阈值,将所述待识别图像的特征增加至所述特征集合中;
所述获取存储的图像集合或特征集合,包括如下至少一项:
响应于存储的所述图像集合中的图像数量大于或等于所述第一数量阈值,获取所述图像集合;
响应于存储的所述特征集合中的特征数量大于或等于所述第二数量阈值,获取所述特征集合。
在一个实施例中,所述基于所述待识别图像、所述第一模板以及所述第二模板,得到所述待识别图像对应的识别结果,包括:
获取所述待识别图像或所述待识别图像的特征,与所述第一模板的第三相似度、以及与所述第二模板的第四相似度;
响应于与所述第一模板的第三相似度大于或等于与所述第二模板的第四相似度,确定所述识别结果为所述待识别图像与所述参考图像匹配;
响应于与所述第一模板的第三相似度小于与所述第二模板的第四相似度,确定所述识别结果为所述待识别图像与所述参考图像不匹配。
在一个实施例中,还包括:
响应于所述待识别图像未与所述第一模板呈所述特定关系,和/或不存在与所述第一模板匹配的第二模板,基于所述待识别图像和所述第一模板,得到所述待识别图像对应的识别结果。
在一个实施例中,所述参考图像为身份识别、解锁和支付中至少一项功能进行图像比对所使用的底库图像,或进行图像比对所使用的底库特征对应的图像。
在一个实施例中,还包括如下至少一项:
在所述参考图像为所述身份识别功能进行图像比对所使用的底库图像,或进行图像比对所使用的底库特征对应的图像的情况下,响应于所述识别结果为所述待识别图像与所述参考图像匹配,输出用于表征身份识别结果为通过身份认证的内容;
在所述参考图像为所述解锁功能进行图像比对所使用的底库图像,或进行图像比对所使用的底库特征对应的图像的情况下,响应于所述识别结果为所述待识别图像与所述参考图像匹配,解锁屏幕和/或解锁指定功能的操作权限;
在所述参考图像为所述支付功能进行图像比对所使用的底库图像,或进行图像比对所使用的底库特征对应的图像的情况下,响应于所述识别结果为所述待识别图像与所述参考图像匹配,向目标账户支付。
根据本申请实施例的第二方面,提供一种图像识别装置,所述装置包括:
第一获取模块,用于获取待识别图像;
第二获取模块,用于响应于所述待识别图像与第一模板呈特定关系,获取与所述第一模板匹配的第二模板,所述第一模板为用于图像识别的参考图像或所述参考图像的特征,且所述第一模板与所述第二模板满足预设相似关系;
第一识别模块,用于基于所述待识别图像、所述第一模板以及所述第二模板,得到所述待识别图像对应的识别结果。
在一个实施例中,在所述待识别图像与所述第一模板呈所述特定关系的情况下,所述装置还包括如下至少一项:
第一生成模块,用于响应于不存在与所述第一模板匹配的第二模板,基于所述待识别图像生成所述第二模板;
第二生成模块,用于响应于接收到指示生成第二模板的触发指令,基于所述待识别图像生成所述第二模板;
第三生成模块,用于响应于存在的第二模板满足更新周期或更新条件,基于所述待识别图像更新所述第二模板。
在一个实施例中,在所述基于所述待识别图像生成所述第二模板之前,所述装置还包括:
第三获取模块,用于获取存储的图像集合或特征集合,所述图像集合中每一图像与所述第一模板呈所述特定关系,所述特征集合中每一特征为与所述第一模板呈所述特定关系的图像的特征;
所述第一生成模块、所述第二生成模块或所述第三生成模块用于基于所述待识别图像生成所述第二模板时,具体用于如下至少一项:
基于获取的所述图像集合以及所述待识别图像,生成所述第二模板;
基于获取的所述图像集合中每一图像对应的特征或获取的所述特征集合,以及所述待识别图像的特征,生成所述第二模板。
在一个实施例中,所述装置还包括:
第四获取模块,用于获取所述待识别图像或所述待识别图像的特征与所述第一模板的第一相似度;
第一确定模块,用于响应于所述第一相似度处于预设范围内,确定所述待识别图像与所述第一模板呈所述特定关系。
所述装置还包括第二确定模块,用于:
将图像组合或特征组合输入至特定关系识别网络中,响应于所述特定关系识别网络的输出为特定关系,确定所述图像组合中的待识别图像或所述特征组合中的特征所属的待识别图像,与所述第一模板呈所述特定关系,其中,所述图像组合包括所述待识别图像和所述参考图像,所述特征组合包括所述待识别图像的特征和所述参考图像的特征,所述特定关系识别网络使用经过标注的特定图像预先训练。
所述装置还包括第三确定模块,用于:
获取所述待识别图像的属性与所述参考图像的属性之间的匹配信息;
响应于所述待识别图像的属性与所述参考图像的属性的匹配信息符合预设要求,确定所述待识别图像或所述待识别图像的特征与所述第一模板呈所述特定关系。
在一个实施例中,所述第一生成模块、所述第二生成模块或所述第三生成模块用于基于获取的所述图像集合中每一图像对应的特征或获取的所述特征集合,以及所述待识别图像的特征,生成所述第二模板时,具体用于:
将所述图像集合中每一图像对应的特征或所述特征集合中的每一特征,以及所述待识别图像的特征进行两个类别的聚类处理;
获取所述两个类别的中心特征分别与所述参考图像的特征的第二相似度;
将所述第二相似度中最高第二相似度对应的中心特征,或所述最高第二相似度对应的中心特征所属的图像,确定为所述第二模板。
在一个实施例中,在所述第一生成模块、所述第二生成模块或所述第三生成模块用于将所述图像集合中每一图像对应的特征或所述特征集合中的每一特征,以及所述待识别图像的特征进行两个类别的聚类处理之后,还用于:
从所述图像集合中各图像对应的特征或所述特征集合,以及所述待识别图像的特征中,获取与所述两个类别的中心特征的距离均大于距离阈值的特征,确定为离散特征;
去除所述离散特征。
在一个实施例中,所述装置还包括如下至少一项:
图像集构建模块,用于响应于所述待识别图像与所述第一模板呈所述特定关系,且所述图像集合中的图像数量小于第一数量阈值,将所述待识别图像增加至所述图像集合中;
特征集构建模块,用于响应于所述待识别图像与所述第一模板呈所述特定关系,且所述特征集合中的特征数量小于第二数量阈值,将所述待识别图像的特征增加至所述特征集合中;
所述第三获取模块用于获取存储的图像集合或特征集合时,具体用于如下至少一项:
响应于存储的所述图像集合中的图像数量大于或等于所述第一数量阈值,获取所述图像集合;
响应于存储的所述特征集合中的特征数量大于或等于所述第二数量阈值,获取所述特征集合。
在一个实施例中,所述第一识别模块具体用于:
获取所述待识别图像或所述待识别图像的特征,与所述第一模板的第三相似度,以及与所述第二模板的第四相似度;
响应于与所述第一模板的第三相似度大于或等于与所述第二模板的第四相似度,确定所述识别结果为所述待识别图像与所述参考图像匹配;
响应于与所述第一模板的第三相似度小于与所述第二模板的第四相似度,确定所述识别结果为所述待识别图像与所述参考图像不匹配。
在一个实施例中,还包括第二识别模块,用于:
响应于所述待识别图像未与所述第一模板呈所述特定关系,和/或不存在与所述第一模板匹配的第二模板,基于所述待识别图像和所述第一模板,得到所述待识别图像对应的识别结果。
在一个实施例中,所述参考图像为身份识别、解锁和支付中至少一项功能进行图像比对所使用的底库图像,或进行图像比对所使用的底库特征对应的图像。
在一个实施例中,还包括执行模块,用于如下至少一项:
在所述参考图像为所述身份识别功能进行图像比对所使用的底库图像,或进行图像比对所使用的底库特征对应的图像的情况下,响应于所述识别结果为所述待识别图像与所述参考图像匹配,输出用于表征身份识别结果为通过身份认证的内容;
在所述参考图像为所述解锁功能进行图像比对所使用的底库图像,或进行图像比对所使用的底库特征对应的图像的情况下,响应于所述识别结果为所述待识别图像与所述参考图像匹配,解锁屏幕和/或解锁指定功能的操作权限;
在所述参考图像为所述支付功能进行图像比对所使用的底库图像,或进行图像比对所使用的底库特征对应的图像的情况下,响应于所述识别结果为所述待识别图像与所述参考图像匹配,向目标账户支付。
根据本申请实施例的第三方面,提供一种电子设备,所述电子设备包括存储器、处理器,所述存储器用于存储可在处理器上运行的计算机指令,所述处理器用于在执行所述计算机指令时基于第一方面所述的图像识别方法。
根据本申请实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现第一方面所述的方法。
根据上述实施例可知,通过获取待识别图像,并响应于所述待识别图像与第一模板呈特定关系,获取与所述第一模板匹配的第二模板,所述第一模板为用于图像识别的参考图像或所述参考图像的特征,且所述第一模板与所述第二模板满足预设相似关系,最后基于所述待识别图像、所述第一模板以及所述第二模板,得到所述待识别图像对应的识别结果。由于在识别的待识别图像与第一模板呈特定关系时,在第一模板的基础上结合了第二模板来识别,从而可以减少特定图像被错误识别,提高了图像的识别准确率。例如在识别亲属等人脸特征相近的人脸图像时,能够提高人脸识别精度,降低将亲属的人脸图像误识别为本人的人脸图像的几率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是本申请实施例示出的图像识别方法的流程图;
图2是本申请实施例示出的图像识别装置的结构示意图;
图3是本申请实施例示出的电子设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
对于大部分人来讲,目前的人脸识别模型可以实现非常高的识别精度,但是对于一些特殊人群,人脸识别的算法还存在一定的问题,比如双胞胎之间由于天然的相似度偏高,往往出现误识的概率较高,识别过程中易出现无法识别匹配到双胞胎中正确人的现象。
现有的人脸识别解决方法中,大部分基于比对的方法只使用一个固定的阈值去决定两张人脸图片的相似度。而双胞胎之间的相似度分数值往往偏高,很容易超过固定的阈值而发生误识别现象。面对这种情况,往往只能通过提高阈值的方式去解决,但是这种方式会导致识别通过率下降,用户本人的通过率也相应下降,严重影响用户的使用体验。
在一些专用的特化模型中,通过在训练数据中加入较多的亲属和双胞胎图片,提升双胞胎图片的比对性能。但这需要较多的人脸数据和标注成本,而且实际使用中并不能真正的长久有效的避免双胞胎造成的误识现象。
基于此,第一方面,本申请至少一个实施例提供了一种图像识别方法,请参照附图1,其示出了该方法的流程,包括步骤S101至步骤S103。
其中,该方法可以由终端或服务器等电子设备执行,终端可以为用户设备(UserEquipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字助理(PersonalDigital Assistant,PDA)手持设备、计算设备、车载设备、可穿戴设备等,该方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。或者,可以通过服务器执行该方法,服务器可以为本地服务器、云端服务器等。
其中,该图像识别方法可以针对特定种类的图像的识别,例如识别人脸图像。因此用于执行该图像识别方法的主体内预先存储有第一模板(第一模板即为参考图像或参考图像的特征),例如用户本人的人脸图像或人脸图像的特征。待识别图像的种类与上述参考图像的种类是相同的,例如参考图像为人脸图像时,待识别图像也为人脸图像。识别时,可以通过将待识别图像或待识别图像的特征和第一模板比对来完成。
其中,该图像识别方法可以用于触发特定功能,例如身份识别、解锁和支付等功能,图像识别结果可以影响功能的执行与否。也就是说,参考图像为身份识别、解锁和支付中至少一项功能进行图像比对所使用的底库图像,或进行图像比对所使用的底库特征对应的图像。
在步骤S101中,获取待识别图像。
本实施例中,以执行主体为终端为例,可以通过执行该方法的终端的图像采集元件来采集待识别图像,因此获取待识别图像时可以获取图像采集元件采集的待识别图像。例如,执行该方法的终端为智能手机,则可以获取智能手机的摄像头采集的待识别图像。可以理解的是,获取待识别图像的方式较多,上述示例并非对获取方式的限制。
本实施例中,获取待识别图像,可以根据图像的种类获取,即可以只获取该图像识别方法针对的图像种类。例如,该图像识别方法针对人脸图像,则本步骤获取的待识别图像为人脸图像。可以在获取待识别图像前增加一个过滤步骤,即对图像采集元件的预览场景进行识别,当识别结果显示该场景对应的图像符合该图像识别方法针对的图像种类时,控制图像采集元件采集图像并获取上述图像作为待识别图像。例如,该图像识别方法针对人脸图像,则可以对图像采集元件的预览场景进行识别,当识别结果显示该场景内存在人脸时,控制图像采集元件采集图像,并获取该图像作为待识别图像。
在步骤S102中,响应于所述待识别图像与第一模板呈特定关系,获取与所述第一模板匹配的第二模板,所述第一模板为用于图像识别的参考图像或所述参考图像的特征,且所述第一模板与所述第二模板满足预设相似关系。
其中,与第一模板呈特定关系的待识别图像,可以指较难准确识别的图像,例如与参考图像的相似度较高的图像。第一模板和第二模板的种类相同,即第一模板为参考图像,则第二模板也为图像,第一模板为参考图像的特征,则第二模板也为图像特征;第一模板和第二模板的预设相似关系,也可以是相似度的数值具有一定的关系,或者相似度的维度有一定的关系。这些特定图像可以是亲属图像,例如双胞胎图像等兄弟姐妹的图像、父母子女的图像等。第二模板为与参考图像呈特定关系的待识别图像或与参考图像呈特定关系的待识别图像的特征。特定关系不同,第二模板的种类不同,例如,特定关系为亲属关系,则第二模板为亲属模板,再例如,特定图像为双胞胎关系,则第二模板为兄弟模板,可用Bro-模板表示。
另外,第二模板可以预先建立并存储于执行该方法的终端内,本步骤中可以根据第二模板的存储路径,获取第二模板。
在步骤S103中,基于所述待识别图像、所述第一模板以及所述第二模板,得到所述待识别图像对应的识别结果。
本实施例中,第二模板可以提高特定图像的识别准确率,因此在待识别图像为特定图像时,在第一模板的基础上结合第二模板进行识别。
可选的,采用下述方式对上述待识别图像进行识别:首先,获取所述待识别图像或所述待识别图像的特征分别与所述第一模板、所述第二模板的第三相似度;接下来,响应于与所述第一模板的第三相似度大于或等于与所述第二模板的第三相似度,确定所述识别结果为所述待识别图像与所述参考图像匹配;最后,响应于与所述第一模板的第三相似度小于与所述第二模板的第三相似度,确定所述识别结果为所述待识别图像与所述特定图像不匹配。可以根据特征间的欧氏距离和/或汉明距离确定相似度。通过比较待识别图像或待识别图像的特征与第一模板、第二模板的第三相似度,能够准确区分待识别图像是否为与参考图像匹配的图像,例如在人脸图像识别的场景下,特定关系为双胞胎关系,则可以准确区分待识别的人脸图像为本人的人脸图像还是双胞胎兄弟姐妹的人脸图像,因此能够避免图像的识别错误,例如将亲属或双胞胎人脸图像识别为本人的人脸图像。
可以理解的是,当在第一模板的基础上结合第二模板,对待识别图像进行识别时,需要满足存在第二模板这一条件,因为不存在第二模板的情况下是无法实现结合第二模板这一操作的。
因此,当所述待识别图像未与所述第一模板呈特定关系时,和/或,不存在与所述第一模板匹配的所述第二模板时,基于所述待识别图像和所述第一模板,得到所述待识别图像对应的识别结果。也就是说,可以直接确定待识别图像的特征与第一模板的相似度,并比较该相似度与预设的相似度阈值,当待识别图像的特征与第一模板的相似度大于或等于该相似度阈值时,该待识别图像与参考图像匹配(例如识别通过),否则为与参考图像不匹配(例如识别未通过)。
另外,当该图像识别方法为终端的某些功能的触发步骤时,即参考图像为某些功能进行图像比对所使用的底库图像,或进行图像比对所使用的底库特征对应的图像,因此可以在所述识别结果为与所述参考图像匹配的情况下,执行与图像识别相关的功能。例如在人脸识别时,可以在人脸识别通过时执行上述功能。与图像识别相关的功能可以是身份识别、解锁和支付等。在与图像识别相关的功能为身份识别时,即在所述参考图像为所述身份识别功能进行图像比对所使用的底库图像,或进行图像比对所使用的底库特征对应的图像的情况下,响应于识别结果为与所述参考图像匹配,可以输出用于表征身份识别结果为通过身份认证的内容;以提示用户当前识别的图像为本人图像,例如采用显示屏显示或扬声器语音播报等方式输出;在与图像识别相关的功能为解锁时,即在所述参考图像为所述解锁功能进行图像比对所使用的底库图像,或进行图像比对所使用的底库特征对应的图像的时,响应于识别结果为与所述参考图像匹配,可以解锁屏幕和/或解锁指定功能的操作权限;在与图像识别相关的功能为支付时,即在所述参考图像为所述支付功能进行图像比对所使用的底库图像,或进行图像比对所使用的底库特征对应的图像的情况下,响应于识别结果为与所述参考图像匹配的情况下,可以向目标账户支付。
根据上述实施例可知,通过获取待识别图像,并响应于所述待识别图像与第一模板呈特定关系,获取与所述第一模板匹配的第二模板,所述第一模板为用于图像识别的参考图像或所述参考图像的特征,且所述第一模板与所述第二模板满足预设相似关系,最后基于所述待识别图像、所述第一模板以及所述第二模板,得到所述待识别图像对应的识别结果。由于在识别待识别图像时,在第一模板的基础上结合了第二模板来识别,从而可以降低特定图像被错误识别的几率,提高了图像的识别准确率。例如在识别亲属的人脸图像时,能够提高人脸识别精度,降低将亲属的人脸图像误识别为本人的人脸图像的几率。
本申请的一些实施例中,在所述待识别图像与所述第一模板呈所述特定关系的情况下,还可以按照下述至少一种方式触发第二模板的生成:
第一种方式,响应于不存在与所述第一模板匹配的第二模板,基于所述待识别图像生成所述第二模板。不存在第二模板,指的是执行该图像识别方法的终端等主体内未存储第二模板,即之前未生成第二模板或之前生成的第二模板已经作废。而该图像识别方法是通过结合第二模板来提高识别精度,因此在不存在第二模板的情况下,可以自动触发模板建立指令,即自动生成第二模板,以提高识别精度。可以理解的是,当执行该图像识别方法的终端等主体内存储有第二模板,则无需再生成第二模板,因此不生成模板建立指令。这种方式能够在该方法运行初期及时生成第二模板,以提高图像识别精度。
可选的,可以为终端预先设置作废第二模板的条件,例如,第二模板未被调用的持续时间超过时间阈值,再例如,终端的存储空间剩余量低于空间阈值,再例如,用户直接通过操作作废第二模板。当终端内存在第二模板的情况下,终端持续获取第二模板未被调用的持续时间、终端的存储空间剩余量和用户作废第二模板的操作,当其中一项达到上述预设条件时,将第二模板作废。
第二种方式,响应于接收到指示生成第二模板的触发指令,基于所述待识别图像生成所述第二模板。触发指令可以基于用户输入的操作而生成,即用户的操作触发第二模板的生成,例如用户可以对执行该图像识别方法的终端的实体或虚拟按钮进行操作,以生成模板建立指令;再例如该方法可以提供亲属模式、双胞胎模式等模式,当用户将这些模式被打开时生成触发指令。这种方式可以满足用户的需求,即用户在使用过程中存在亲属识别的场景或者双胞胎识别的场景,或者用户在使用过程中经常出现误识别,可以自主的触发第二模板的建立,即自主的提高图像识别的精度;而在用户不存在上述需求时,可以降低执行该方法的终端等主体的负荷和功耗。
第三种方式,响应于存在的所述第二模板满足更新周期或更新条件,基于所述待识别图像更新所述第二模板。对第二模板的更新能够不断提高图像识别的精度。更新周期可以由该方法自动确定,也可以由用户预先设置。更新条件可以由该方法自动确定,也可以由用户预先设置,例如更新条件为识别次数达到预设数量等。这种方式能够不断完善第二模板,克服第二模板不准确的地方,从而不断提高图像识别精度。
上述三种方式可以单独运行,也可以结合在一起运行。例如,可以在该方法运行初始阶段利用第一种方式生成模板建立指令,在建立第二模板后利用第三种方式更新第二模板,且在该方法运行的全过程中允许用户手动输入触发指令。
本申请的一些实施例中,可以在所述基于所述待识别图像生成所述第二模板之前,获取存储的图像集合或特征集合,所述图像集合中每一图像与所述第一模板呈所述特定关系,所述特征集合中每一特征为与所述第一模板呈所述特定关系的图像的特征。进一步的,生成第二模板时,可以基于获取的所述图像集合以及所述待识别图像,生成所述第二模板;还可以基于获取的所述图像集合中每一图像对应的特征或获取的所述特征集合,以及所述待识别图像的特征,生成所述第二模板。
其中,图像集合或特征集合是在生成第二模板前预先构建的,可以在执行该方法的终端中不存在第二模板的情况下,在使用第一模板对待识别图像进行识别的同时,从待识别图像中筛选符合图像集合或特征集合的图像或图像特征,并使用这些图像或图像特征构建图像集合或特征集合。可选的,可以响应于所述待识别图像与所述第一模板呈所述特定关系,且所述图像集合中的图像数量小于第一数量阈值,将所述待识别图像增加至所述图像集合中;响应于所述待识别图像与所述第一模板呈所述特定关系,且所述特征集合中的特征数量小于第二数量阈值,将所述待识别图像的特征增加至所述特征集合中。其中,第一数量阈值是图像集合的数量要求,第二数量阈值是特征集合的数量要求,第一数量阈值和第二数量阈值可以相同,也可以不相同;第一数量阈值和第二数量阈值可以根据数据存储占用的空间和/或生成第二模板对数据量的需求而确定,例如,图像集合中的图像分辨率较高,因此图像集合中的每个图像占用的存储空间大于特征集合中的每个特征占用的存储空间,因此第一数量阈值可以小于第二数量阈值。
由于图像结合和特征集合都有各自的数量要求,因此在获取图像集合或特征集合时,可以响应于存储的所述图像集合中的图像数量大于或等于所述第一数量阈值,获取所述图像集合;还可以响应于存储的所述特征集合中的特征数量大于或等于所述第二数量阈值,获取所述特征集合。
本实施例中,生成第二模板的图像或图像特征,有一定的数量要求,即在图像集合或特征集合不满足数量要求时,不断筛选扩充图像集合或特征集合;待图像结合或特征集合满足数量要求后,可以利用待识别图像与图像集合中的图像,或待识别图像的特征与特征集合中的特征生成第二模板。其中的数量要求可以是大于某个数量阈值,例如大于5。通过对生成第二模板的图像或特征的数量进行要求,能够提高第二模板的准确度,进而提高图像识别的准确度。
本申请的一些实施例中,可以在获取待识别图像后确定该待识别图像是否与第一模板呈特定关系,以生成第二模板或利用第二模板进行图像识别。可以采用多种方式确定待识别图像与第一模板的关系,本申请对此无意进行限制,下面示例性的介绍三种确定是否为特定关系的方式。
第一种方式,首先,获取所述待识别图像或所述待识别图像的特征与所述第一模板的第一相似度;接下来,响应于所述第一相似度处于预设范围内,确定所述待识别图像与所述第一模板呈所述特定关系。相关技术中进行图像识别时,可以使用图像或图像特征的第一相似度确定识别结果,而与第一模板呈特定关系的图像,可以是使用第一相似度无法准确识别的特定图像。例如,当待识别图像的特征与第一模板的第一相似度高于或等于相似度阈值时,确定识别结果为与参考图像匹配(例如识别结果为通过),当相似度低于相似度阈值时,确定识别结果为与参考图像不匹配,而与第一模板呈特定关系的图像实际上并非与参考图像匹配,但其与第一模板的第一相似度却往往高于上述相似度阈值。因此利用相似度范围来选择特定图像较为合理,且较为准确,可以将一定范围确定为相似度范围,例如,将0.5-0.8确定为相似度范围。这种方式在原有的利用第一相似度确定识别结果的基础上,进一步对第一相似度进行应用,能够提高第一相似度的利用率,且效率较高,对原算法增加的负荷较少,对终端等执行主体的功耗增加较少。
第二种方式,将图像组合或特征组合输入至特定图像识别网络中,响应于所述特定关系识别网络的输出为特定关系,确定所述图像组合中的待识别图像或所述特征组合中的特征所属的待识别图像,与所述第一模板呈特定关系,其中,所述图像组合包括所述待识别图像和所述参考图像,所述特征组合包括所述待识别图像的特征和所述参考图像的特征,所述特定关系识别网络使用经过标注的特定图像预先训练。该特定关系识别网络可以基于神经网络构建,可以为分类器,能够对输入的图像组合或特征组合进行关系判断,判断结果可以为存在特定关系或不存在特定关系两种。在预先训练时,可以取一定数量的存在特定关系的图像组合或特征组合和一定数量的不存在特定关系的图像组合或特征组合,并且对上述全部的图像组合或特征组合进行标注,即将存在特定关系的图像组合或特征组合标注为存在特定关系,将不存在特定关系的图像组合或特征组合标注为不存在特定关系;然后将这些标注过的图像组合或特征组合输入至特定关系识别网络中,以使特定关系识别网络输出预测值,即是否存在特定关系,并将该预测值与真实值(即标注信息,存在特定关系或不存在特定关系)进行比较,利用比较结果对特定关系识别网络的网络参数进行调整;按照上述训练方式不断迭代,直至该特定关系识别网络收敛或迭代次数达到预设要求。在按照相关技术中的原算法对待识别图像进行识别的同时,将待识别图像和参考图像(或待识别图像和第一模板)输入至特定关系识别网络中,根据模型的输出结果判断该待识别图像是否与第一模板呈特定关系。这种方式中,利用的特定关系识别网络经过预先训练,因此所预测出的特定关系较为准确,而且由于预测的结果只是特定关系(例如相似度在一定范围内),因此预先训练时所需的训练数据的量级较小,不像直接训练分辨亲属与本人的网络模型的训练数据的量级那么大,标注工作简单方便。
第三种方式,先获取所述待识别图像的属性与所述参考图像的属性之间的匹配信息;再响应于所述待识别图像的属性与所述参考图像的属性的匹配信息符合预设要求,确定所述待识别图像或所述待识别图像的特征与所述第一模板呈所述特定关系。当图像为人脸图像时,考虑到不同肤色或地域的人物,在人物特征上存在较大差异,因此,图像的属性可以包括人物的肤色或地域、当然,还可以包括性别、人脸种类、各个五官的种类等。通过属性判断特定关系较为简单,且容易排除一些非特定关系的图像,例如肤色为黄色的人物以及肤色为白色的人物之间的非特定关系。
上述三种方式可以单独运行,也可以结合在一起运行。例如,可以将第一种方式和第二种方式结合在一起运行,即先通过相似度范围初步筛选出特定图像,再将筛选出的特定图像与参考图像组成的图像对或特征对输入至特定关系识别网络中,以进一步确定是否存在特定关系。再例如,可以在上述两种方式结合的基础上,进一步结合第三种方式,即进一步确定是否存在特定关系后,使用筛选出的特定图像的属性和参考图像的属性,排除一些非特定关系的图像,例如第二种方式所确定的特定图像中的人脸图像为男人,而参考图像中的人脸为女人,则可以排除该图像与第一模板存在特定关系。
本实施例中,通过上述一种或多种方式,确定待识别图像与第一模板是否存在特定关系,也就是在识别待识别图像的同时,也同步进行特定关系的识别工作,高效便捷,结果准确。
本申请的一些实施例中,可以按照下述方式基于获取的所述图像集合中每一图像对应的特征或获取的所述特征集合,以及所述待识别图像的特征,生成第二模板。
首先,将所述图像集合中每一图像对应的特征或所述特征集合中的每一特征,以及所述待识别图像的特征进行两个类别的聚类处理;接下来,获取所述两个类别的中心特征分别与所述参考图像的特征的第二相似度;最后,将与所述第二相似度中最高第二相似度对应的中心特征,或所述最高第二相似度对应的中心特征所属的图像,确定为所述第二模板。
其中,进行聚类处理时,可以采用K-均值聚类算法、均值漂移聚类算法、基于密度的聚类算法、高斯混合模型的最大期望聚类算法、凝聚层次聚类和图团体检测聚类算法中的一种或多种。
其中,在将全部的所述特定图像的特征进行两个类别的聚类处理之后,还可以去除离散特征(或离散点),从而使两个类中心的距离尽量大一些。可选的,首先,从所述图像集合中各图像对应的特征或所述特征集合,以及所述待识别图像的特征中,获取与所述两个类别的中心特征的距离均大于距离阈值的特征,确定为离散特征,然后去除所述离散特征。
这种方式所确定的第二模板较为准确,且方式较为方便可靠。依靠这种方式所确定的第二模板能够准确的与第一模板区分,从而实现特定图像与参考图像的区分和识别,减少误识别的概率。
本实施例中,通过上述方式确定第二模板,对筛选出的图像集合或特征集合进行充分利用,且为识别与第一模板呈特定搞关系的图像提供了基础,保证了与第一模板呈特定搞关系的图像的识别精度,避免将与第一模板呈特定搞关系的图像误识别为参考图像。
根据本申请实施例的第二方面,提供一种图像识别装置,请参照附图2,其示出了该装置的结构示意图,所述装置包括:
第一获取模块201,用于获取待识别图像;
第二获取模块202,用于响应于所述待识别图像与第一模板呈特定关系,获取与所述第一模板匹配的第二模板,所述第一模板为用于图像识别的参考图像或所述参考图像的特征,且所述第一模板与所述第二模板满足预设相似关系;
第一识别模块203,用于基于所述待识别图像、所述第一模板以及所述第二模板,得到所述待识别图像对应的识别结果。
在本申请的一些实施例中,在所述待识别图像与所述第一模板呈所述特定关系的情况下,所述装置还包括如下至少一项:
第一生成模块,用于响应于不存在与所述第一模板匹配的第二模板,基于所述待识别图像生成所述第二模板;
第二生成模块,用于响应于接收到指示生成第二模板的触发指令,基于所述待识别图像生成所述第二模板;
第三生成模块,用于响应于存在的第二模板满足更新周期或更新条件,基于所述待识别图像更新所述第二模板。
在本申请的一些实施例中,在所述基于所述待识别图像生成所述第二模板之前,所述装置还包括:
第三获取模块,用于获取存储的图像集合或特征集合,所述图像集合中每一图像与所述第一模板呈所述特定关系,所述特征集合中每一特征为与所述第一模板呈所述特定关系的图像的特征;
所述第一生成模块、所述第二生成模块或所述第三生成模块用于基于所述待识别图像生成所述第二模板时,具体用于如下至少一项:
基于获取的所述图像集合以及所述待识别图像,生成所述第二模板;
基于获取的所述图像集合中每一图像对应的特征或获取的所述特征集合,以及所述待识别图像的特征,生成所述第二模板。
在本申请的一些实施例中,所述装置还包括:
第四获取模块,用于获取所述待识别图像或所述待识别图像的特征与所述第一模板的第一相似度;
第一确定模块,用于响应于所述第一相似度处于预设范围内,确定所述待识别图像与所述第一模板呈所述特定关系。
所述装置还包括第二确定模块,用于:
将图像组合或特征组合输入至特定关系识别网络中,响应于所述特定关系识别网络的输出为特定关系,确定所述图像组合中的待识别图像或所述特征组合中的特征所属的待识别图像,与所述第一模板呈所述特定关系,其中,所述图像组合包括所述待识别图像和所述参考图像,所述特征组合包括所述待识别图像的特征和所述参考图像的特征,所述特定关系识别网络使用经过标注的特定图像预先训练。
所述装置还包括第三确定模块,用于:
获取所述待识别图像的属性与所述参考图像的属性之间的匹配信息;
响应于所述待识别图像的属性与所述参考图像的属性的匹配信息符合预设要求,确定所述待识别图像或所述待识别图像的特征与所述第一模板呈所述特定关系。
在本申请的一些实施例中,所述第一生成模块、所述第二生成模块或所述第三生成模块用于基于获取的所述图像集合中每一图像对应的特征或获取的所述特征集合,以及所述待识别图像的特征,生成所述第二模板时,具体用于:
将所述图像集合中每一图像对应的特征或所述特征集合中的每一特征,以及所述待识别图像的特征进行两个类别的聚类处理;
获取所述两个类别的中心特征分别与所述参考图像的特征的第二相似度;
将所述第二相似度中最高第二相似度对应的中心特征,或所述最高第二相似度对应的中心特征所属的图像,确定为所述第二模板。
在本申请的一些实施例中,在所述第一生成模块、所述第二生成模块或所述第三生成模块用于将所述图像集合中每一图像对应的特征或所述特征集合中的每一特征,以及所述待识别图像的特征进行两个类别的聚类处理之后,还用于:
从所述图像集合中各图像对应的特征或所述特征集合,以及所述待识别图像的特征中,获取与所述两个类别的中心特征的距离均大于距离阈值的特征,确定为离散特征;
去除所述离散特征。
在本申请的一些实施例中,所述装置还包括如下至少一项:
图像集构建模块,用于响应于所述待识别图像与所述第一模板呈所述特定关系,且所述图像集合中的图像数量小于第一数量阈值,将所述待识别图像增加至所述图像集合中;
特征集构建模块,用于响应于所述待识别图像与所述第一模板呈所述特定关系,且所述特征集合中的特征数量小于第二数量阈值,将所述待识别图像的特征增加至所述特征集合中;
所述第三获取模块用于获取存储的图像集合或特征集合时,具体用于如下至少一项:
响应于存储的所述图像集合中的图像数量大于或等于所述第一数量阈值,获取所述图像集合;
响应于存储的所述特征集合中的特征数量大于或等于所述第二数量阈值,获取所述特征集合。
在本申请的一些实施例中,所述第一识别模块具体用于:
获取所述待识别图像或所述待识别图像的特征,与所述第一模板的第三相似度,以及与所述第二模板的第四相似度;
响应于与所述第一模板的第三相似度大于或等于与所述第二模板的第四相似度,确定所述识别结果为所述待识别图像与所述参考图像匹配;
响应于与所述第一模板的第三相似度小于与所述第二模板的第四相似度,确定所述识别结果为所述待识别图像与所述参考图像不匹配。
在本申请的一些实施例中,还包括第二识别模块,用于:
响应于所述待识别图像未与所述第一模板呈所述特定关系,和/或不存在与所述第一模板匹配的第二模板,基于所述待识别图像和所述第一模板,得到所述待识别图像对应的识别结果。
在本申请的一些实施例中,所述参考图像为身份识别、解锁和支付中至少一项功能进行图像比对所使用的底库图像,或进行图像比对所使用的底库特征对应的图像。
在本申请的一些实施例中,还包括执行模块,用于如下至少一项:
在所述参考图像为所述身份识别功能进行图像比对所使用的底库图像,或进行图像比对所使用的底库特征对应的图像的情况下,响应于所述识别结果为所述待识别图像与所述参考图像匹配,输出用于表征身份识别结果为通过身份认证的内容;
在所述参考图像为所述解锁功能进行图像比对所使用的底库图像,或进行图像比对所使用的底库特征对应的图像的情况下,响应于所述识别结果为所述待识别图像与所述参考图像匹配,解锁屏幕和/或解锁指定功能的操作权限;
在所述参考图像为所述支付功能进行图像比对所使用的底库图像,或进行图像比对所使用的底库特征对应的图像的情况下,响应于所述识别结果为所述待识别图像与所述参考图像匹配,向目标账户支付。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在第一方面有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
根据本申请实施例的第三方面,提供一种电子设备,如图3所示,所述电子设备包括存储器301、处理器302,所述存储器301用于存储可在处理器302上运行的计算机指令,所述处理器302用于在执行所述计算机指令时基于第一方面所述的图像识别方法。其中,处理器302可以通过内部总线303与存储器301连接,且内部总线303可以通过网络接口304接入网络。
根据本申请实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现第一方面所述的方法。
本领域技术人员应明白,本说明书一个或多个实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于数据处理设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的行为或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中描述的主题及功能操作的实施例可以在以下中实现:数字电子电路、有形体现的计算机软件或固件、包括本说明书中公开的结构及其结构性等同物的计算机硬件、或者它们中的一个或多个的组合。本说明书中描述的主题的实施例可以实现为一个或多个计算机程序,即编码在有形非暂时性程序载体上以被数据处理装置执行或控制数据处理装置的操作的计算机程序指令中的一个或多个模块。可替代地或附加地,程序指令可以被编码在人工生成的传播信号上,例如机器生成的电、光或电磁信号,该信号被生成以将信息编码并传输到合适的接收机装置以由数据处理装置执行。计算机存储介质可以是机器可读存储设备、机器可读存储基板、随机或串行存取存储器设备、或它们中的一个或多个的组合。
本说明书中描述的处理及逻辑流程可以由执行一个或多个计算机程序的一个或多个可编程计算机执行,以通过根据输入数据进行操作并生成输出来执行相应的功能。所述处理及逻辑流程还可以由专用逻辑电路—例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)来执行,并且装置也可以实现为专用逻辑电路。
适合用于执行计算机程序的计算机包括,例如通用和/或专用微处理器,或任何其他类型的中央处理单元。通常,中央处理单元将从只读存储器和/或随机存取存储器接收指令和数据。计算机的基本组件包括用于实施或执行指令的中央处理单元以及用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括用于存储数据的一个或多个大容量存储设备,例如磁盘、磁光盘或光盘等,或者计算机将可操作地与此大容量存储设备耦接以从其接收数据或向其传送数据,抑或两种情况兼而有之。然而,计算机不是必须具有这样的设备。此外,计算机可以嵌入在另一设备中,例如移动电话、个人数字助理(PDA)、移动音频或视频播放器、游戏操纵台、全球定位系统(GPS)接收机、或例如通用串行总线(USB)闪存驱动器的便携式存储设备,仅举几例。
适合于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、媒介和存储器设备,例如包括半导体存储器设备(例如EPROM、EEPROM和闪存设备)、磁盘(例如内部硬盘或可移动盘)、磁光盘以及CD ROM和DVD-ROM盘。处理器和存储器可由专用逻辑电路补充或并入专用逻辑电路中。
虽然本说明书包含许多具体实施细节,但是这些不应被解释为限制任何发明的范围或所要求保护的范围,而是主要用于描述特定发明的具体实施例的特征。本说明书内在多个实施例中描述的某些特征也可以在单个实施例中被组合实施。另一方面,在单个实施例中描述的各种特征也可以在多个实施例中分开实施或以任何合适的子组合来实施。此外,虽然特征可以如上所述在某些组合中起作用并且甚至最初如此要求保护,但是来自所要求保护的组合中的一个或多个特征在一些情况下可以从该组合中去除,并且所要求保护的组合可以指向子组合或子组合的变型。
类似地,虽然在附图中以特定顺序描绘了操作,但是这不应被理解为要求这些操作以所示的特定顺序执行或顺次执行、或者要求所有例示的操作被执行,以实现期望的结果。在某些情况下,多任务和并行处理可能是有利的。此外,上述实施例中的各种系统模块和组件的分离不应被理解为在所有实施例中均需要这样的分离,并且应当理解,所描述的程序组件和系统通常可以一起集成在单个软件产品中,或者封装成多个软件产品。
由此,主题的特定实施例已被描述。其他实施例在所附权利要求书的范围以内。在某些情况下,权利要求书中记载的动作可以以不同的顺序执行并且仍实现期望的结果。此外,附图中描绘的处理并非必需所示的特定顺序或顺次顺序,以实现期望的结果。在某些实现中,多任务和并行处理可能是有利的。
以上所述仅为本说明书一个或多个实施例的较佳实施例而已,并不用以限制本说明书一个或多个实施例,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例保护的范围之内。
在本申请中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。术语“多个”指两个或两个以上,除非另有明确的限定。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
Claims (16)
1.一种图像识别方法,其特征在于,所述方法包括:
获取待识别图像;
响应于所述待识别图像与第一模板呈特定关系,获取与所述第一模板匹配的第二模板,所述第一模板为用于图像识别的参考图像或所述参考图像的特征,且所述第一模板与所述第二模板满足预设相似关系,所述第一模板与所述第二模板分别为不同用户的模板;
基于所述待识别图像、所述第一模板以及所述第二模板,得到所述待识别图像对应的识别结果。
2.根据权利要求1所述的方法,其特征在于,在所述待识别图像与所述第一模板呈所述特定关系的情况下,所述方法还包括如下至少一项:
响应于不存在与所述第一模板匹配的第二模板,基于所述待识别图像生成所述第二模板;
响应于接收到指示生成第二模板的触发指令,基于所述待识别图像生成所述第二模板;
响应于存在的第二模板满足更新周期或更新条件,基于所述待识别图像更新所述第二模板。
3.根据权利要求2所述的方法,其特征在于,在所述基于所述待识别图像生成所述第二模板之前,所述方法还包括:
获取存储的图像集合或特征集合,所述图像集合中每一图像与所述第一模板呈所述特定关系,所述特征集合中每一特征为与所述第一模板呈所述特定关系的图像的特征;
所述基于所述待识别图像生成所述第二模板,包括如下至少一项:
基于获取的所述图像集合以及所述待识别图像,生成所述第二模板;
基于获取的所述图像集合中每一图像对应的特征或获取的所述特征集合,以及所述待识别图像的特征,生成所述第二模板。
4.根据权利要求1至3任一项所述的图像识别方法,其特征在于,还包括:
获取所述待识别图像或所述待识别图像的特征与所述第一模板的第一相似度;
响应于所述第一相似度处于预设范围内,确定所述待识别图像与所述第一模板呈所述特定关系。
5.根据权利要求1至3任一项所述的图像识别方法,其特征在于,还包括:
将图像组合或特征组合输入至特定关系识别网络中,响应于所述特定关系识别网络的输出为特定关系,确定所述图像组合中的待识别图像或所述特征组合中的特征所属的待识别图像,与所述第一模板呈所述特定关系,其中,所述图像组合包括所述待识别图像和所述参考图像,所述特征组合包括所述待识别图像的特征和所述参考图像的特征,所述特定关系识别网络使用经过标注的特定图像预先训练。
6.根据权利要求1至3任一项所述的图像识别方法,其特征在于,还包括:
获取所述待识别图像的属性与所述参考图像的属性之间的匹配信息;
响应于所述待识别图像的属性与所述参考图像的属性的匹配信息符合预设要求,确定所述待识别图像或所述待识别图像的特征与所述第一模板呈所述特定关系。
7.根据权利要求3所述的图像识别方法,其特征在于,所述基于获取的所述图像集合中每一图像对应的特征或获取的所述特征集合,以及所述待识别图像的特征,生成所述第二模板,包括:
将所述图像集合中每一图像对应的特征或所述特征集合中的每一特征,以及所述待识别图像的特征进行两个类别的聚类处理;
获取所述两个类别的中心特征分别与所述参考图像的特征的第二相似度;
将所述第二相似度中最高第二相似度对应的中心特征,或所述最高第二相似度对应的中心特征所属的图像,确定为所述第二模板。
8.根据权利要求7所述的图像识别方法,其特征在于,在所述将所述图像集合中每一图像对应的特征或所述特征集合中的每一特征,以及所述待识别图像的特征进行两个类别的聚类处理之后,还包括:
从所述图像集合中各图像对应的特征或所述特征集合,以及所述待识别图像的特征中,获取与所述两个类别的中心特征的距离均大于距离阈值的特征,确定为离散特征;
去除所述离散特征。
9.根据权利要求3、7和8中任意一项所述的图像识别方法,其特征在于,还包括如下至少一项:
响应于所述待识别图像与所述第一模板呈所述特定关系,且所述图像集合中的图像数量小于第一数量阈值,将所述待识别图像增加至所述图像集合中;
响应于所述待识别图像与所述第一模板呈所述特定关系,且所述特征集合中的特征数量小于第二数量阈值,将所述待识别图像的特征增加至所述特征集合中;
所述获取存储的图像集合或特征集合,包括如下至少一项:
响应于存储的所述图像集合中的图像数量大于或等于所述第一数量阈值,获取所述图像集合;
响应于存储的所述特征集合中的特征数量大于或等于所述第二数量阈值,获取所述特征集合。
10.根据权利要求1至3任一项所述的图像识别方法,其特征在于,所述基于所述待识别图像、所述第一模板以及所述第二模板,得到所述待识别图像对应的识别结果,包括:
获取所述待识别图像或所述待识别图像的特征,与所述第一模板的第三相似度,以及与所述第二模板的第四相似度;
响应于与所述第一模板的第三相似度大于或等于与所述第二模板的第四相似度,确定所述识别结果为所述待识别图像与所述参考图像匹配;
响应于与所述第一模板的第三相似度小于与所述第二模板的第四相似度,确定所述识别结果为所述待识别图像与所述参考图像不匹配。
11.根据权利要求1所述的图像识别方法,其特征在于,还包括:
响应于所述待识别图像未与所述第一模板呈所述特定关系,和/或不存在与所述第一模板匹配的第二模板,基于所述待识别图像和所述第一模板,得到所述待识别图像对应的识别结果。
12.根据权利要求1至3任一项所述的图像识别方法,其特征在于,所述参考图像为身份识别、解锁和支付中至少一项功能进行图像比对所使用的底库图像,或进行图像比对所使用的底库特征对应的图像。
13.根据权利要求12所述的图像识别方法,其特征在于,还包括如下至少一项:
在所述参考图像为所述身份识别功能进行图像比对所使用的底库图像,或进行图像比对所使用的底库特征对应的图像的情况下,响应于所述识别结果为所述待识别图像与所述参考图像匹配,输出用于表征身份识别结果为通过身份认证的内容;
在所述参考图像为所述解锁功能进行图像比对所使用的底库图像,或进行图像比对所使用的底库特征对应的图像的情况下,响应于所述识别结果为所述待识别图像与所述参考图像匹配,解锁屏幕和/或解锁指定功能的操作权限;
在所述参考图像为所述支付功能进行图像比对所使用的底库图像,或进行图像比对所使用的底库特征对应的图像的情况下,响应于所述识别结果为所述待识别图像与所述参考图像匹配,向目标账户支付。
14.一种图像识别装置,其特征在于,所述装置包括:
第一获取模块,用于获取待识别图像;
第二获取模块,用于响应于所述待识别图像与第一模板呈特定关系,获取与所述第一模板匹配的第二模板,所述第一模板为用于图像识别的参考图像或所述参考图像的特征,且所述第一模板与所述第二模板满足预设相似关系,所述第一模板与所述第二模板分别为不同用户的模板;
识别模块,用于基于所述待识别图像、所述第一模板以及所述第二模板,得到所述待识别图像对应的识别结果。
15.一种电子设备,其特征在于,所述电子设备包括存储器、处理器,所述存储器用于存储可在处理器上运行的计算机指令,所述处理器用于在执行所述计算机指令时基于权利要求1至13中任一项所述的图像识别方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至13中任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110729630.2A CN113269154B (zh) | 2021-06-29 | 2021-06-29 | 一种图像识别方法、装置、设备及存储介质 |
PCT/CN2022/082935 WO2023273437A1 (zh) | 2021-06-29 | 2022-03-25 | 一种图像识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110729630.2A CN113269154B (zh) | 2021-06-29 | 2021-06-29 | 一种图像识别方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113269154A CN113269154A (zh) | 2021-08-17 |
CN113269154B true CN113269154B (zh) | 2023-10-24 |
Family
ID=77236312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110729630.2A Active CN113269154B (zh) | 2021-06-29 | 2021-06-29 | 一种图像识别方法、装置、设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113269154B (zh) |
WO (1) | WO2023273437A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113269154B (zh) * | 2021-06-29 | 2023-10-24 | 北京市商汤科技开发有限公司 | 一种图像识别方法、装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101142584A (zh) * | 2005-02-21 | 2008-03-12 | 三菱电机株式会社 | 面部特征检测的方法 |
CN105654048A (zh) * | 2015-12-30 | 2016-06-08 | 四川川大智胜软件股份有限公司 | 一种多视角人脸比对方法 |
WO2020038136A1 (zh) * | 2018-08-24 | 2020-02-27 | 深圳前海达闼云端智能科技有限公司 | 面部识别方法、装置、电子设备及计算机可读介质 |
CN112818896A (zh) * | 2021-02-18 | 2021-05-18 | 支付宝(杭州)信息技术有限公司 | 生物识别方法、装置和电子设备 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI410879B (zh) * | 2009-01-23 | 2013-10-01 | Ind Tech Res Inst | 影像辨識與輸出方法以及其系統 |
CN109446904B (zh) * | 2018-09-25 | 2024-06-21 | 中国平安人寿保险股份有限公司 | 排队取号方法、装置、计算机设备及存储介质 |
CN111191655B (zh) * | 2018-11-14 | 2024-04-16 | 佳能株式会社 | 对象识别方法和装置 |
CN112860931B (zh) * | 2021-01-18 | 2023-11-03 | 广东便捷神科技股份有限公司 | 人脸识别库的构建方法 |
CN113269154B (zh) * | 2021-06-29 | 2023-10-24 | 北京市商汤科技开发有限公司 | 一种图像识别方法、装置、设备及存储介质 |
CN113705366A (zh) * | 2021-08-06 | 2021-11-26 | 中科恒运股份有限公司 | 人员管理系统身份识别方法、装置及终端设备 |
-
2021
- 2021-06-29 CN CN202110729630.2A patent/CN113269154B/zh active Active
-
2022
- 2022-03-25 WO PCT/CN2022/082935 patent/WO2023273437A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101142584A (zh) * | 2005-02-21 | 2008-03-12 | 三菱电机株式会社 | 面部特征检测的方法 |
CN105654048A (zh) * | 2015-12-30 | 2016-06-08 | 四川川大智胜软件股份有限公司 | 一种多视角人脸比对方法 |
WO2020038136A1 (zh) * | 2018-08-24 | 2020-02-27 | 深圳前海达闼云端智能科技有限公司 | 面部识别方法、装置、电子设备及计算机可读介质 |
CN112818896A (zh) * | 2021-02-18 | 2021-05-18 | 支付宝(杭州)信息技术有限公司 | 生物识别方法、装置和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2023273437A1 (zh) | 2023-01-05 |
CN113269154A (zh) | 2021-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112329619B (zh) | 一种人脸识别方法、装置、电子设备及可读存储介质 | |
CN109117879B (zh) | 图像分类方法、装置及系统 | |
CN109284675B (zh) | 一种用户的识别方法、装置及设备 | |
CN113366487A (zh) | 基于表情组别的操作确定方法、装置及电子设备 | |
CN112257808B (zh) | 用于零样本分类的集成协同训练方法、装置及终端设备 | |
CN110414550B (zh) | 人脸识别模型的训练方法、装置、系统和计算机可读介质 | |
CN111814655A (zh) | 目标重识别方法及其网络训练方法、相关装置 | |
CN112818995B (zh) | 图像分类方法、装置、电子设备及存储介质 | |
US10997609B1 (en) | Biometric based user identity verification | |
WO2012145273A1 (en) | Systems and methods for automatically determining an improved view for a visual query in a mobile search | |
CN113490947A (zh) | 检测模型训练方法、装置、检测模型使用方法及存储介质 | |
KR20190115509A (ko) | 자동 수어 인식 방법 및 시스템 | |
CN111753091A (zh) | 分类方法、分类模型的训练方法、装置、设备及存储介质 | |
CN113902944A (zh) | 模型的训练及场景识别方法、装置、设备及介质 | |
CN113269154B (zh) | 一种图像识别方法、装置、设备及存储介质 | |
CN115393606A (zh) | 图像识别的方法和系统 | |
CN111814846A (zh) | 属性识别模型的训练方法、识别方法及相关设备 | |
CN104850855B (zh) | 计算置信度的方法和装置 | |
US11367311B2 (en) | Face recognition method and apparatus, server, and storage medium | |
CN110717817A (zh) | 贷前审核方法及装置、电子设备和计算机可读存储介质 | |
WO2023273227A1 (zh) | 指甲识别方法、装置、设备及存储介质 | |
CN118119935A (zh) | 图像文本匹配模型的训练方法、装置、设备及存储介质 | |
CN113723111B (zh) | 一种小样本意图识别方法、装置、设备及存储介质 | |
CN115222991A (zh) | 分类模型的训练方法、图像分类方法、装置及电子设备 | |
CN117828137A (zh) | 数据查询方法、装置、存储介质及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40049959 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |