CN113362096A - 一种基于深度学习的框架广告图像匹配方法 - Google Patents
一种基于深度学习的框架广告图像匹配方法 Download PDFInfo
- Publication number
- CN113362096A CN113362096A CN202010149359.0A CN202010149359A CN113362096A CN 113362096 A CN113362096 A CN 113362096A CN 202010149359 A CN202010149359 A CN 202010149359A CN 113362096 A CN113362096 A CN 113362096A
- Authority
- CN
- China
- Prior art keywords
- advertisement
- deep
- calculating
- image matching
- method based
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000013135 deep learning Methods 0.000 title claims abstract description 13
- 239000013598 vector Substances 0.000 claims abstract description 27
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 12
- 230000006870 function Effects 0.000 claims description 4
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000012549 training Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000000926 separation method Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Development Economics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Accounting & Taxation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Evolutionary Biology (AREA)
- Game Theory and Decision Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于深度学习的框架广告图像匹配方法,包括:S1、建立图片数据集;S2、用深度卷积神经网络为图片数据集中的每张图片算得低维空间的嵌入向量作为深度广告特征,深度广告特征中包含广告内容的区分信息;S3、随机挑选两张广告图片并算得深度广告特征,计算这两个深度广告特征的余弦相似度,根据预先定义的阈值,判断两个广告是否匹配;S4、另选两张新广告图片,重复上述步骤S3。本发明技术方案的有益效果是:提高图像匹配识别的准确率:从98.2%提高到99%;降低人工识别照片量:从198w张/年降低到110w/年。
Description
技术领域
本发明属于将图像识别匹配技术应用于信息传播领域,具体涉及一种基于深度学习的框架广告图像匹配方法。
背景技术
由于广告传媒业务的发展,每周都有大量的广告方案在小区电梯内投放,而且投放周期不断缩短,如何正确识别和分类这些版位的广告方案面临巨大挑战。传统方法中广告方案识别全是由人工来操作,花费了大量的人力。而且因为照片更换周期短,就需要在很短的时间内完成大量的照片识别分类任务,往往准确率得不到保障。在此基础上,如果能研制出一种能准确的对工人拍摄的照片进行自动识别和匹配的系统,那将会是一件非常有意义的工作,并将极大地提高工作效率。
近些年,计算机视觉技术的日趋成熟,为传统的识别方法带来重大转变。先进的计算机视觉技术,不但可以将人力从繁琐的人工识别匹配中解放出来,而且能够大大提高精确度,广告识别系统就是在这样的背景下开发的。广告识别系统基于深度学习方法来自动进行图像匹配,不但降低了人工带来的误差,还能解放部分人力,更大发挥其价值。传统的自动匹配系统基于特征点(SIFT)匹配,用SIFT提取特征,根据特征点进行匹配,若匹配到特征点对数量满足特定阈值,则认为匹配成功;若不满足,认为匹配失败(参见附图1)。作为类似参考,CN 106066887B公开了一种广告序列图像快速检索和分析方法,该方法为:利用图像复杂度特征和决策分类树的方法,对广告图像数据库分为LOGO和场景图像;其次,对广告数据库中图像提取和存储HOG特征和SIFT特征;提取待匹配图像的HOG特征和SIFT特征,计算待匹配图像与广告数据库中所有与其相同类型图像的HOG特征向量的欧氏距离,并对其欧氏距离由小到大进行排序,筛选出其前S张候选图像;计算其与待匹配图像的SIFT特征匹配点对数并将对数最多的图像作为待匹配图像所对应的图像;针对广告序列的待匹配图像,计算每段广告的时长,获得广告播放信息。上述方法主要有两点不足:1、当不同广告方案内容大部分相同时匹配准确度低。例如附图2中的“我爱我家”广告,不同的方案只有业务员信息有差异,传统方法出现匹配到的特征点数量高于阈值,从而错误地判断为成功匹配的情况(实际是不同的方案);2、无法准确检测倒置的广告内容。在上刊倒置的情况下,因为是同一张图,传统方法仍然可以匹配到大量特征点对,导致匹配特征点对的数量超过阈值,返回错误的匹配结果(参见附图3)。
发明内容
有鉴于此,本发明的目的是提供一种基于深度学习的框架广告图像匹配方法,把拍摄的照片与其对应的广告方案进行匹配,从而确保广告被精准地投放到指定位置,以解决现有技术中的不足。
为了达到上述目的,本发明的目的是通过下述技术方案实现的:
提供一种基于深度学习的框架广告图像匹配方法,其中,包括:
S1、建立图片数据集;
S2、用深度卷积神经网络为图片数据集中的每张图片算得低维空间的嵌入向量作为深度广告特征,深度广告特征中包含广告内容的区分信息;
S3、随机挑选两张广告图片并算得深度广告特征,计算这两个深度广告特征的余弦相似度,根据预先定义的阈值,判断两个广告是否匹配;
S4、另选两张新广告图片,重复上述步骤S3。
上述基于深度学习的框架广告图像匹配方法,其中,采用Softmax作为损失函数训练深度卷积神经网络,得到图片的特征向量,同时采用Large-Margin Softmax Loss方法减小权值向量和特征向量之间的夹角。
上述基于深度学习的框架广告图像匹配方法,其中,在Softmax的w*x基础上,将特征向量x做归一化,并乘以尺度因子进行放大:
其中,w为权值向量,α为尺度因子。
z=α·y
本发明技术方案的有益效果是:
--提高图像匹配识别的准确率:从98.2%提高到99%(准确度提高了0.8%,错误率降低了44.4%);
--降低人工识别照片量:从198w张/年降低到110w/年。
附图说明
图1为传统的特征点匹配技术示意图;
图2为只存在局部细微变化的待识别广告示意图;
图3为倒置图片特征点匹配示意图;
图4为本发明匹配方法流程示意图;
图5为本发明匹配与不匹配图片对夹角分布图;
图6为MNIST上10个数字图片的特征区分度示意图;
图7为Large-Margin Softmax Loss算法流程示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
参看图4所示,本发明基于深度学习的框架广告图像匹配方法,包括下列步骤:
S1、建立图片数据集。可以收集过去一年的框架小样图和上刊照,共计9935个方案,373471张照片。随机抽取5000组匹配照片和5000组不匹配照片经人工勘误后作为验证集,其他作为训练集。
S2、用深度卷积神经网络(CNN)为图片数据集中的每张图片算得低维空间(512维)的嵌入向量(Embedding)作为深度广告特征,深度广告特征中包含广告内容的区分信息。
S3、随机挑选两张广告图片并算得深度广告特征,计算这两个深度广告特征的余弦相似度,根据预先定义的阈值,判断两个广告是否匹配。把广告图片验证集随机选择匹配(1)和不匹配(0)的等量的广告图片对,每对图片计算特征,然后算得向量内积,再用反余弦函数得到夹角θ。可以得到如图5所示的匹配与不匹配图片对夹角分布图,呈现拟合正态分布曲线,同时显示与算法对应的均值μ和标准差σ。具体数值如下表1:
表1
阈值(度) | mu_0 | sigma_0 | mu_1 | sigma_1 |
23.0420 | 42.4932 | 6.7359 | 9.6546 | 3.5097 |
影响匹配准备度的核心,在于深度卷积神经网络是否可以得到高区分度广告特征。此处以“超多分类”这样一种比较难的任务训练卷积神经网络(CNN),强迫网络在第一个全连接层(FC层)形成比较紧凑的,判别力很强的深度广告特征,用于之后的广告识别。
使用Softmax作为损失函数训练CNN,可以得到图片的特征向量。MNIST上10分类的2维特征映射可视化如图6,不同类别明显分开了,但这种情况并不满足广告识别中特征向量对比的需求。特征向量相似度计算常用余弦距离(cosine distance),余弦越大,余弦距离(夹角)越小,向量相似度越高。对于广告识别的特征映射(feature embedding)来说,Softmax鼓励不同类别的特征分开,但并不鼓励特征分离很多。
Softmax训练的深度特征会把整个超空间或者超球,按照分类个数进行划分,保证类别是可分的,这一点对多分类任务如MNIST和ImageNet非常合适,因为测试类别必定在训练类别中。但Softmax并不要求类内紧凑和类间分离,这一点非常不适合广告识别任务,因为训练集的1W广告数,相对测试集大量的广告来说,非常微不足道,而不可能拿到所有广告的训练样本。特别的,一般还要求训练集和测试集不重叠。所以需要改造Softmax,除了保证可分性外,还要做到特征向量类内尽可能紧凑,类间尽可能分离。
因此,采用了大边距(Large Margin)的方法,让权值向量W和特征向量f之间的夹角更小。具体讲,使用了如下方法:
在Softmax的w*x基础上,将特征向量x做归一化,并乘尺度因子进行放大:
z=α·y
尺度因子α使用固定值64。权值和特征归一化使得CNN更加集中在优化夹角上,得到的深度广告特征更加分离。
特征归一化后,特征向量都固定映射到半径为1的超球上,便于理解和优化。但这样也压缩了特征表达的空间;乘以尺度因子α,相当于将超球的半径放大到α,超球变大,特征表达的空间也更大了(半径越大球的表面积越大)。另外特征归一化后,广告识别计算特征向量的相似度,L2距离和余弦距离意义等价,计算量相同,更加便利。
在此基础上,使用了加性边距(Additive Margin)。比如广告特征xi与对应权值W的夹角为θ,在它基础上加一个固定值m(0.5)。如图7所示,这么做的结果把特征从权值处“推远”了,从而加大了分类任务的难度,让得到的特征更加内聚。
S4、另选两张新广告图片,重复上述步骤S3。基于特征夹角θ,和上述参数,就可以算出这对图片匹配的概率,具体代码参考如下:
def get_prob(theta):
prob_0=norm.pdf(theta,mu_0,sigma_0)
prob_1=norm.pdf(theta,mu_1,sigma_1)
total=prob_0+prob_1
return prob_1/total
本发明技术方案提高了图像匹配识别的准确率:从98.2%提高到99%(准确度提高了0.8%,错误率降低了44.4%),同时降低了人工识别照片量:从198w张/年降低到110w/年。
以上仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。
Claims (3)
1.一种基于深度学习的框架广告图像匹配方法,其特征在于,包括:
S1、建立图片数据集;
S2、用深度卷积神经网络为图片数据集中的每张图片算得低维空间的嵌入向量作为深度广告特征,深度广告特征中包含广告内容的区分信息;
S3、随机挑选两张广告图片并算得深度广告特征,计算这两个深度广告特征的余弦相似度,根据预先定义的阈值,判断两个广告是否匹配;
S4、另选两张新广告图片,重复上述步骤S3。
2.如权利要求1所述基于深度学习的框架广告图像匹配方法,其特征在于,采用Softmax作为损失函数训练深度卷积神经网络,得到图片的特征向量,同时采用Large-Margin Softmax Loss方法减小权值向量和特征向量之间的夹角。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010149359.0A CN113362096A (zh) | 2020-03-04 | 2020-03-04 | 一种基于深度学习的框架广告图像匹配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010149359.0A CN113362096A (zh) | 2020-03-04 | 2020-03-04 | 一种基于深度学习的框架广告图像匹配方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113362096A true CN113362096A (zh) | 2021-09-07 |
Family
ID=77523871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010149359.0A Pending CN113362096A (zh) | 2020-03-04 | 2020-03-04 | 一种基于深度学习的框架广告图像匹配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113362096A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114529713A (zh) * | 2022-01-14 | 2022-05-24 | 电子科技大学 | 一种基于深度学习的水下图像增强方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106529996A (zh) * | 2016-10-24 | 2017-03-22 | 北京百度网讯科技有限公司 | 基于深度学习的广告展示方法和装置 |
CN108062575A (zh) * | 2018-01-03 | 2018-05-22 | 广东电子工业研究院有限公司 | 一种高相似度图像识别与分类方法 |
CN108549883A (zh) * | 2018-08-06 | 2018-09-18 | 国网浙江省电力有限公司 | 一种人脸再识别方法 |
CN108846694A (zh) * | 2018-06-06 | 2018-11-20 | 厦门集微科技有限公司 | 一种电梯广告投放方法和装置、计算机可读存储介质 |
CN108960258A (zh) * | 2018-07-06 | 2018-12-07 | 江苏迪伦智能科技有限公司 | 一种基于自学习深度特征的模板匹配方法 |
CN109800306A (zh) * | 2019-01-10 | 2019-05-24 | 深圳Tcl新技术有限公司 | 意图分析方法、装置、显示终端及计算机可读存储介质 |
WO2019128367A1 (zh) * | 2017-12-26 | 2019-07-04 | 广州广电运通金融电子股份有限公司 | 基于Triplet Loss的人脸认证方法、装置、计算机设备和存储介质 |
WO2020015075A1 (zh) * | 2018-07-18 | 2020-01-23 | 平安科技(深圳)有限公司 | 人脸图像比对方法、装置、计算机设备及存储介质 |
CN110781917A (zh) * | 2019-09-18 | 2020-02-11 | 北京三快在线科技有限公司 | 重复图像的检测方法、装置、电子设备及可读存储介质 |
-
2020
- 2020-03-04 CN CN202010149359.0A patent/CN113362096A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106529996A (zh) * | 2016-10-24 | 2017-03-22 | 北京百度网讯科技有限公司 | 基于深度学习的广告展示方法和装置 |
WO2019128367A1 (zh) * | 2017-12-26 | 2019-07-04 | 广州广电运通金融电子股份有限公司 | 基于Triplet Loss的人脸认证方法、装置、计算机设备和存储介质 |
CN108062575A (zh) * | 2018-01-03 | 2018-05-22 | 广东电子工业研究院有限公司 | 一种高相似度图像识别与分类方法 |
CN108846694A (zh) * | 2018-06-06 | 2018-11-20 | 厦门集微科技有限公司 | 一种电梯广告投放方法和装置、计算机可读存储介质 |
CN108960258A (zh) * | 2018-07-06 | 2018-12-07 | 江苏迪伦智能科技有限公司 | 一种基于自学习深度特征的模板匹配方法 |
WO2020015075A1 (zh) * | 2018-07-18 | 2020-01-23 | 平安科技(深圳)有限公司 | 人脸图像比对方法、装置、计算机设备及存储介质 |
CN108549883A (zh) * | 2018-08-06 | 2018-09-18 | 国网浙江省电力有限公司 | 一种人脸再识别方法 |
CN109800306A (zh) * | 2019-01-10 | 2019-05-24 | 深圳Tcl新技术有限公司 | 意图分析方法、装置、显示终端及计算机可读存储介质 |
CN110781917A (zh) * | 2019-09-18 | 2020-02-11 | 北京三快在线科技有限公司 | 重复图像的检测方法、装置、电子设备及可读存储介质 |
Non-Patent Citations (13)
Title |
---|
"人脸识别的LOSS(下)", pages 2, Retrieved from the Internet <URL:https://zhuanlan.zhihu.com/p/34436551> * |
PEANUT_范: "AM-Softmax Loss", pages 1, Retrieved from the Internet <URL:https://blog.csdn.net/u013841196/article/details/89920902> * |
刘施乐;: "基于深度学习的人脸识别技术研究", 电子制作, no. 24 * |
孙洁;丁笑君;杜磊;李秦曼;邹奉元;: "基于卷积神经网络的织物图像特征提取与检索研究进展", 纺织学报, no. 12 * |
张惠凡等: "基于卷积神经网络的鸟类视频图像检索研究", 科研信息化技术与应用, vol. 8, no. 5, pages 50 * |
彭晏飞;高艺;杜婷婷;桑雨;訾玲玲;: "生成对抗网络的单图像超分辨率重建方法", 计算机科学与探索, no. 09 * |
彭骋;: "基于深度学习的图像检索系统", 通讯世界, no. 06 * |
有三AI: "一文道尽softmax loss及其变种", pages 3, Retrieved from the Internet <URL:https://blog.csdn.net/u013841196/article/details/89920902> * |
李振东;钟勇;曹冬平;: "深度卷积特征向量用于快速人脸图像检索", 计算机辅助设计与图形学学报, no. 12 * |
李振东;钟勇;陈蔓;曹冬平;: "基于深度特征的快速人脸图像检索方法", 光学学报, no. 10 * |
邓建国;张素兰;张继福;荀亚玲;刘爱琴;: "监督学习中的损失函数及应用研究", 大数据, no. 01 * |
黄旭;凌志刚;李绣心;: "融合判别式深度特征学习的图像识别算法", 中国图象图形学报, no. 04 * |
龚锐;丁胜;章超华;苏浩;: "基于深度学习的轻量级和多姿态人脸识别方法", 计算机应用, no. 03 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114529713A (zh) * | 2022-01-14 | 2022-05-24 | 电子科技大学 | 一种基于深度学习的水下图像增强方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102414680B (zh) | 利用跨域知识的语义事件检测 | |
US8358856B2 (en) | Semantic event detection for digital content records | |
CN104732413B (zh) | 一种智能个性化视频广告推送方法及系统 | |
CN103699523B (zh) | 产品分类方法和装置 | |
CN108733778B (zh) | 对象的行业类型识别方法和装置 | |
Tarawneh et al. | Invoice classification using deep features and machine learning techniques | |
EP2808827A1 (en) | System and method for OCR output verification | |
WO2017016240A1 (zh) | 一种钞票冠字号识别方法 | |
CN102542058A (zh) | 一种融合全局与局部视觉特征的层次化地标识别方法 | |
CN109376796A (zh) | 基于主动半监督学习的图像分类方法 | |
CN105389593A (zh) | 基于surf特征的图像物体识别方法 | |
CN106845358A (zh) | 一种手写体字符图像特征识别的方法及系统 | |
Gordo et al. | Document classification and page stream segmentation for digital mailroom applications | |
CN111340032A (zh) | 一种基于金融领域应用场景的字符识别方法 | |
CN114357307A (zh) | 一种基于多维度特征的新闻推荐方法 | |
CN110442736B (zh) | 一种基于二次判别分析的语义增强子空间跨媒体检索方法 | |
CN115062186A (zh) | 一种视频内容检索方法、装置、设备以及存储介质 | |
CN113362096A (zh) | 一种基于深度学习的框架广告图像匹配方法 | |
CN110020638A (zh) | 人脸表情识别方法、装置、设备和介质 | |
CN114495139A (zh) | 一种基于图像的作业查重系统及方法 | |
CN109472307A (zh) | 一种训练图像分类模型的方法和装置 | |
CN113657377A (zh) | 一种机打票据图像结构化识别方法 | |
CN110728240A (zh) | 一种对电子卷宗的标题自动识别的方法及装置 | |
TWI761090B (zh) | 對話資料處理系統、其方法及電腦可讀媒介 | |
CN104778478A (zh) | 一种手写数字识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210907 |