Nothing Special   »   [go: up one dir, main page]

CN114630314B - 终端信息库的更新方法、装置、设备及存储介质 - Google Patents

终端信息库的更新方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114630314B
CN114630314B CN202011455922.3A CN202011455922A CN114630314B CN 114630314 B CN114630314 B CN 114630314B CN 202011455922 A CN202011455922 A CN 202011455922A CN 114630314 B CN114630314 B CN 114630314B
Authority
CN
China
Prior art keywords
terminal information
terminal
imei
tac
information base
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011455922.3A
Other languages
English (en)
Other versions
CN114630314A (zh
Inventor
沈洁
杨静
余钦水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Suzhou Software Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Suzhou Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Suzhou Software Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202011455922.3A priority Critical patent/CN114630314B/zh
Publication of CN114630314A publication Critical patent/CN114630314A/zh
Application granted granted Critical
Publication of CN114630314B publication Critical patent/CN114630314B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/18Processing of user or subscriber data, e.g. subscribed services, user preferences or user profiles; Transfer of user or subscriber data
    • H04W8/20Transfer of user or subscriber data
    • H04W8/205Transfer to or from user equipment or user record carrier
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/22Processing or transfer of terminal data, e.g. status or physical capabilities
    • H04W8/24Transfer of terminal data

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请公开了一种终端信息库的更新方法、装置、设备及存储介质,其中,所述方法包括:基于获取的国际移动设备识别码IMEI信息画像表确定满足预设条件的目标终端标识号码TAC;获取序列号SNR,并根据所述目标TAC和所述SNR确定校验码,其中所述SNR为随机生成的数字或者为预设数字;根据所述目标TAC、所述SNR和所述校验码生成脱敏IMEI;根据所述脱敏IMEI从外网终端信息库获取所述脱敏IMEI对应的终端信息,以对自身的终端信息库进行更新。如此在保证信息安全的情况下,实现对电信运营商自身的终端信息库进行更新,进而提升终端品牌和型号的识别率和覆盖率。

Description

终端信息库的更新方法、装置、设备及存储介质
技术领域
本申请例涉及信息技术领域,涉及但不限于一种终端信息库的更新方法、装置、设备及存储介质。
背景技术
随着移动互联网的高速发展和智能终端的快速普及,以手机为代表的移动终端,已经成为绝大多数人日常生活中必不可少的部分,其扮演的角色也远远超出了通讯工具这个范畴。不同的终端品牌和型号所支持的业务资源和应用是不同的。针对不同的终端品牌和型号,为该终端提供适合该设备型号的服务是非常有必要的。但是根据相关规定,手机的国际移动设备识别码(IMEI,International Mobile Equipment Identity)是开放给电信运营商的,电信运营商如何利用好这些数据,提升终端品牌和型号的整体识别率和覆盖率,同时兼顾数据安全和用户隐私是亟待解决的问题。
在相关技术中,运营商可以通过解析终端上网信令中携带的UA信息、IMEI信息或者TAC信息等解析终端品牌和型号,但是通过该方案无法规避数据采集不完整、数据解析不准确,以及数据质量无保证等问题,得到的终端品牌和型号整体覆盖率和数据质量无法保证。在相关技术中,也可以通过WAP网关中的用户手机信息、终端上网过程中产生的HTTP信令数据、网络中移动终端的通信话单等底层信令数据查询到UA信息与终端品牌型号的对应关系,并识别出终端品牌型号,从而更新终端信息库,该方案需要获取的数据规模巨大,全量获取难度很高。原始数据的采集、清洗和预处理等过程都需要占用大量的存储资源和计算资源。
发明内容
有鉴于此,本申请提供一种终端信息库的更新方法、装置、设备及存储介质。
本申请的技术方案是这样实现的:
本申请提供一种终端信息库的更新方法,所述方法包括:
基于获取的国际移动设备识别码IMEI信息画像表确定满足预设条件的目标终端标识号码TAC;
获取序列号SNR,并根据所述目标TAC和所述SNR确定校验码,其中所述SNR为随机生成的数字或者为预设数字;
根据所述目标TAC、所述SNR和所述校验码生成脱敏IMEI;
根据所述脱敏IMEI从外网终端信息库获取所述脱敏IMEI对应的终端信息,以对自身的终端信息库进行更新。
本申请提供一种终端信息库的更新装置,所述装置包括:
第一确定模块,用于基于获取的国际移动设备识别码IMEI信息画像表确定满足预设条件的目标终端标识号码TAC;
第一获取模块,用于获取序列号SNR,并根据所述目标TAC和所述SNR确定校验码,其中所述SNR为随机生成的数字或者为预设数字;
生成模块,用于根据所述目标TAC、所述SNR和所述校验码生成脱敏IMEI;
第二获取模块,用于根据所述脱敏IMEI从外网终端信息库获取所述脱敏IMEI对应的终端信息,以对自身的终端信息库进行更新。
本申请提供一种终端信息库的更新设备,所述设备至少包括:
处理器;以及
存储器,用于存储可在所述处理器上运行的计算机程序;
其中,所述计算机程序被处理器执行时实现上述终端信息库的更新方法的步骤。
本申请提供一种计算机可读存储介质,所述计算机存储介质中存储有计算机可执行指令,该计算机可执行指令配置为执行上述终端信息库的更新方法的步骤。
本申请提供一种终端信息库的更新方法、装置、设备及存储介质,通过基于IMEI信息画像表确定满足预设条件的目标TAC,然后基于该目标TAC构建脱敏IMEI,通过脱敏IMEI从外网终端信息库获取该脱敏IMEI对应的终端信息,以实现对自身的终端信息库进行更新,从而在保证信息安全的前提下,实现对电信运营商自身的终端信息库进行更新,进而提升终端品牌和型号的识别率和覆盖率。
附图说明
在附图(其不一定是按比例绘制的)中,相似的附图标记可在不同的视图中描述相似的部件。附图以示例而非限制的方式大体示出了本文中所讨论的各个实施例。
图1为本申请实施例提供的终端信息库的更新方法的一种实现流程示意图;
图2为本申请实施例提供的构建自身的终端信息库的流程示意图;
图3本申请实施例提供的终端信息库的更新方法的另一种实现流程示意图;
图4为本申请实施例提供的构建自有终端数据库的流程示意图;
图5为本申请实施例提供的拓展终端信息库的构建流程示意图;
图6为本申请实施例提供的终端信息库的更新装置结构示意图;
图7为本申请实施例提供的终端信息库的更新设备的组成结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
如果申请文件中出现“第一\第二\第三”的类似描述则增加以下的说明,在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
为了更好地理解本申请实施例中提供的终端信息库的更新方法、装置、设备及存储介质,首先,对相关技术中的识别终端品牌和型号方法存在的问题进行分析说明。相关技术中,识别终端品牌和型号的实现方案主要包括以下几种:
方案一:从无线应用协议(WAP,Wireless Application Protocol)网关中获取用户的手机信息,包括手机号码和用户代理(UA,User Agent)信息,并查询所获取到的UA信息与终端品牌型号的对应关系;从网络服务器中获取用户信息,包括用户的IMSI、手机号码和正在使用的IMEI,并查询所获取到的IMEI与终端品牌型号的对应关系;以及校验及识别步骤:对上述两个查询结果进行校验,并输出最终的终端识别结果,完成终端识别。
方案二:根据预定时间段内网络中移动终端的通信话单,建立移动终端的用户标识与IMEI之间的第一对应关系表;根据预定时间段内网络中移动终端的数据通信话单,建立移动终端的用户标识与终端型号之间的第二对应关系表;关联第一、第二对应关系表中具有相同用户标识的对应关系,生成用户标识、型号核准号码(TAC,Type AllocationCode)和终端型号之间的第三对应关系表;根据所述第三对应关系表,统计得到相同TAC对应的各种终端型号的数量分布比例,作为该TAC对应于各种终端型号的可信度参数。
方案三:首先对移动通信网络的核心信令数据进行采集,所述信令数据包括含有User-Agent字段的超文本传输协议(HTTP,Hyper Text Transfer Protocol)信令流程;之后,解码所采集的信令数据,并提取其中HTTP信令流程中的User-Agent字段;之后,对于包含终端类型的User-Agent字段,从中解析出对应的终端类型。
但是相关技术中的终端品牌和型号的识别方法,主要存在以下问题:
方案一和方案三中的建模数据源主要是WAP网关中的用户手机信息、终端上网过程中产生的HTTP信令数据、网络中移动终端的通信话单等底层信令数据,数据规模巨大,全量获取难度很高。原始数据的采集、清洗和预处理等过程都需要占用大量的存储资源和计算资源。而且直接采集底层通信数据,没有利用现有业务系统中已经建设成熟的业务数据,很多数据预处理过程被重复计算,造成了数据资源、网络资源、软件和硬件等资源的浪费,而且方案一和方案三没有与现有数据系统建立关联,输出结果无法进一步论证。方案一和方案三基本都依赖基于人工建立的终端信息数据库,即采集、解析完毕的信令数据,要与已有的终端信息数据库进行关联比对才能识别出终端品牌和型号,而终端信息数据库一般都是按照月度周期进行更新的,基于此方法获取的终端品牌和型号信息往往都不是最新的。
方案一和方案二中通过解析终端上网信令中携带的UA信息、IMEI信息或者TAC信息等解析终端品牌和型号,无法规避数据采集不完整、数据解析不准确,以及数据质量无保证等问题,得到的终端品牌和型号整体覆盖率和数据质量无法保证。
方案一、方案二和方案三在使用IMEI识别终端品牌和型号时,没有考虑数据的安全性问题,即没有对IMEI号码进行加密或者转换等脱敏处理,这样导致用户的IMEI号码是完全暴露出来的,不符合对用户隐私安全的管理要求。
基于相关技术所存在的问题,本申请实施例提供一种终端信息库的更新方法,所述方法应用于终端信息库的更新设备。本实施例提供的方法可以通过计算机程序来实现,该计算机程序在执行的时候,完成本实施例提供的终端信息库的更新方法中各个步骤。在一些实施例中,该计算机程序可以被终端信息库的更新设备中的处理器执行。图1为本申请实施例提供的终端信息库的更新方法的一种实现流程示意图,如图1所示,所述方法包括:
步骤S101,终端信息库的更新设备基于获取的IMEI信息画像表确定满足预设条件的目标终端标识号码TAC。
本申请实施例中,所述IMEI信息画像表是运营商自有业务系统中的,示例性地,表1为本申请实施例提供的IMEI信息画像表,如表1所示,通常IMEI信息画像表包括字段名称、字段类型及字段中文名,当然运营商可以对该IMEI信息画像表中提取的字段进行设置。表1提供的IMEI信息画像表只是一种示例,但是,在IMEI信息画像表都包括手机号码和IMEI号码。因此,可以从IMEI信息画像表包括手机号码和IMEI之间的映射关系。
表1为IMEI信息画像表
字段名称 字段类型 字段中文名
row_num BIGINT 行号
statis_date STRING 统计时间
msisdn STRING 手机号码
imei STRING IMEI号码
call_qty INT 终端使用次数
oln_dur INT 终端使用时长(月)
statis_m STRING 日期(分区)
根据目前IMEI号码的组成特点可知,IMEI号码的前面8位是TAC号码,TAC为型号核准号码,也即为手机品牌和型号的编码。通过获取IMEI与手机号码之间的映射关系可以得到TAC号码与手机号码之间的映射关系。本申请实施例中,确定满足预设条件的TAC在实现时,可以是将TAC根据手机号码的数量进行排序,例如可以是将TAC根据手机号码的数量按照从大到小的顺序排序。示例性地,表2为本申请实施例提供的TAC根据手机号码的数量按照从大到小的顺序进行排序得到的排序表:
表2为TAC根据手机号码的按照从大到小的顺序进行排序得到的排序表
TAC 手机号码个数
86521102 1724320
86687402 1658051
86782504 1158963
86659403 1094624
86998503 1079154
86578502 960289
86672203 918689
35231308 861412
86256102 812635
86704704 806355
在本申请实施例中,预设条件可以是对应的手机号码的数量大于预设的数量阈值,根据如图2所示的排序表,可以选取满足预设条件的TAC,也即手机号码的数量大于数量阈值的TAC作为目标TAC。在一些实施例中,预设条件还可以是按照从大到小的顺序进行排序得到的排序表中的前N个TAC,那么根据如图2所示的排序表,也可以选取满足预设条件的目标TAC。
步骤S102,终端信息库的更新设备获取序列号(SNR,Serial Number),并根据所述目标TAC和所述SNR确定校验码,其中,所述SNR为随机生成的数字或者为预设数字。
本申请实施例中,所述SNR也可以叫串号,即代表终端生产顺序号,所述SNR为随机生成的数字或者为预设数字,所述随机生成的数字或者为预设数字没有实际的含义,只是为了满足构造脱敏IMEI的位数。示例性地,所述随机号码可以是123456、234567、000000。当然,在一些实施例中,可以为预设数字,比如都设置成重复数字,如000000。
本申请实施例中,校验码通常是一组数字的最后一位,由目标TAC和SNR通过预设算法得出,用以检验该组数字的正确性。本申请实施例中,所述预设算法为模10算法(Luhn,Luhn algorithm)算法,根据目标TAC和SNR号码通过Luhn算法计算得到校验码。
步骤S103,终端信息库的更新设备根据所述目标TAC、所述SNR和所述校验码生成脱敏IMEI。
本申请实施例中,当得到了目标TAC、SNR和对应的校验码后,可以根据目标TAC、SNR和对应的校验码后生产脱敏IMEI。示例性地,目标TAC为86273103,SNR为000000,校验码为1,即脱敏IMEI为862731030000001。
本申请实施例中,通过生成脱敏IMEI,解决敏感数据泄露的问题,从而符合信息安全相关管理规定,使得该脱敏IMEI可以被第三方使用。
步骤S104,终端信息库的更新设备根据所述脱敏IMEI从外网终端信息库获取所述脱敏IMEI对应的终端信息,以对自身的终端信息库进行更新。
本申请实施例中,外网终端信息库可以是万维网中的终端信息库。根据所述脱敏IMEI从外网终端信息库获取所述脱敏IMEI对应的终端信息在实现时,可以是通过网络爬虫技术从万维网中获取该脱敏IMEI对应的终端信息。本申请实施例中,可以根据该脱敏IMEI和该脱敏IMEI对应的终端信息确定目标TAC和终端信息之间的映射关系,将目标TAC和终端信息之间的映射关系加入到自身的终端数据库中,实现对自身终端信息库的更新。
本申请实施例提供的终端信息库的更新方法,通过基于IMEI信息画像表确定满足预设条件的目标TAC,然后基于该目标TAC构建脱敏IMEI,通过脱敏IMEI从外网终端信息库获取该脱敏IMEI对应的终端信息,从而在保证信息安全的前提下,实现对电信运营商自身的终端信息库进行更新,进而提升电信运营商对终端品牌和型号的识别率和覆盖率。
在一些实施例中,步骤S101“终端信息库的更新设备根据获取的国际移动设备识别码IMEI信息画像表确定满足预设条件的目标TAC”可以通过以下步骤实现:
步骤S1011,终端信息库的更新设备获取IMEI信息画像表。
本申请实施例中,所述IMEI信息画像表的核心信息包括:手机号码、IMEI号码、终端使用次数及使用时长等字段。可以根据IMEI信息画像表确定手机号码和IMEI之间的映射关系。终端信息库的更新设备获取IMEI信息画像表可以是通过采集电信运营商的经营分析系统中的IMEI画像信息表。
步骤S1012,终端信息库的更新设备根据所述IMEI信息画像表确定TAC与手机号码数量的第一对应关系。
本申请实施例中,可以根据手机号码和IMEI之间的映射关系,提取出TAC和手机号码的对应关系,然后统计每个TAC对应的手机号码的数量,进而确定TAC与手机号码的数量的第一对应关系。
步骤S1013,终端信息库的更新设备根据所述第一对应关系确定满足预设条件的目标TAC。
本申请实施例中,可以根据TAC与手机号码的数量的第一对应关系来确定满足预设条件的目标TAC。本申请实施例中,所述满足预设条件可以是大于预设的数量阈值,对应地,将手机号码数量大于预设的数量阈值的TAC确定为目标TAC。在一些实施例中,可以将手机号码按的数量按照从大到小的顺序进行排序,排在前N项的TAC为满足预设条件的TAC,对应地,将前N项对应的TAC确定为目标TAC。
本申请实施例中,确定的目标TAC可以识别出覆盖大多数手机的终端信息。比如通过采集14.12%的TAC,即可识别出覆盖全网95.66%的终端信息,或者采集5.78%的TAC,即可识别出覆盖全网80.7%的终端信息,即利用尽可能少的TAC识别出尽可能多并且准确有效的终端信息。
本申请实施例提供的方法,通过获取IMEI信息画像表,来确定目标TAC,可以减少信令解析和数据预处理等很多中间过程,极大地降低数据采集的成本、减少数据资源的浪费,进而提升了数据处理的速度。
在一些实施例中,步骤S104“终端信息库的更新设备根据所述脱敏IMEI从其他终端信息库获取脱敏IMEI对应的终端信息,以对终端信息库进行更新”可以通过以下步骤实现:
步骤S1041,终端信息库的更新设备从外网终端信息库中获取所述脱敏IMEI中的目标TAC对应的终端信息。
本申请实施例中,可以通过网络爬虫技术从外网终端信息库中获取脱敏IMEI中的目标TAC对应的终端信息。在实现时,以终端信息为对抓取目标,基于IMEI中的目标TAC对网页或数据进行分析与过滤,抓取目标TAC对应的终端信息。示例性地,表3为本申请实施例提供的从外网终端信息库中获取所述脱敏IMEI中的目标TAC对应的终端信息表,如表3所示,表3中至少包括TAC与所述TAC对应的终端信息。本申请实施例中,所述终端信息包括终端品牌和终端信号。
表3为从外网终端信息库中获取目标TAC对应的终端信息表
步骤S1042,终端信息库的更新设备基于所述目标TAC与所述目标TAC对应的终端信息确定拓展终端信息库。
本申请实施例中,可以根据TAC和所述目标TAC对应的终端信息建立拓展终端信息库。承接上面的示例,根据表3建立拓展终端信息库。
步骤S1043,终端信息库的更新设备根据所述拓展终端信息库对自身的所述终端信息库进行更新。
本申请实施例中,可以将拓展终端信息据库中的终端品牌和型号信息,与自有终端信息库进行合并,并对合并后的终端信息库进行数据处理,比如:剔除冗余的重复记录,对大小写不一致、中英文不一致等字符进行格式的统一,进而得到更新后的终端信息库。
本申请实施例提供的终端信息库的更新方法,通过确定目标TAC,使得在从外网进行终端信息查询时,可以减少TAC号码查询数量,充分利用了电信运营商自有的终端信息库和外网终端信息库,有效补充和丰富了自身的终端信息库,提升了终端品牌和型号的整体覆盖率。
在一些实施例中,步骤S1043“终端信息库的更新设备根据所述拓展终端信息库对自身的所述终端信息库进行更新”在实现时可以通过以下步骤实现:
步骤S1043A,终端信息库的更新设备将所述拓展终端信息库和所述终端信息库进行合并,得到合并终端信息库。
本申请实施例中,拓展终端信息库和所述终端信息库都包括TAC和终端信息之间的映射关系,也就是说,拓展终端信息库和所述终端信息中数据的格式是一样的。因此,可以将拓展终端信息库和所述终端信息库进合并,得到合并终端信息库。
步骤S1043B,终端信息库的更新设备将所述合并终端信息库中的数据进行去重处理,得到去重终端信息库。
本申请实施例中,因合并终端信息库中存在大量的重复数据,因此,需要对合并终端信息库的数据进行去重处理,进行去重后得到去重终端信息库,所述去重终端信息库每个TAC与TAC对应的终端信息之间的映射关系只保留一条信息。
步骤S1044C,终端信息库的更新设备对去重终端信息库中数据的字符进行统一格式处理,得到更新后的终端信息库。
由于外网终端信息库中的数据和自身终端信息库中的数据可能存着格式不一致,如:大小写不一致、中英文不一致等字符不统一,因此,本申请实施例中,对去重终端信息库中的数据的字符进行统一格式处理,即得到更新后的终端信息库。
本申请实施例提供的终端信息库的更新方法,通过将所述拓展终端信息库和所述终端信息库进行合并,使得扩大了终端信息库的覆盖率。然后将所述合并终端信息库中的数据进行去重处理和统一格式处理,使更新后的终端信息库的数据量更小,节约内存资源,同时也可以提升识别的效率。
在一些实施例中,在步骤S101“终端信息库的更新设备基于获取的国际移动设备识别码IMEI信息画像表确定满足预设条件的目标终端标识号码TAC”之前,构建自身的终端信息库,图2为本申请实施例提供的构建自身的终端信息库的流程示意图,如图2所示,所述方法还包括:
步骤S1,终端信息库的更新设备获取IMEI信息画像表、TAC终端画像表和终端配置画像表。
本申请实施例中,IMEI信息画像表中包括手机号码和IMEI之间的映射关系。所述TAC终端画像表中包括TAC和终端设备标识之间的映射关系,示例性地,表4为本申请实施例提供的TAC终端画像表,如表4所示,
表4为TAC终端画像表
字段名称 字段类型 字段中文名
row_num BIGINT 行号
statis_date STRING 统计时间
trmnl_eqpmt_id STRING 终端设备标识
tac STRING TAC号码
statis_m STRING 日期(分区)
通过获取TAC终端画像表可以确定TAC和终端设备标识之间的映射关系。
本申请实施例中,所述终端配置画像表中包括终端设备标识与终端信息之间的映射关系。示例性地,表5为本申请实施例提供的终端配置画像表,如表5所示,
表5为终端配置画像表
通过获取终端配置画像表可以确定终端设备标识与终端信息之间的映射关系,本申请实施例中,所述终端信息包括:手机信号和手机品牌。
步骤S2,终端信息库的更新设备根据所述IMEI信息画像表、所述TAC终端画像表和所述终端配置画像表提取包括手机号码、IMEI、TAC、终端信息的第一信息。
本申请实施例中,当得到了IMEI信息画像表、所述TAC终端画像表和所述终端配置画像表后,可以从三个表中提取出包括手机号码、IMEI、TAC、终端信息的第一信息。
步骤S3,终端信息库的更新设备根据所述第一信息确定所述TAC与所述终端信息的第二对应关系。
本申请实施例中,由于TAC和终端设备标识存在映射关系,而终端设备标识与终端信息存在对应关系,因此,可以确定TAC与终端信息的第二对应关系。
步骤S4,终端信息库的更新设备根据所述第二对应关系建立终端信息库。
本申请实施例中,所述终端信息库为自身的终端信息库。
在一些实施例中,所述步骤S3“终端信息库的更新设备根据所述第一信息确定所述TAC与所述终端信息的第二对应关系”在实现时,可以通过以下步骤实现:
步骤S31,终端信息库的更新设备对所述第一信息进行剔除处理剔除无效数据得到第二信息。
本申请实施例中,所述无效数据包括脏数据和具有相同手机号码和IMEI的历史数据。示例性地,所述脏数据包括:非32位的MD5手机号码、缺少核心字段或者主键字段的记录等。具有相同手机号码和IMEI的历史数据可以认为是无效历史数据,在剔除具有相同手机号码和IMEI的历史数据时,可以对于同一组手机号码和IMEI号码,保留日期最新的记录,剔除其他过期的历史数据。
步骤S32,终端信息库的更新设备对所述第二信息中的数据进行正则处理得到第三信息。
本申请实施例中,为了使第二信息中的数据中的格式一致,对数据进行正则处理以得到第三信息。本申请实施例中,对于字符类型的终端品牌和型号,通过正则匹配等预处理方法进行清洗,解决大小写不统一、空字符不一致、中英文不一致等问题。
本申请实施例中,对数据进行剔除处理和正则处理的过程都在数据仓库(HIVE)中进行,剔除处理和正则处理后的数据也继续保存在HIVE中,为数据脱敏做准备。
步骤S33,终端信息库的更新设备提取所述第三信息中的TAC与所述终端信息的对应关系。
本申请实施例提供的终端信息库的更新方法,通过对采集的第一信息进行剔除处理和正则处理,可以减少终端信息库中的无效数据,同时也使的终端信息库中的数据格式相同。
在一些实施例中,步骤S1013“终端信息库的更新设备根据所述第一对应关系确定满足预设条件的目标TAC”可以通过以下步骤实现:
步骤S131,终端信息库的更新设备根据所述手机号码数量对所述TAC进行排序,得到排序结果。
本申请实施例中,根据手机号码数量由大到小进行排列从而得到排序结果。
步骤S132,根据所述排序结果确定满足预设条件的第三对应关系。
本申请实施例中,可以抽取排序结果中前N个手机号码的数量和TAC的对应关系。
步骤S133,根据所述第三对应关系确定目标TAC。
承接上面的示例,将N个手机号码数量和TAC的对应关系中的TAC确定为目标TAC。
本申请实施例提供的方法,基于IMEI与手机号码的映射关系,统计得到TAC与手机号码个数的映射关系,提取覆盖大多数手机号码的少数TAC,避免了对全量数据的采集处理和分析,以利用很少量的TAC识别出覆盖率高的终端信息。
在一些实施例中,所述步骤S103“终端信息库的更新设备根据所述目标TAC、所述SNR和所述校验码确定脱敏IMEI”可以通过以下步骤实现:
步骤S1031,根据目标TAC确定脱敏IMEI前八位数字。
步骤S1032,将所述SNR确定为脱敏IMEI中间六位数字。
步骤S1033,将所述校验码确定为脱敏IMEI最后一位数字。
本申请实施例提供的方法,根据IMEI的组成结构特点,将其中间的SNR串号替换为任意无实质性含义的6个数字,再通过Luhn算法回填最后一位校验码,得到合法的脱敏IMEI,该脱敏IMEI具有完全不可逆性,从而实现对敏感信息进行加密和脱敏的目的。
本申请实施例再提供一种终端信息库的更新方法,在介绍本申请实施例提供的终端信息库的更新方法之前,先简单说明两个公知的结论:
IMEI即通常所说的手机序列号或者串号,用于在移动电话网络中识别每一部独立的手机等移动通信设备,相当于移动电话的身份证。IMEI号码共15位(早期17位),前8位TAC是型号核准号码,是手机品牌和型号的编码。接着2位FAC,仅在早期6位数的TAC中存在,代表最终装配地代码。后6位SNR是串号,代表生产顺序号。最后1位CD(Check Digit)一般是检验码。
图3本申请实施例提供的终端信息库的更新方法的另一种实现流程示意图,如图3所示,所述方法包括:
步骤S301,数据采集和构建自有终端信息数据库。
在实现时,基于运营商一级经营分析业务系统,采集包括MD5加密的用户手机号码及其IMEI号码映射关系的IMEI信息画像表、TAC终端设备标识画像维表和终端配置信息画像维表,截取IMEI号码的前面8位TAC号码作为关联主键,通过这几张数据表的关联处理,得到每个手机号码的TAC号码及其终端品牌和型号,构建自有终端信息数据库。
本申请所述的自有终端数据库,是指基于运营商自有业务数据,通过关联分析等手段构建的终端信息数据库。图4为本申请实施例提供的构建自有终端数据库的流程示意图,如图4所示:
步骤S41:将IMEI信息画像表中的手机号码、IMEI的前8位TAC提取出来并作去重处理,再与TAC-终端画像表基于TAC号码进行左关联,获得所有手机号码、TAC号码与终端设备标识的对应关系表。
步骤S42:将步骤41所得到的结果,关联终端配置画像(终端设备标识+终端品牌+终端型号),得到所有手机号码及其TAC号码所对应的终端品牌和型号,提取TAC号码与终端品牌和型号,并作去重处理,即可构建自有终端信息数据库。
通过上述终端信息的构建方法得到的终端信息完全依赖运营商已有的数据,依赖TAC终端画像维表与终端配置画像维表的完整性和准确率,由于运营业务系统中的维表类数据一般都是以月份、甚至更长的时间周期进行更新的,所以通过上述建模方法得到的终端品牌和型号,往往都不是最新的,而且完整性和准确性都不高,需要进一步完善和甄别。
本申请实施例中,采集的数据是电信运营商的自有一级经营分析系统中的终端信息相关的数据表,采集数据方式如下:
步骤S3011,采集一级经营分析系统中的IMEI画像信息表。
本申请实施例中,该IMEI画像信息表的核心信息包括:MD5加密的手机号码、IMEI号码、终端使用次数及使用时长等字段。表6为本申请实施例提供的IMEI画像信息表,如表6所示,
表6为IMEI画像信息表
字段名称 字段类型 字段中文名
row_num BIGINT 行号
statis_date STRING 统计时间
msisdn STRING 手机号码
imei STRING IMEI号码
call_qty INT 终端使用次数
oln_dur INT 终端使用时长(月)
statis_m STRING 日期(分区)
步骤S3012,采集TAC终端画像表和终端配置画像表结构,构建终端品牌和型号信息的基准数据库。
表7为本申请实施例只提供的TAC终端画像表,如表7所示,TAC终端画像表中至少包括TAC号码和终端设备标识。
表7为TAC终端画像表
字段名称 字段类型 字段中文名
row_num BIGINT 行号
statis_date STRING 统计时间
trmnl_eqpmt_id STRING 终端设备标识
tac STRING TAC号码
statis_m STRING 日期(分区)
表8为本申请实施例提供的终端配置画像表,如表8所示,终端配置画像表至少包括终端设备标识、终端品牌和终端型号。
表8为终端配置画像表
步骤S3013对采集获取的数据,筛选出核心字段,
本申请实施例中,所述核心字段包括手机号码、IMEI、终端设备标识、终端品牌和终端型号,然后对提取的字段逐个进行清洗,按需进行转换和预处理等,以保证数据质量可靠。
本申请实施例中,具体的数据的清洗和转换等预处理规则举例如下:
剔除无效脏数据:比如非32位的MD5手机号码、缺少核心字段或者主键字段的记录等。
剔除无效历史数据:对于同一组手机号码和IMEI号码,保留日期最新的那条记录,剔除其他过期的历史数据。
统一字符型数据:对于字符类型的终端品牌和型号,通过正则匹配等预处理方法进行清洗,解决大小写不统一、空字符不一致、中英文不一致等问题。
所有数据采集和数据预处理等过程都在HIVE数据仓库中进行,预处理完毕的数据也继续保存在HIVE数据仓库,为下一步的数据加密做准备。
在一些实施例中,采集了数据后,可以构建自有终端数据库。
由于终端数据库存在的问题,本申请实施例本申请实施例提出构建拓展终端数据库(即上述各个实施例中的拓展终端信息库),以对自身的终端信息库进行更新。本申请实施例中,图5为本申请实施例提供的拓展终端信息库的构建流程示意图,如图5所示,包括步骤S501,基于IMEI信息画像表提取出来的少量TAC号码;步骤S502,经过回填和加密得到合法的IMEI号码(即脱敏IMEI),步骤S503,通过网络爬虫或者第三方终端信息数据库匹配关联出来的终端信息库。
由于终端品牌和型号信息完全包含在TAC中,所述的终端信息库也是特指基于TAC号码的终端信息库,但是目前通过网络爬虫技术或者第三方数据库获取终端品牌和型号,都需要匹配完整的IMEI号码。这样就需要建立一种可靠的建模方法,能够支持在仅提供有限数量的TAC的情况下,也能获得相应合法的可查询IMEI号码,并且最大化提升终端品牌和型号的整体识别率和覆盖率。具体的步骤如下:
步骤S302,确定目标TAC(即图中的确定号码最多的TAC)。
本申请实施例中,基于IMEI信息画像表,截取IMEI号码的前面8位TAC号码,统计每个TAC号码对应的手机号码的个数,将TAC号码按照其对应手机号码的个数从高到低依次排序。表9为本申请实施例提供的将TAC号码按照其对应手机号码的个数从大到小的排序表,如表9所示,根据统计结果和业务需要,取出覆盖手机号码个数最多,即排序最靠前的一批TAC号码(即上述各个实施例中的目标TAC),作为待处理的IMEI号码的基准数据。比如,覆盖了96%的手机号码的那些TAC,这些TAC在所有TAC中的占比为14%作为待脱敏处理的IMEI号码的基准数据。
表9为将TAC号码按照其对应手机号码的个数从大到小的排序表
步骤S303,构建脱敏IMEI(即图中的脱敏的IMEI号码)。
本申请实施例中,IMEI号码的组成可以分解为三个部分,分别是前面8位的TAC号码,中间6位的SNR串号,以及最后一位校验码。将待加密的IMEI号码前8位数直接设置成已经提取出来的TAC号码(即上述各个实施例中的目标TAC),将IMEI号码的第9~14位的6位数SNR串号设置成长度为6的数字,示例性地,表10为本申请实施例提供的SNR串号进行填充表,如表10所示,这里填充的SNR串号可以是随机数或者其他任何无实质性含义的6个数字,比如123456、234567、000000等。
表10为SNR串号进行填充表
TAC 手机号码个数 固定值填充SNR 随机数字填充SNR
86273103 357692 86273103000000 86273103500705
35672108 303948 35672108000000 35672108657431
86273203 268867 86273203000000 86273203661801
86571604 246902 86571604000000 86571604925675
86545204 215458 86545204000000 86545204992567
86146403 210814 86146403000000 86146403684255
35698406 132590 35698406000000 35698406737158
35873009 111387 35873009000000 35873009566730
然后,基于Luhn算法,可以很容易地计算得到IMEI的最后一位校验码数字。Luhn算法(Luhn algorithm),也称为“模10”(Mod 10)算法,是一种校验算法,Luhn算法会通过校验码对一串数字进行验证,校验码通常会被加到这串数字的末尾处,从而得到一个完整的身份识别码。示例性地,表11为本申请实施例提供的计算得到最后一位校验码数字表,如表11所示,最后一位数字即为校验码。
表11为计算得到最后一位校验码数字表
TAC 手机号码个数 固定值填充SNR 随机数字填充SNR
86273103 357692 862731030000001 862731035007050
35672108 303948 356721080000004 356721086574317
86273203 268867 862732030000009 862732036618010
86571604 246902 865716040000007 865716049256758
86545204 215458 865452040000009 865452049925677
86146403 210814 861464030000000 861464036842553
35698406 132590 356984060000002 356984067371588
35873009 111387 358730090000001 358730095667309
此时,即完成了脱敏IMEI号码的构造。
步骤S304,基于脱敏IMEI号码得到每个IMEI号码对应的终端品牌和型号,截取TAC构建拓展终端信息数据库。
本申请实施例中,通过网络爬虫、关联第三方终端信息数据库等方法得到每个脱敏IMEI号码对应的终端品牌和型号。对该数据集进行校验和格式统一处理,形成拓展终端数据库。示例性地,表12为本申请实施例提供的拓展终端数据库表,如表12所示,表中有TAC和终端品牌、终端型号的对应关系。
表12为拓展终端数据库表
步骤S305,根据拓展终端信息库将终端品牌和型号信息增加到自有终端信息库。
本申请实施例中国,可以通过反复多次的比对和验证,持续补充、丰富和更新终端信息数据库。
在具体实现时,将拓展终端信息数据库中的终端品牌和型号信息,与自有终端信息库进行合并,并对两个终端数据库中的记录进行统一的数据处理,剔除冗余的重复记录,对大小写不一致、中英文不一致等字符进行格式的统一。通过反复多次的比对和验证,持续补充、丰富和更新终端信息数据库。
由于相关技术中,没有考虑到覆盖大多数手机号码的主流终端品牌和型号,在数量上是非常有限的,也没有考虑到IMEI作为敏感数据,不能够直接出库用于终端信息的识别。而且采集的数据源是WAP网关中的用户手机信息、终端上网过程中产生的HTTP信令数据、网络中移动终端的通信话单等底层信令数据,信令数据规模巨大,全量获取难度很高,数据采集、预处理和分析等中间过程十分繁琐,并且要消耗大量的计算资源和存储,数据处理和分析的效率很低,而且存在敏感数据被泄露的风险。
通过本申请实施例提供的方法,可以在最大程度上减少TAC号码查询数量的同时,也避免真实IMEI号码被泄露的风险,并且充分利用了电信运营商自有的终端信息数据库和第三方终端信息数据库资源,有效补充和丰富了终端信息数据库,提升了终端品牌和型号的整体识别率。
本申请实施例提供的方法的主要技术优点表现在以下几个方面:
解决数据资源浪费的问题:基于运营商已有业务系统,直接采集含有手机号码和IMEI号码映射关系的IMEI信息画像表,含有TAC及终端信息的TAC-终端画像维表和终端配置画像维表。减少信令的采集、解析和数据预处理等很多中间过程,极大地降低数据采集的成本、减少数据资源的浪费。
解决计算资源和存储资源浪费的问题:建模数据仅包括IMEI信息画像表和两张终端信息维表,原始的建模数据量被大大降低,绕过了原始数据的采集和预处理等中间过程,减少了很多不必要的中间数据的计算和存储,从而极大地节约计算资源和存储资源,并且充分利用了已有的数据资源,减少了数据的重复计算和系统的重复建设。
解决终端品牌和型号覆盖率低的问题:模型聚焦覆盖主流终端的那些少部分的TAC,利用TAC与手机号码多对一的映射关系,筛选出覆盖绝超过90%或者更多手机号码的TAC,有效避免了对部分非主流的山寨机、非法终端的分析,即利用尽可能少的TAC,识别出尽可能多、准确且有效的终端品牌和型号。
解决终端信息数据库更新不及时的问题:经过分析提取和脱敏处理的IMEI号码数据量很小,可以很灵活地支持第三方查询和网络爬虫,不局限于固定周期输出。根据业务需要,可以从业务系统中获取到最新的TAC号码库,从而高效地实现终端品牌和型号的识别,及时补充和更新终端信息数据库,同时支持生产系统中的其他应用开发工作。
解决敏感数据泄露的问题:基于统计分析后提取的TAC号码,通过填充无实质性含义的SNR串号,再结合Luhn算法回填校验码,即可生成合法的无实际含义的IMEI号码,有效实现对IMEI的不可逆加密处理。最后结合网络爬虫或者第三方终端信息数据库,识别出脱敏IMEI所对应的终端品牌和型号。在获得合法IMEI的同时也能最大程度提升终端品牌和型号的识别率和覆盖率。
基于前述的实施例,本申请实施例提供一种终端信息库的更新装置,该装置包括的各模块、以及各模块包括的各单元,可以通过计算机设备中的处理器来实现;当然也可通过具体的逻辑电路实现;在实施的过程中,处理器可以为中央处理器(CPU,CentralProcessing Unit)、微处理器(MPU,Microprocessor Unit)、数字信号处理器(DSP,DigitalSignal Processing)或现场可编程门阵列(FPGA,Field Programmable Gate Array)等。
本申请实施例再提供一种终端信息库的更新装置,图6为本申请实施例提供的终端信息库的更新装置结构示意图,如图6所示,所述终端信息库的更新装置600包括:
第一确定模块601,用于基于获取的国际移动设备识别码IMEI信息画像表确定满足预设条件的目标终端标识号码TAC;
第一获取模块602,用于获取序列号SNR,并根据所述目标TAC和所述SNR确定校验码,其中所述SNR为随机生成的数字或者为预设数字;
生成模块603,用于根据所述目标TAC、所述SNR和所述校验码生成脱敏IMEI;
第二获取模块604,用于根据所述脱敏IMEI从外网终端信息库获取所述脱敏IMEI对应的终端信息,以对自身的终端信息库进行更新。
在一些实施例中,所述第一确定模块601包括:
第一获取单元,用于获取IMEI信息画像表,其中,所述IMEI信息画像表中包括手机号码和IMEI之间的映射关系;
第一确定单元,用于根据所述IMEI信息画像表确定TAC与手机号码数量的第一对应关系;
第二确定单元,用于根据所述第一对应关系确定满足预设条件的目标TAC。
在一些实施例中,所述第二获取模块604包括:
第二获取单元,用于从外网终端信息库中获取所述脱敏IMEI中的目标TAC对应的终端信息;
第三确定单元,用于基于所述目标TAC与所述目标TAC对应的终端信息确定拓展终端信息库;
更新单元,用于根据所述拓展终端信息库对自身的所述终端信息库进行更新。
在一些实施例中,所述更新单元,包括:
合并子单元,用于将所述拓展终端信息库和所述终端信息库进行合并,得到合并终端信息库;
去重子单元,用于将所述合并终端信息库中的数据进行去重处理,得到去重终端信息库;
格式处理子单元,用于对去重终端信息库中数据的字符进行统一格式处理,得到更新后的终端信息库。
在一些实施例中,所述终端信息库的更新装置600包括:
第三获取模块,用于获取IMEI信息画像表、TAC终端画像表和终端配置画像表,其中,所述TAC终端画像表中包括TAC和终端设备标识之间的映射关系,所述终端配置画像表中包括终端设备标识与终端信息之间的映射关系;
提取模块,用于根据所述IMEI信息画像表、所述TAC终端画像表和所述终端配置画像表提取包括手机号码、IMEI、TAC、终端信息的第一信息;
第二确定模块,用于根据所述第一信息确定所述TAC与所述终端信息的第二对应关系;
建立模块,用于根据所述第二对应关系建立终端信息库。
在一些实施例中,所述第二确定模块,包括:
剔除单元,用于对所述第一信息进行剔除处理剔除无效数据得到第二信息,其中,所述无效数据包括脏数据和具有相同手机号码和IMEI的历史数据;
正在处理单元,用于对所述第二信息中的数据进行正则处理得到第三信息;
提取单元,用于提取所述第三信息中的TAC与所述终端信息的第二对应关系。
在一些实施例中,所述第二确定单元包括:
排序子单元,用于根据所述手机号码数量对所述TAC进行排序,得到排序结果;
第一确定子单元,用于根据所述排序结果确定满足预设条件的第三对应关系;
第二确定子单元,用于根据所述第三对应关系确定目标TAC。
在一些实施例中,所述生成模块603包括:
第四确定单元,用于根据目标TAC确定脱敏IMEI前八位数字;
第五确定单元,用于将所述SNR确定为脱敏IMEI中间六位数字;
第六确定单元,用于将所述校验码确定为脱敏IMEI最后一位数字。
以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请装置实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
本申请实施例提供的终端信息库的更新装置,通过第一确定模块601基于IMEI信息画像表确定满足预设条件的目标TAC,然后第一获取模块602获取SNR和校验码,生成模块603基于该目标TAC构建脱敏IMEI,第二获取模块604通过脱敏IMEI从外网终端信息库获取该脱敏IMEI对应的终端信息,从而在保证信息安全的前提下,实现对电信运营商自身的终端信息库进行更新,进而提升终端品牌和型号的识别率和覆盖率。
需要说明的是,本申请实施例中,如果以软件功能模块的形式实现上述的终端信息库的更新方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本申请实施例不限制于任何特定的硬件和软件结合。
相应地,本申请实施例提供一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中提供的终端信息库的更新方法中的步骤。
本申请实施例提供一种终端信息库的更新设备,图7为本申请实施例提供的终端信息库的更新设备的组成结构示意图,如图7所示,所述终端信息库的更新设备700包括:一个处理器701、至少一个通信总线702、用户接口703、至少一个外部通信接口704和存储器705。其中,通信总线702配置为实现这些组件之间的连接通信。其中,用户接口703可以包括显示屏,外部通信接口704可以包括标准的有线接口和无线接口。其中,所述处理器701配置为执行存储器中存储的终端信息库的更新方法的程序,以实现以上述实施例提供的终端信息库的更新方法中的步骤
以上终端信息库的更新设备和存储介质实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请终端信息库的更新设备和存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
这里需要指出的是:以上存储介质和设备实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请存储介质和设备实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台AC执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (11)

1.一种终端信息库的更新方法,其特征在于,所述方法包括:
基于获取的国际移动设备识别码IMEI信息画像表确定满足预设条件的目标终端标识号码TAC;
获取序列号SNR,并根据所述目标TAC和所述SNR确定校验码,其中所述SNR为随机生成的数字或者为预设数字;
根据所述目标TAC、所述SNR和所述校验码生成脱敏IMEI;
根据所述脱敏IMEI从外网终端信息库获取所述脱敏IMEI对应的终端信息,以对自身的终端信息库进行更新。
2.根据权利要求1所述的方法,其特征在于,所述根据获取的国际移动设备识别码IMEI信息画像表确定满足预设条件的目标TAC,包括:
获取IMEI信息画像表,其中,所述IMEI信息画像表中包括手机号码和IMEI之间的映射关系;
根据所述IMEI信息画像表确定TAC与手机号码数量的第一对应关系;
根据所述第一对应关系确定满足预设条件的目标TAC。
3.根据权利要求1所述的方法,其特征在于,所述根据所述脱敏IMEI从其他终端信息库获取脱敏IMEI对应的终端信息,以对终端信息库进行更新,包括:
从外网终端信息库中获取所述脱敏IMEI中的目标TAC对应的终端信息;
基于所述目标TAC与所述目标TAC对应的终端信息确定拓展终端信息库;
根据所述拓展终端信息库对自身的所述终端信息库进行更新。
4.根据权利要求3所述的方法,其特征在于,所述根据所述拓展终端信息库对自身的所述终端信息库进行更新,包括:
将所述拓展终端信息库和所述终端信息库进行合并,得到合并终端信息库;
将所述合并终端信息库中的数据进行去重处理,得到去重终端信息库;
对去重终端信息库中数据的字符进行统一格式处理,得到更新后的终端信息库。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取IMEI信息画像表、TAC终端画像表和终端配置画像表,其中,所述TAC终端画像表中包括TAC和终端设备标识之间的映射关系,所述终端配置画像表中包括终端设备标识与终端信息之间的映射关系;
根据所述IMEI信息画像表、所述TAC终端画像表和所述终端配置画像表提取包括手机号码、IMEI、TAC、终端信息的第一信息;
根据所述第一信息确定所述TAC与所述终端信息的第二对应关系;
根据所述第二对应关系建立终端信息库。
6.根据权利要求5所述的方法,根据所述第一信息确定所述TAC与所述终端信息的第二对应关系,包括:
对所述第一信息进行剔除处理剔除无效数据得到第二信息,其中,所述无效数据包括脏数据和具有相同手机号码和IMEI的历史数据;
对所述第二信息中的数据进行正则处理得到第三信息;
提取所述第三信息中的TAC与所述终端信息的第二对应关系。
7.根据权利要求2所述的方法,其特征在于,所述根据所述第一对应关系确定满足预设条件的目标TAC,包括:
根据所述手机号码数量对所述TAC进行排序,得到排序结果;
根据所述排序结果确定满足预设条件的第三对应关系;
根据所述第三对应关系确定目标TAC。
8.根据权利要求1所述的方法,其特征在于,所述根据所述目标TAC、所述SNR和所述校验码确定脱敏IMEI,包括:
根据目标TAC确定脱敏IMEI前八位数字;
将所述SNR确定为脱敏IMEI中间六位数字;
将所述校验码确定为脱敏IMEI最后一位数字。
9.一种终端信息库的更新装置,其特征在于,所述终端信息库的更新包括:
第一确定模块,用于基于获取的国际移动设备识别码IMEI信息画像表确定满足预设条件的目标终端标识号码TAC;
第一获取模块,用于获取序列号SNR,并根据所述目标TAC和所述SNR确定校验码,其中所述SNR为随机生成的数字或者为预设数字;
生成模块,用于根据所述目标TAC、所述SNR和所述校验码生成脱敏IMEI;
第二获取模块,用于根据所述脱敏IMEI从外网终端信息库获取所述脱敏IMEI对应的终端信息,以对自身的终端信息库进行更新。
10.一种终端信息库的更新设备,其特征在于,包括:
处理器;以及
存储器,用于存储可在所述处理器上运行的计算机程序;
其中,所述计算机程序被处理器执行时实现权利要求1至8任一项所述的终端信息库的更新方法的步骤。
11.一种存储介质,所述存储介质中存储有计算机可执行指令,该计算机可执行指令配置为执行上述权利要求1至8任一项所述的终端信息库的更新方法的步骤。
CN202011455922.3A 2020-12-10 2020-12-10 终端信息库的更新方法、装置、设备及存储介质 Active CN114630314B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011455922.3A CN114630314B (zh) 2020-12-10 2020-12-10 终端信息库的更新方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011455922.3A CN114630314B (zh) 2020-12-10 2020-12-10 终端信息库的更新方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN114630314A CN114630314A (zh) 2022-06-14
CN114630314B true CN114630314B (zh) 2023-09-05

Family

ID=81895892

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011455922.3A Active CN114630314B (zh) 2020-12-10 2020-12-10 终端信息库的更新方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114630314B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2923128A1 (fr) * 2007-10-25 2009-05-01 Halys Soc Par Actions Simplifi Procede de determination automatique du profil de personnalisation gprs d'un mobile.
WO2012106982A1 (zh) * 2011-02-11 2012-08-16 Wang Lanrui 一种快速校验国际移动设备标识的方法及系统
TW201237793A (en) * 2011-02-01 2012-09-16 Positioniq Inc Automated information update system
CN105578395A (zh) * 2015-12-28 2016-05-11 中国联合网络通信集团有限公司 一种更新终端信息库中终端属性的方法及装置
CN107358121A (zh) * 2017-07-12 2017-11-17 张�诚 一种脱敏数据集的数据融合方法及装置
WO2018049940A1 (zh) * 2016-09-14 2018-03-22 广东欧珀移动通信有限公司 网络接入方法、相关设备及系统
CN109257764A (zh) * 2018-10-24 2019-01-22 北京小米移动软件有限公司 用户画像数据处理方法及装置
CN109918944A (zh) * 2019-03-01 2019-06-21 维沃移动通信有限公司 一种信息保护方法、装置、移动终端及存储介质
WO2019192439A1 (zh) * 2018-04-04 2019-10-10 华为技术有限公司 通信能力上报方法、设备及系统
CN110516471A (zh) * 2019-08-15 2019-11-29 平安普惠企业管理有限公司 基于信息安全的产品推广方法及相关设备
CN110798544A (zh) * 2019-11-05 2020-02-14 Oppo(重庆)智能科技有限公司 移动终端合法性的校验方法、装置、终端及存储介质
CN111447175A (zh) * 2020-02-21 2020-07-24 北京蓝玛星际科技有限公司 一种基于移动脱敏大数据的特定人群管理系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104283853B (zh) * 2013-07-08 2018-04-10 华为技术有限公司 一种提高信息安全性的方法、终端设备及网络设备

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2923128A1 (fr) * 2007-10-25 2009-05-01 Halys Soc Par Actions Simplifi Procede de determination automatique du profil de personnalisation gprs d'un mobile.
TW201237793A (en) * 2011-02-01 2012-09-16 Positioniq Inc Automated information update system
WO2012106982A1 (zh) * 2011-02-11 2012-08-16 Wang Lanrui 一种快速校验国际移动设备标识的方法及系统
CN105578395A (zh) * 2015-12-28 2016-05-11 中国联合网络通信集团有限公司 一种更新终端信息库中终端属性的方法及装置
WO2018049940A1 (zh) * 2016-09-14 2018-03-22 广东欧珀移动通信有限公司 网络接入方法、相关设备及系统
CN107358121A (zh) * 2017-07-12 2017-11-17 张�诚 一种脱敏数据集的数据融合方法及装置
WO2019192439A1 (zh) * 2018-04-04 2019-10-10 华为技术有限公司 通信能力上报方法、设备及系统
CN109257764A (zh) * 2018-10-24 2019-01-22 北京小米移动软件有限公司 用户画像数据处理方法及装置
CN109918944A (zh) * 2019-03-01 2019-06-21 维沃移动通信有限公司 一种信息保护方法、装置、移动终端及存储介质
CN110516471A (zh) * 2019-08-15 2019-11-29 平安普惠企业管理有限公司 基于信息安全的产品推广方法及相关设备
CN110798544A (zh) * 2019-11-05 2020-02-14 Oppo(重庆)智能科技有限公司 移动终端合法性的校验方法、装置、终端及存储介质
CN111447175A (zh) * 2020-02-21 2020-07-24 北京蓝玛星际科技有限公司 一种基于移动脱敏大数据的特定人群管理系统

Also Published As

Publication number Publication date
CN114630314A (zh) 2022-06-14

Similar Documents

Publication Publication Date Title
CN105808988B (zh) 一种识别异常账户的方法及装置
CN111339436B (zh) 一种数据识别方法、装置、设备以及可读存储介质
CN109640312B (zh) “黑卡”识别方法、电子设备及计算机可读取存储介质
US20110125746A1 (en) Dynamic machine assisted informatics
CN107392655A (zh) 优惠券推送方法、系统、存储介质、电子设备及分流方法
CN110275965A (zh) 假新闻检测方法、电子装置及计算机可读存储介质
CN109711189B (zh) 数据脱敏方法及装置、存储介质、终端
CN113362024A (zh) 一种基于区块链的应用程序开发多模块协同系统
CN114757639A (zh) 数据处理方法、装置、设备和存储介质
CN112765673A (zh) 一种敏感数据统计方法及相关装置
CN109697224B (zh) 一种账单消息处理方法、装置和存储介质
CN115357625A (zh) 结构化数据比对方法、装置、电子设备及存储介质
CN104994220B (zh) 一种数据处理方法和系统
CN114630314B (zh) 终端信息库的更新方法、装置、设备及存储介质
CN114238777A (zh) 基于行为分析的负反馈流量分配方法、装置、设备及介质
CN115146174B (zh) 基于多维权重模型的重点线索推荐方法及系统
CN110502529B (zh) 数据处理方法、装置、服务器及存储介质
CN114840634B (zh) 信息存储方法、装置、电子设备和计算机可读介质
CN114817518B (zh) 基于大数据档案识别的证照办理方法、系统及介质
CN110543457A (zh) 轨迹类文档处理方法和装置、存储介质及电子装置
CN115640606A (zh) 一种基于安全的数据可视化方法及系统
CN109783689A (zh) 信息处理方法、装置及电子设备
CN106649343B (zh) 一种网络数据信息处理方法及设备
CN112449062B (zh) 恶意扣费的识别方法、装置、电子设备及存储介质
CN114817867A (zh) 基于互联网的出版物发行平台

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant