CN107392415B - 一种基于大数据的电信营业员画像信息处理方法及装置 - Google Patents
一种基于大数据的电信营业员画像信息处理方法及装置 Download PDFInfo
- Publication number
- CN107392415B CN107392415B CN201710418917.7A CN201710418917A CN107392415B CN 107392415 B CN107392415 B CN 107392415B CN 201710418917 A CN201710418917 A CN 201710418917A CN 107392415 B CN107392415 B CN 107392415B
- Authority
- CN
- China
- Prior art keywords
- service
- state
- link
- state link
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 14
- 238000003672 processing method Methods 0.000 title claims abstract description 7
- 238000000034 method Methods 0.000 claims abstract description 31
- 238000012545 processing Methods 0.000 claims abstract description 12
- 230000005540 biological transmission Effects 0.000 claims abstract description 7
- 238000012360 testing method Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 description 14
- 230000006399 behavior Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 238000005520 cutting process Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- RWSOTUBLDIXVET-UHFFFAOYSA-N Dihydrogen sulfide Chemical compound S RWSOTUBLDIXVET-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06398—Performance of employee with respect to a job function
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Databases & Information Systems (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Telephonic Communication Services (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于大数据的电信营业员画像信息处理方法及装置,该装置包括处理器,适于实现各指令,所述指令适于由处理器加载并执行以下步骤:获取实时传输的业务数据;将根据获得的业务数据而构建得到的当前的业务状态链路与操作数据库中的业务状态链路进行比对判断;所述操作数据库的建立步骤包括:构建状态池;根据构建的状态池,构建业务状态链路。本发明解决长期以来运营商对于营业厅服务质量的盲区,为电信运营商提供完整的营业员画像信息,以便清晰描绘服务现状,为企业决策提供重要的数据支撑。本发明作为一种基于大数据的电信营业员画像信息处理方法及装置可广泛应用于营业员画像信息数据处理领域中。
Description
技术领域
本发明涉及画像数据处理技术,尤其涉及一种基于大数据的电信营业员画像信息处理方法及装置。
背景技术
技术词解释:
电信营业员:在国内,电信运营商为了给用户提供便捷贴心的服务,一般会提供多种渠道进行业务咨询与办理,其中一个传统的重要渠道便是营业厅;以中国移动为例,一般每座城市都会设立几十上百个实体营业厅,并在营业厅中配备相当数量的工作人员为到来的用户提供业务咨询与办理服务,这些工作人员便为电信营业员。
画像:随着国内电信运营商的竞争日趋激烈,三大运营商进入了全面竞争的阶段,其中一个关键的竞争点就是服务质量;为了提升服务的质量,运营商会对各自的业务办理渠道进行服务信息收集与评估,因此,作为重要渠道的实体营业厅,建立营业员的服务过程的详尽记录是必要的手段之一;而这些详尽记录的服务过程,供运营商事后回溯、检讨的材料,便是对营业员的画像。
操作:在电信营业厅中,都配备有专门服务于客户的营业员;客户拿号排队后,轮到自己办理业务时,向营业员提出业务需求,营业员则按照客户的需要使用电脑终端,在营业厅业务系统上,输入相应的信息,这种信息输入就是操作;而通常一笔业务办理需要多个操作步骤,这些步骤结合在一起就构成了营业员的操作模式。
业务:越来越多的企业,采用B/S的IT架构,为客户提供服务——客户通过浏览器这种标准的客户端,访问企业的web服务器,获取企业能够提供的服务清单,并通过一系列的web操作实现业务的搜索、查找、筛选、资料填写、审核、合规性检查、最后进行提交确认;对于企业来说,业务是它们为实现业务需求(盈利、扩大影响力等)而提供的服务清单,而业务落地到系统上,则表现为服务器上,所提供的一个个web界面的组合。
命令字:企业通过建立IT系统,为企业客户提供web界面的服务窗口,客户通过这些窗口可以方便地办理各种业务,这是从客户出发能够感受到的信息;而在系统实现层面,IT系统在接收到来自客户侧的业务办理请求后,会转化为服务器集群之间的通信,这些通信采用了机器之间才能够识别出的语言,这些语言需要符合某种预先约定好的规范,通常这些机器间的语言就叫做命令字,其中,一条命令字可以实现一种操作,例如对用户的鉴权、身份验证等。而一笔业务办理下来,通常需要调用多条命令字。
序列:命令字在最初设计的时候,都是尽可能地满足简单、明确的原则,这使得命令字在不同的业务之中可以快速地进行复用,进而提升IT系统开发的效率,缩短整个系统的建设周期,例如在充值、套餐办理两种业务时,都需要对客户当前账号的余额进行查询,因此需要用到余额查询这个通用的命令字,因此业务的办理实际上就是服务器对命令字按照特定的顺序进行调用,这种顺序就叫做序列。
拨测:通过模拟真实用户办理的方式,获取命令字调用的序列(即命令字序列),这样做可以实现三个目的:1、实现对初始样本的获取,探索命令字序列的规律;2.对于重点的业务,实现精确的命令字序列判定;3.对于机器学习后的命令字序列进行验证。
日志:提供业务办理的IT系统,除了能够为客户提供业务办理的服务之外,在业务办理时,将会把操作的记录保存下来,以后审计、对账之用,这些记录就是业务的日志;通过把机器学习的结果,与系统厂家提供的日志信息进行对比,可以高效地验证机器学习的准确率、查全率等关键指标。
品牌:对于企业来讲,一般会把客户分为不同的等级、种类以便提供差异化的服务,为高价值的人群提供更好的服务,从而保障企业的资源能够得到更好的投入产出比;在业务办理过程中,IT系统也会识别出客户的种类,进行对同样的业务操作,进行不同的命令字序列调用,这些能够区分客户种类的信息就是品牌,例如对于运营商来讲,有全球通、动感地带等品牌,而某些业务只允许全球通客户办理,某些业务全球通客户办理时可以跳过一些认证环节。
流量抓包:从IT系统的关键交换机上,使用SPAN技术,镜像生产数据到交换机的镜像端口,并通过wireshark等开源、或自研的方案,把生产数据捕获并保存为PCAP等国际通用的流量数据包格式。
解码:从交换机上捕获到的生产数据,一般是以编码形式存在,编码的格式/通信的协议,一般都是系统开发厂家自行定义,或者是采用业界现场的通信协议作为载体,然后在上面自定义数据结构,这样便造成,捕获的数据是无法直接读取的,需要通过反向工程、文档解码等。
menuid:业务所在的菜单号码。
现代企业之间的竞争日趋激烈,在电信行业尤其如此,因此各大电信运营商除了技术之外,越来越重视客户的体验,注重如何提升客户的满意度。而对于客户来讲,最好的体验莫过于专人的服务,这种模式在电信运营商的实体营业厅中体现得尤为明显。
在很长一段时间里面,运营商对于营业员服务水平的提升主要集中在事前培训以及事后的客户回访上。但随着时间推移,这种模式已难以满足日益增长的服务要求,这种模式的缺点已慢慢浮现出来,例如有:1、缺乏客观的数据支撑,对于客户感知的评价只能定性,无法定量;2、对于营业员服务质量的掌控滞后于服务过程,往往只能够事后回溯;3、对于客户体验出现的问题,无法有效地区分出是营业员操作的问题,还是IT系统故障导致的。
发明内容
为了解决上述技术问题,本发明的目的是提供一种基于大数据的电信营业员画像信息处理方法,来解决长期以来运营商对于营业厅服务质量的盲区,为电信运营商提供完整的营业员画像信息,以便清晰描绘服务现状,为企业决策提供重要的数据支撑。
本发明的另一目的是提供一种基于大数据的电信营业员画像信息处理装置,来解决长期以来运营商对于营业厅服务质量的盲区,为电信运营商提供完整的营业员画像信息,以便清晰描绘服务现状,为企业决策提供重要的数据支撑。
本发明所采用的技术方案是:一种基于大数据的电信营业员画像信息处理方法,该方法的步骤包括:
获取实时传输的业务数据;
将根据获得的业务数据而构建得到的当前的业务状态链路与操作数据库中的业务状态链路进行比对判断;
其中,所述操作数据库的建立步骤包括:
构建状态池;
根据构建的状态池,构建业务状态链路。
进一步,所述构建状态池这一步骤,其包括:
遍历所有的命令字,将命令字中所包含的引用源地址和统一资源标示符提取出来;
将提取出来的引用源地址构成引用源地址集合,将提取出来的统一资源标示符构成统一资源标示符集合;
遍历引用源地址集合中的元素,根据遍历的元素,从统一资源标示符集合中进行查找,查找出属于引用源地址集合且属于统一资源标示符集合的第一数据;
将查找出的第一数据所对应的命令字作为关键命令字,将关键命令字所对应的状态纳入至状态池;
其中,所述的状态由命令字中所包含的引用源地址和统一资源标示符构成。
进一步,所述构建业务状态链路这一步骤,其包括:
对状态池中的状态进行遍历,获取到状态之间的跳转顺序,生成业务状态链路。
进一步,所述操作数据库的建立步骤还包括:
通过拨测或日志,对构建的业务状态链路进行比对校正。
进一步,所述将根据获得的业务数据而构建得到的当前的业务状态链路与操作数据库中的业务状态链路进行比对判断这一步骤中包括有业务的分类步骤,所述业务的分类步骤包括:
从当前获得的命令字中提取出对应的引用源地址Rn和统一资源标示符Un,其中,Rn和Un构成状态Sn;
判断从当前获得的命令字中所提取出的引用源地址Rn是否等于从上一个获得的命令字中所提取出的Un-1,若是,则表示状态链路符合链接要求,反之,则需要新建状态链路;
重复上述步骤,直到本业务的最后一个状态,则结束一次业务的判断,得到本业务的状态链路,然后,从操作数据库中找出与本业务的状态链路最接近的业务状态链路,将找出的业务状态链路所对应的业务类型作为本业务的所属类型。
本发明所采用的另一技术方案是:一种基于大数据的电信营业员画像信息处理装置,包括处理器,适于实现各指令,所述指令适于由处理器加载并执行以下步骤:
获取实时传输的业务数据;
将根据获得的业务数据而构建得到的当前的业务状态链路与操作数据库中的业务状态链路进行比对判断;
其中,所述操作数据库的建立步骤包括:
构建状态池;
根据构建的状态池,构建业务状态链路。
进一步,所述构建状态池这一步骤,其包括:
遍历所有的命令字,将命令字中所包含的引用源地址和统一资源标示符提取出来;
将提取出来的引用源地址构成引用源地址集合,将提取出来的统一资源标示符构成统一资源标示符集合;
遍历引用源地址集合中的元素,根据遍历的元素,从统一资源标示符集合中进行查找,查找出属于引用源地址集合且属于统一资源标示符集合的第一数据;
将查找出的第一数据所对应的命令字作为关键命令字,将关键命令字所对应的状态纳入至状态池;
其中,所述的状态由命令字中所包含的引用源地址和统一资源标示符构成。
进一步,所述构建业务状态链路这一步骤,其包括:
对状态池中的状态进行遍历,获取到状态之间的跳转顺序,生成业务状态链路。
进一步,所述操作数据库的建立步骤还包括:
通过拨测或日志,对构建的业务状态链路进行比对校正。
进一步,所述将根据获得的业务数据而构建得到的当前的业务状态链路与操作数据库中的业务状态链路进行比对判断这一步骤中包括有业务的分类步骤,所述业务的分类步骤包括:
从当前获得的命令字中提取出对应的引用源地址Rn和统一资源标示符Un,其中,Rn和Un构成状态Sn;
判断从当前获得的命令字中所提取出的引用源地址Rn是否等于从上一个获得的命令字中所提取出的Un-1,若是,则表示状态链路符合链接要求,反之,则需要新建状态链路;
重复上述步骤,直到本业务的最后一个状态,则结束一次业务的判断,得到本业务的状态链路,然后,从操作数据库中找出与本业务的状态链路最接近的业务状态链路,将找出的业务状态链路所对应的业务类型作为本业务的所属类型。
本发明方法和装置的有益效果是:本发明的方法和装置通过构建状态池和业务状态链路来实现操作数据库的建立后,当在线应用时,根据当前实时传输的业务数据来得出当前的业务状态链路,接着将当前的业务状态链路与操作数据库中的业务状态链路进行比对,根据比对结果来实现营业员的画像评估,这样能实现细致营业员画像的描述,可快速真实地定量实时获取营业员画像信息,从而对营业员的业务操作行为进行评估,有利于后续服务质量的提高,以及为企业决策提供重要的数据支撑。
附图说明
图1是本发明一种基于大数据的电信营业员画像信息处理方法的步骤流程图;
图2是本发明一种基于大数据的电信营业员画像信息处理装置的结构框图;
图3是本发明一种基于大数据的电信营业员画像信息处理方法的一具体核心流程示意图;
图4是状态池的示意图;
图5是有限状态自动机的示意图;
图6是有限状态自动机的重建原理示意图。
具体实施方式
如图1所示,一种基于大数据的电信营业员画像信息处理方法,该方法的步骤包括:
获取实时传输的业务数据;
将根据获得的业务数据而构建得到的当前的业务状态链路与操作数据库中的业务状态链路进行比对判断;
其中,所述操作数据库的建立步骤包括:
构建状态池;
根据构建的状态池,构建业务状态链路。
与上述处理方法对应的装置包括处理器,适于实现各指令,所述指令适于由处理器加载并执行以下步骤:
获取实时传输的业务数据;
将根据获得的业务数据而构建得到的当前的业务状态链路与操作数据库中的业务状态链路进行比对判断;
其中,所述操作数据库的建立步骤包括:
构建状态池;
根据构建的状态池,构建业务状态链路。
如图2所述,一种基于大数据的电信营业员画像信息处理装置,其包括:
获取模块,用于获取实时传输的业务数据;
判断模块,用于将根据获得的业务数据而构建得到的当前的业务状态链路与操作数据库中的业务状态链路进行比对判断。
结合以下优选具体实施例来对本发明做进一步的阐述。
本发明基于真实获取的业务数据来对数据进行深度挖掘学习,如图3所示,整个系统的处理分为两个过程:1、学习系统,实现营业员模式的学习,其中,所述学习的过程主要包括有数据整理与ETL(Extract-Transform-Load,用于描述将数据从来源端经过抽取、转换、加载至目的端的过程)、业务的学习、业务数据的细化整理与重点业务的拨测采样、学习结果入库这几个步骤;2、实现系统,实现营业员画像的实时描绘。上述的两个过程会分为五大步骤:1、构建状态池;2、构建状态链路;3、画像比对;4、业务的切割和分类;5、营业员行为分类。
第一步骤:构建状态池。
通过获取从交换机上采集回来的业务数据,可以将业务的类别以及业务可能的状态构建出状态池。例如对于密码重置这个业务来讲,会有几个办理状态:1、进入菜单;2、选择重置类型;3、九选三验证身份;4、输入新的密码;5、提交。
本技术通过对业务系统的全量业务数据进行扫描,从而完整地找到对于每一个种类的业务,以及每一个种类的业务所对应可能出现的业务状态,然后对这些业务状态分门别类进行存放,形成业务状态池,为后续的业务状态跳转的分析提供基础数据。其中,所述的状态池如图4所示。
对于每一个命令字,都会含有引用源地址referer和统一资源标示符uri这两个参数,其中,前者,即引用源地址referer,用于指向上一个命令字所对应的页面,后者,即统一资源标示符uri,用于指明了本命令字(即当前命令字)所对应的业务页面,因此对于命令字A,会有refererA和uriA,此时这两个参数共同构建了状态A。如图4所示,对于主干命令字,它们之间的数据流A、B、C、D是一环扣一环,通过所述的两个关键参数便能够连接在一起。然而,在过程中会出现支流,如状态X和Y,这些从技术上来说,其实质并不是表示状态,而是某些页面需要加载的CSS、JPG等资源信息,因此,它们在状态图上的特征是,仅有上级状态,而没有下级状态。
因此,对于构建状态池,其采用以下步骤,便可实现对所有状态进行遍历,以实现状态池的构建:
S101、遍历所有的命令字,将命令字中所包含的引用源地址referer和统一资源标示符uri提取出来;
S102、将提取出来的引用源地址referer构成引用源地址集合{referer},将提取出来的统一资源标示符uri构成统一资源标示符集合{uri};
S103、遍历引用源地址集合{referer}中的元素,根据遍历的元素,从统一资源标示符集合{uri}中进行查找,查找出属于引用源地址集合{referer}且属于统一资源标示符集合{uri}的第一数据x,即,x属于{referer}&&x属于{uri};
S104、找出所有的x,而x所对应的命令字为关键命令字,将关键命令字所对应的状态纳入状态池,实现状态池的构建;
其中,从命令字提取的referer和uri,构成{s},其中,s代表该命令字所对应的状态(status),每个状态仅记录一次。可见,所述状态池中包含了各类业务所对应的状态。
还有,在实现状态池的构建时,将状态池中referer与uri相同的状态单独存放,可用于后续的数据研究。
第二步骤:构建业务状态链路
在构建业务状态链路这一步骤中,通过提取每一个业务状态里,所记录的跳转前信息,这样便可得到每个业务状态之间的跳转关系。例如,对于套餐办理的业务,在“合规性验证”之后,会存在两种状态的跳转可能:1、顺利进入下一步计算费用的步骤;2、返回上一步调整产品套餐。
因此,对于构建业务状态链路这一步骤,其通过以下步骤来实现:
在构建各类业务的状态池中,对状态池中的状态进行遍历,获取到状态之间的跳转顺序,形成了业务状态链路,这些链路反映的就是营业员的操作步骤,通过获取识别这些操作步骤,便可客观地评价每一个营业员的操作情况。其中,将状态池中的所有状态以上下连接的方式串联为一张路径图,上为referer,下为uri,形成一状态跳转链路图,状态跳转链路图记录的是页面的可跳转方式。具体地,对于一笔业务所对应的状态链路,将该笔业务的所有命令字找出来,通过找出的命令字所对应的状态之间的可连接方式从而获取该笔业务所对应的状态链路。
在实现上述对状态池中的状态进行遍历,获取到状态之间的跳转顺序,形成了业务状态链路这一步骤时,其具体采用的算法架构为FSM(有限状态自动机),通过FSM来对识别全量业务,令一个有限状态自动机表示一个业务流程或业务模式,如图5所示。
对于图5所示的有限状态自动机,其所表示的内容有:
●A、B均表示为一个业务状态,即一个业务步骤所对应调用的命令字序列;
●从一个状态跳转到另一个状态会发送一个数据包;
●从有限状态自动机的开始状态移动到结束状态的过程所产生的数据包序列,就对应着该自动机所代表的业务;
●当业务发生变更时,只需根据状态的转移流向概率更改FSM对应结构即可。
当业务系统发生较大变更时,所采用的算法架构根据识别算法能自动学习新的业务步骤与命令字序列之间的映射关系,如图6所示,然后FSM的架构根据识别算法得到的状态转移流向概率重建一个新的状态机,以兼容适应新业务系统。
第三步骤:画像比对
为了校正在步骤二里面构建的业务状态链路是否真实反映营业员的操作行为,需要通过拨测或提取厂家的日志,对业务状态链路学习的结果进行对照比对,实现对构建的业务状态链路进行比对校正。
由于厂家的日志仅仅记录了业务的概况,没有涉及业务的状态链路,因此在利用日志来进行比对校正的过程中,仅能校正出业务种类、业务实例个数是否能够匹配得上,从而从整体上评估模型的准确性。通常,由于时钟不同步、系统延迟等等外部的因素影响,一般偏差率在5%以内即可满足应用的要求。
第四步骤:业务的切割和分类
经过上述第一至三这三个步骤,系统已经完成了初始化的数据学习处理,可以正式应用于生产系统。上述三个步骤得出的结果形成一套营业员业务的操作数据库,而在在线应用中,电信营业员画像信息处理方法包括:采用分布式计算和流式计算的技术,对实时传输到系统的业务数据进行获取(即获取实时传输的业务数据);将当前的业务状态链路(所述当前的业务状态链路是根据获得的业务数据构建得到的)与操作数据库中的业务状态链路进行比对判断,从而得到营业员正在办理什么业务、处于业务办理的哪个状态上、状态的跳转是否最优、是否存在异常的操作等比对判断结果,即营业员的业务办理操作行为。
对于将当前的业务状态链路与操作数据库中的业务状态链路进行比对判断这一步骤中包括有业务的切割步骤和业务的分类步骤。
对于所述业务的切割步骤,其具体包括:以menuid、工号、userPhone以及预设时间,如7分钟,作为范围来进行要素的分割,从而将命令字分割为多个桶,其中,一个桶中包含一笔业务或多笔业务,当一个桶中包含多笔业务时,利用userNum来对多笔业务进行区分。对于营业员行为的切割主要是为了后续能够准确地识别出营业员正在进行何种类型的操作,实现操作类型的划分,即分类,这是由于对于不同类型的操作,企业管理者、企业用户的关注程度是不一样的,而且在企业用户产生投诉的时候,一般不是针对具体操作进行投诉,而是针对操作所属的类型(也就是业务)进行投诉,此时针对业务类型的准确分类,将能够提供很好的投诉处理参考作用。
根据业务的切割结果,对业务进行分类。在分类的时候,一般是参考状态之间的跳转关系来进行的,即所述业务的分类步骤,其实现原理步骤包括有:
在新的命令字到来的时候,从新的命令字(即当前获得的命令字)中提取出对应的引用源地址Rn和统一资源标示符Un,其中,当前获得的命令字为第n个命令字,Rn对应从第n个命令字提取出的引用源地址,Un对应从第n个命令字提取出的统一资源标示符,Rn和Un构成状态Sn;
判断从当前获得的命令字中所提取出的引用源地址Rn是否等于从上一个获得的命令字中所提取出的Un-1,即判断Rn=Un-1是否成立,若是,则表示状态链路能够链接对应上,符合链接要求;反之,则需要新建状态链路,新建的状态链路主要用于后续的业务研究;
重复上述步骤,直到本业务的最后一个状态Sn+x,则结束一次业务的判断,得到本业务的状态链路,然后,从操作数据库中找出与本业务的状态链路最接近的业务状态链路,将找出的业务状态链路所对应的业务类型作为本业务的所属类型,实现本业务的类型识别,从而获知营业员正在处理何种业务类型。
对于所述从操作数据库中找出与本业务的状态链路最接近的业务状态链路这一步骤,其包括:
当本业务的menuid为空时,将操作数据库中的业务状态链路与本业务的状态链路比较,从操作数据库中找出与本业务的状态链路相似度最高的业务状态链路;
当本业务的menuid不为空时,从操作数据库中找出menuid与本业务的menuid相同的业务状态链路,从找出的业务状态链路中选出与本业务的状态链路相似度最高的业务状态链路;
其中,所述相似度的阈值设为0.5。
第五步骤:营业员行为分类
完成业务状态链路的比对判断后,便可得出每个营业员的业务办理操作行为,在本步骤中,主要是对识别出来的营业员的业务办理操作行为进行评估、打上标签及进行行为分类。例如,某些营业员存在步骤之间的等待时间过长,超出平均等待时间的一倍以上,此时即可记录为行为的异常,需要反馈给上级领导及时了解情况;又例如,某些营业员在同一时间穿插办理了几个不同的业务,那么决策者就需要思考这些业务有无合并的必要,以便提升用户的体验。
由上述可得,本发明的目的在于发明一种基于海量业务数据,描述营业员办理业务时的画像信息,从而评估每个营业员办理业务的操作效率、操作合规性、操作连续性,并且能够支持营业员业务素质的横向比较,找出营业厅服务质量的优化空间,为电信营业厅服务质量的进一步提升提供数据支持。本发明所具有的优点包括有:
1、画像描绘全面细致:绘制出的营业员画像,能够完整地展现业务办理过程中,系统的影响比例以及营业员的影响比例,甚至对于营业员并行办理业务的行为也能完整的呈现;
2、提供定量的画像描述:一般的画像描述手段,都是定性的标签,无法将相应的信息定量描绘出来,而本方案可以对各项KPI进行定量描述,例如营业员操作时长,这样不仅能够按照排行打上“快中慢”的标签,还能定量描述到毫秒的级别;
3、画像实时绘制:画像描绘所用到的是交换机实时镜像的业务数据,并采用分布式流式计算技术,可以使得交易发生1分钟之内计算画像结果,因此可以在客户产生不满时,快速找到原因,挽回企业损失。
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (8)
1.一种基于大数据的电信营业员画像信息处理方法,其特征在于:该方法的步骤包括:
获取实时传输的业务数据;
将根据获得的业务数据而构建得到的当前的业务状态链路与操作数据库中的业务状态链路进行比对判断,得到当前的业务办理操作行为;
其中,所述操作数据库的建立步骤包括:
构建状态池;
根据构建的状态池,构建业务状态链路;
所述构建状态池这一步骤,其包括:
遍历所有的命令字,将命令字中所包含的引用源地址和统一资源标示符提取出来;
将提取出来的引用源地址构成引用源地址集合,将提取出来的统一资源标示符构成统一资源标示符集合;
遍历引用源地址集合中的元素,根据遍历的元素,从统一资源标示符集合中进行查找,查找出属于引用源地址集合且属于统一资源标示符集合的第一数据;
将查找出的第一数据所对应的命令字作为关键命令字,将关键命令字所对应的状态纳入至状态池;
其中,所述的状态由命令字中所包含的引用源地址和统一资源标示符构成。
2.根据权利要求1所述一种基于大数据的电信营业员画像信息处理方法,其特征在于:所述构建业务状态链路这一步骤,其包括:
对状态池中的状态进行遍历,获取到状态之间的跳转顺序,生成业务状态链路。
3.根据权利要求1-2任一项所述一种基于大数据的电信营业员画像信息处理方法,其特征在于:所述操作数据库的建立步骤还包括:
通过拨测或日志,对构建的业务状态链路进行比对校正。
4.根据权利要求1-2任一项所述一种基于大数据的电信营业员画像信息处理方法,其特征在于:所述将根据获得的业务数据而构建得到的当前的业务状态链路与操作数据库中的业务状态链路进行比对判断,得到当前的业务办理操作行为这一步骤中包括有业务的分类步骤,所述业务的分类步骤包括:
从当前获得的命令字中提取出对应的引用源地址Rn和统一资源标示符Un,其中,Rn和Un构成状态Sn;
判断从当前获得的命令字中所提取出的引用源地址Rn是否等于从上一个获得的命令字中所提取出的Un-1,若是,则表示状态链路符合链接要求,反之,则需要新建状态链路;
重复上述步骤,直到本业务的最后一个状态,则结束一次业务的判断,得到本业务的状态链路,然后,从操作数据库中找出与本业务的状态链路最接近的业务状态链路,将找出的业务状态链路所对应的业务类型作为本业务的所属类型。
5.一种基于大数据的电信营业员画像信息处理装置,包括处理器,适于实现各指令,其特征在于:所述指令适于由处理器加载并执行以下步骤:
获取实时传输的业务数据;
将根据获得的业务数据而构建得到的当前的业务状态链路与操作数据库中的业务状态链路进行比对判断,得到当前的业务办理操作行为;
其中,所述操作数据库的建立步骤包括:
构建状态池;
根据构建的状态池,构建业务状态链路;
所述构建状态池这一步骤,其包括:
遍历所有的命令字,将命令字中所包含的引用源地址和统一资源标示符提取出来;将提取出来的引用源地址构成引用源地址集合,将提取出来的统一资源标示符构成统一资源标示符集合;
遍历引用源地址集合中的元素,根据遍历的元素,从统一资源标示符集合中进行查找,查找出属于引用源地址集合且属于统一资源标示符集合的第一数据;
将查找出的第一数据所对应的命令字作为关键命令字,将关键命令字所对应的状态纳入至状态池;
其中,所述的状态由命令字中所包含的引用源地址和统一资源标示符构成。
6.根据权利要求5所述一种基于大数据的电信营业员画像信息处理装置,其特征在于:所述构建业务状态链路这一步骤,其包括:
对状态池中的状态进行遍历,获取到状态之间的跳转顺序,生成业务状态链路。
7.根据权利要求5-6任一项所述一种基于大数据的电信营业员画像信息处理装置,其特征在于:所述操作数据库的建立步骤还包括:
通过拨测或日志,对构建的业务状态链路进行比对校正。
8.根据权利要求5-6任一项所述一种基于大数据的电信营业员画像信息处理装置,其特征在于:所述将根据获得的业务数据而构建得到的当前的业务状态链路与操作数据库中的业务状态链路进行比对判断,得到当前的业务办理操作行为这一步骤中包括有业务的分类步骤,所述业务的分类步骤包括:
从当前获得的命令字中提取出对应的引用源地址Rn和统一资源标示符Un,其中,Rn和Un构成状态Sn;
判断从当前获得的命令字中所提取出的引用源地址Rn是否等于从上一个获得的命令字中所提取出的Un-1,若是,则表示状态链路符合链接要求,反之,则需要新建状态链路;
重复上述步骤,直到本业务的最后一个状态,则结束一次业务的判断,得到本业务的状态链路,然后,从操作数据库中找出与本业务的状态链路最接近的业务状态链路,将找出的业务状态链路所对应的业务类型作为本业务的所属类型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710418917.7A CN107392415B (zh) | 2017-06-06 | 2017-06-06 | 一种基于大数据的电信营业员画像信息处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710418917.7A CN107392415B (zh) | 2017-06-06 | 2017-06-06 | 一种基于大数据的电信营业员画像信息处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107392415A CN107392415A (zh) | 2017-11-24 |
CN107392415B true CN107392415B (zh) | 2020-10-16 |
Family
ID=60333127
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710418917.7A Active CN107392415B (zh) | 2017-06-06 | 2017-06-06 | 一种基于大数据的电信营业员画像信息处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107392415B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109726995A (zh) * | 2019-01-03 | 2019-05-07 | 中国银行股份有限公司 | 业务功能执行方法和装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102361484B (zh) * | 2011-07-05 | 2012-11-28 | 上海交通大学 | 被动网络性能测量系统及其页面识别方法 |
JP6151508B2 (ja) * | 2012-12-10 | 2017-06-21 | 株式会社ディアイティ | 中継装置、中継方法および中継プログラム |
CN103618692B (zh) * | 2013-10-28 | 2017-01-11 | 中国航天科工集团第二研究院七〇六所 | 一种构建日志快速匹配的方法 |
CN105429779B (zh) * | 2015-10-28 | 2019-05-03 | 上海熙菱信息技术有限公司 | 一种网络业务数据自动识别系统及方法 |
CN105530312B (zh) * | 2015-12-26 | 2018-08-14 | 中国人民解放军信息工程大学 | 网络服务路径选择系统及其选择方法 |
CN106228306A (zh) * | 2016-07-26 | 2016-12-14 | 深圳中兴网信科技有限公司 | 基于建模配置的业务流程展示方法和业务流程展示装置 |
-
2017
- 2017-06-06 CN CN201710418917.7A patent/CN107392415B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN107392415A (zh) | 2017-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110245034B (zh) | 根据使用数据的结构化日志模式的服务度量分析 | |
CN105930363B (zh) | 一种基于html5网页的用户行为分析方法及装置 | |
CN103995715B (zh) | 应用程序的修复方法、装置及服务器 | |
US20080040417A1 (en) | System and method for allocating workflow operations to a computing device | |
US20140012800A1 (en) | Apparatus and method for providing application for processing big data | |
CN108459967A (zh) | 基于用户接口状态流图的Web应用测试用例生成方法 | |
CN110309967A (zh) | 客服会话评分等级的预测方法、系统、设备和存储介质 | |
CN110991984A (zh) | 基于企业信息化异构系统的数字化经营分析平台及方法 | |
CN106407078A (zh) | 基于信息交互的客户端性能监控装置及方法 | |
CN113760730B (zh) | 一种自动化测试的方法和装置 | |
KR102093764B1 (ko) | 서버 및 스토리지 관리 서버 | |
CN107368407A (zh) | 信息处理方法和装置 | |
US10956914B2 (en) | System and method for mapping a customer journey to a category | |
CN110310127B (zh) | 录音获取方法、装置、计算机设备及存储介质 | |
CN107392415B (zh) | 一种基于大数据的电信营业员画像信息处理方法及装置 | |
CN107871055B (zh) | 一种数据分析方法和装置 | |
CN114971693A (zh) | 一种基于bim的工程造价咨询管理系统 | |
CN116719750B (zh) | 软件测试方法及装置、服务器设备和存储介质 | |
CN107391551B (zh) | 一种基于数据挖掘的web业务数据分析方法及系统 | |
CN114039924B (zh) | 集客专线网络资源倾斜的质量保障方法及系统 | |
CN105894249A (zh) | 工单处理方法及装置 | |
CN108536577B (zh) | 程序代码信息处理方法及装置 | |
CN106855843B (zh) | 一种Web系统的性能分析方法和装置 | |
CN114328169A (zh) | 一种动态页面的测试方法及其系统 | |
KR20120004953A (ko) | 웹 서비스의 사용자 체감 성능 모니터링 방법과 이를 위한 프로그램이 기록된 기록매체 및 컴퓨팅 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |