CN110858819A - 基于微信小程序的语料收集方法、装置和计算机设备 - Google Patents
基于微信小程序的语料收集方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN110858819A CN110858819A CN201910760571.8A CN201910760571A CN110858819A CN 110858819 A CN110858819 A CN 110858819A CN 201910760571 A CN201910760571 A CN 201910760571A CN 110858819 A CN110858819 A CN 110858819A
- Authority
- CN
- China
- Prior art keywords
- user
- vocabulary
- input
- account information
- recording
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000004590 computer program Methods 0.000 claims description 13
- 230000007246 mechanism Effects 0.000 claims description 13
- 238000012790 confirmation Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 7
- 241001672694 Citrus reticulata Species 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000003993 interaction Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 206010071299 Slow speech Diseases 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 210000003484 anatomy Anatomy 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 210000000867 larynx Anatomy 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 210000003928 nasal cavity Anatomy 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 210000002105 tongue Anatomy 0.000 description 1
- 210000000515 tooth Anatomy 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/04—Real-time or near real-time messaging, e.g. instant messaging [IM]
- H04L51/046—Interoperability with other network applications or services
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/07—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
- H04L51/18—Commands or executable codes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/08—Network architectures or network communication protocols for network security for authentication of entities
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种基于微信小程序的语料收集方法、装置、计算机设备和计算机可读存储介质,包括在检测到用户登录微信小程序时,采集所述用户的账户信息;获取语料收集操作事件,以采集用户的录音文本;根据所述用户的账户信息,将采集的所述录音文本进行保存。通过微信小程序实现对语料的收集,可以实现对语料的低成本且高效的收集。
Description
技术领域
本发明涉及信息处理技术领域,特别是涉及一种基于微信小程序的语料收集方法、装置和计算机设备。
背景技术
随着AI语音识别技术和语音交互技术愈发的成熟和广泛应用,语料作为语音交互的能源,语料的收集变得极其的重要。高质量的语料可以训练出高可用的语音识别模型,进一步准确的识别出客户的意图。
目前,语料收集主要是通过专业的录音设备及空间来执行,专业语料采集机构的采集成本较高、时间周期较长。因此,目前亟需一种可以兼顾时间、成本及录音质量的语料收集方法。
发明内容
本申请提供一种基于微信小程序的语料收集方法、装置和计算机设备,可以实现语料的高效、低成本收集,且收集的语料质量可以满足使用要求。
一种基于微信小程序的语料收集方法,所述方法包括:
在检测到用户登录微信小程序时,采集所述用户的账户信息;
获取语料收集操作事件,以采集用户的录音文本;
根据所述用户的账户信息,将采集的所述录音文本进行保存。
在一实施例中,所述在检测到用户登录微信小程序时,采集所述用户的账户信息之前,所述方法还包括:
若检测到所述用户为首次进入微信小程序的用户,则展示免责声明页面;
在接收到对所述免责声明的确认指令后,进入用户身份信息登记页面;
接收并保存用户输入的身份信息,所述身份信息包括用户所在地区、所述地区的方言、用户的性别和年龄;
为所述用户分配注册帐号以生成所述用户的账户信息。
在一实施例中,所述获取语料收集操作事件,以采集用户的录音文本包括:
接收录入指令;
推送当前待录入的词汇,并提示语音录入要求;
接收并识别用户录入的词汇是否满足所述语音录入要求,并根据识别结果将所述录入的词汇分为有效词汇和无效词汇。
在一实施例中,所述语音录入要求包括所述词汇的录入时长、录音语速以及录音语言。
在一实施例中,所述根据所述用户的账户信息,将采集的所述录音文本进行保存包括:
若识别到所述有效词汇达到预设录音次数,则根据所述用户的身份信息对所述用户录入的所有词汇进行命名;
将命名后的所有词汇按照预设保存规则保存在多级目录下。
在一实施例中,所述方法还包括:
统计用户完成的有效词汇的数量;
根据所述有效词汇的数量,通过微信平台的红包生成机制生成对应的电子红包;
获取所述用户的账户信息,并将所述电子红包转发至所述用户的账户。
在一实施例中,所述方法还包括:
在接收到用户的注册请求时,检测所述用户是否为受邀人;
若所述用户为受邀人,则获取邀请所述用户的邀请人的账户信息;
通过微信平台的红包生成机制生成对应邀请的电子红包,并将所述电子红包转发至所述邀请人的账户。
在一实施例中,所述接收并识别用户录入的词汇是否满足所述语音录入要求之后,所述方法还包括:
获取所述用户录入词汇的声纹特征,并与用户的账户信息进行匹配;
若识别到所述声纹特征与多个账户信息匹配,则将所述用户的多个账户列入黑名单。
一种基于微信小程序的语料收集装置,所述装置包括:
第一采集模块,用于在检测到用户登录微信小程序时,采集所述用户的账户信息;
第二采集模块,用于获取语料收集操作事件,以采集用户的录音文本;
保存模块,用于根据所述用户的账户信息,将采集的所述录音文本进行保存。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本申请实施例提供的基于微信小程序的语料收集方法、装置、计算机设备和计算机可读存储介质,包括在检测到用户登录微信小程序时,采集所述用户的账户信息;获取语料收集操作事件,以采集用户的录音文本;根据所述用户的账户信息,将采集的所述录音文本进行保存。通过微信小程序实现对语料的收集,可以实现对语料的低成本且高效的收集。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一实施例提供基于微信小程序的语料收集方法的流程图;
图2为一实施例提供的获取语料收集操作事件,以采集用户的录音文本的流程图;
图3为一实施例提供的微信小程序的开机界面示意图;
图4为一实施例提供的录音出界面的示意图;
图5为一实施例提供的奖励明细的示意图;
图6为一实施例提供的分享及奖励明细的示意图;
图7为一个实施例中基于微信小程序的语料收集装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了便于理解本申请,为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图对本申请的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本申请,附图中给出了本申请的较佳实施方式。但是,本申请可以以许多不同的形式来实现,并不限于本文所描述的实施方式。相反地,提供这些实施方式的目的是使对本申请的公开内容理解的更加透彻全面。本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似改进,因此本申请不受下面公开的具体实施例的限制。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述具体的实施方式的目的,不是旨在于限制本申请。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
图1为一实施例提供基于微信小程序的语料收集方法的流程图,如图1所示,基于微信小程序的语料收集方法包括步骤110至步骤130,其中:
步骤110,在检测到用户登录微信小程序时,采集用户的账户信息。
微信小程序,简称小程序,是一种不需要下载安装即可使用的应用,用户通过采用扫描二维码或者搜索到该程序即可打开应用。用户在微信应用中添加用户端微信小程序后,微信小程序在检测到用户点开登录认证平台时,显示用户信息登记页面。用若检测到用户首次进入微信小程序,则展示免责声明页面,展示时间可以为5秒。免责声明页面的信息可以包括隐私条款,在接收到对免责声明的确认指令后,进入用户身份信息登记页面。用户可以通过份信息登记页面中对应的输入窗口输入身份信息。微信小程序接收并保存用户输入的身份信息,身份信息包括用户所在地区、地区的方言、用户的性别和年龄等信息。需要说明的是,在用户登记身份信息后,提示用户的身份信息在点击保存后将无法更改,请确认清楚后再进行保存。
另外,首次注册微信小程序的用户,微信小程序分配给用户唯一ID号作为用户的注册账号以生成用户的账户信息。
步骤120,获取语料收集操作事件,以采集用户的录音文本。
语料收集操作事件可以理解为用户和微信小程序之间的交互过程。具体地,如图2所示,获取语料收集操作事件,以采集用户的录音文本包括步骤210至步骤230,其中:
步骤210,接收录入指令;
步骤220,推送当前待录入的词汇,并提示语音录入要求;
步骤230,接收并识别用户录入的词汇是否满足所述语音录入要求,并根据识别结果将所述录入的词汇分为有效词汇和无效词汇。
具体地,在用户完成注册后,登录即可进入微信小程序,显示界面如图3所示,用户点击立即开启可进入录音主界面,即微信小程序接收到录入指令后进入录音主界面。录音主界面如图4所示。录音主界面包括当前待录入的词汇,并提示语音录入要求,还包括完成次数和奖励规则。
待录入的词汇可以包括唤醒词和命令词,唤醒词和命令词的数量本申请不作限制。本实施例中,待录入的词汇共包括52个词汇,其中有15个唤醒词和37个命令词。语音录入要求包括词汇的录入时长、录音语速以及录音语言。录音语速可以包括快语速、正常语速和慢语速三种,每种语速对应不同的录音时长,录音语言包括方言和普通话两种。本实施例中,同一词汇针对同一采集对象需要录入6次才可以完成对该词汇的录入。6次录入具体包括3次有效普通话(提示用户进行快语速、正常语速、慢语速各一次)和3次方言录入(提示用户进行快语速、正常语速、慢语速各一次)共6次。针对不同的语速,可以通过设置不同的录音时长,例如,在需要用户录入正常语速的词汇时,在录音主界面提示:请用正常语速念出上方文字,时长不超过5秒。
可以理解的是,录入时长、录音语速以及录音语言可以包括其他多种不同的语速和录音语言,本实施例仅是举例说明,并不对录入时长、录音语速以及录音语言进行限定。
用户可以通过触发开始录音指令以开始录音,开始录音指令可以是点击按钮以开始录音,也可以是其他方式进行触发微信小程序开始录音。如图4所示,在用户点击话筒按钮后即开始录音。在开始录音后,微信小程序接收并识别用户录入的词汇是否满足语音录入要求,并根据识别结果将录入的词汇分为有效词汇和无效词汇。微信小程序将接收到的录入词汇进行识别,并将满足语音录入要求的录入词汇作为有效词汇,将不满足语音录入要求的录入词汇作为无效词汇。
例如,若当前要求用户以普通话,且用正常语速(5秒内完成对词汇的录入)录入词汇“开机”时,微信小程序在接收到用户录入的词汇时,对用户录入的词汇进行识别。具体地,识别用户录入的词汇是否为标准的普通话、是否在规定的录入时长内完成对该词汇的录入以及录入的是否为“开机”这个词汇。若用户录入的词汇满足以上的所有要求,则将该录入词汇作为有效词汇,若用户录入的词汇有一项不满足要求,例如,识别到用户录入的词汇不是普通话,则将该录入词汇作为无效词汇,提示用户重新录入。
需要说明的是,普通话及方言需要通过语音识别。方言的识别本市实施中使用百度AI接口进行识别。另外针对方言的采集,方言地区若为省级,则可以设置收集音频的数量,若是市级,由于市级的方言仅是在统计报表的时候使用,并不是限制用户上传录音的标准,因此市级非必选项目,如浙江杭州等。
步骤130,根据用户的账户信息,将采集的录音文本进行保存。
若识别到词汇完成录入,则对用户录入的所有词汇进行保存。具体地,若识别到有效词汇达到预设录音次数,则根据用户的身份信息对用户录入的所有词汇进行命名。
若识别到词汇完成录入,即完成了6次有效录入,则对用户录入的所有词汇进行保存。所有词汇包括在语料采集过程中,用户录入的有效词汇和无效词汇。存储无效词汇也是作为测试之用,用于测试智能麦克风是不是不会被无效语料误触发、无效词汇不被智能麦克风所识别。需要说明的是,预设录音次数为6次。可以理解的是,预设录音次数也可以为4次、8次或10次等,具体次数可以根据实际情况进行设置。
当用户完成对词汇的录入后,对该用户录入的所有词汇整理成音频文件进行并进行命名。具体命名方式如下:
对于无效词汇,命名方式为:用户ID-省份ID-年龄-性别(0、1)-(1、2、3、4.....).wav,当用户为女性时,性别属性可以记为0,当用户为男性时,性别属性可以记为1。无效词汇的保存无上限,因此名称的第5个属性可以Wie无穷个。对于有效词汇,命名方式为:用户ID-省份id-年龄-性别(0、1)-(1、2、3).wav;对于方言词汇,命名方式为:用户ID-省份id-年龄-性别(0、1)-(1、2、3).wav。
对用户录入的词汇进行将命名后,将所有词汇按照预设保存规则保存在用户的账号下的多级目录中。其中一级目录分别为无效词汇、有效词汇和方言词汇;二级目录为对应的具体词汇,每一个词汇对应一个目录。
本实施例提供的基于微信小程序的语料收集方法包括:在检测到用户登录微信小程序时,采集用户的账户信息;获取语料收集操作事件,以采集用户的录音文本;根据用户的账户信息,将采集的录音文本进行保存。通过微信小程序实现对语料的收集,可以实现对语料的低成本且高效的收集。
在一实施例中,完成待录入的词汇录入任务可能需要一段时间,如10分钟至20分钟,在录音期间,用户可以自由进出微信小程序。当用户在录音期间退出小程序后,微信小程序会自动保存当前用户录入词汇记录,当用户再次进入微信小程序时,自动从用户退出的节点开始词汇录入,从而可以使用户不需要一次性完成词汇录入,提升了用户体验。
另外,由于待录入的词汇所需要的数量是有限的,例如每一唤醒词的有效录音数量达到1000个即可满足要求。因此,当用户在录音期间退出微信小程序后,若有其他用户对待录入的词汇完成了录入,且数量达到了待录入词汇的数量要求,则当该用户再次进入微信小程序后,展示提示信息,提示用户对应的词汇已完成了录入数量,当前不能再进行录入,从而增加了趣味性。
在一实施例中,语料收集方法还包括:统计用户完成的有效词汇的数量,根据有效词汇的数量,通过微信平台的红包生成机制生成对应的电子红包。
具体地,微信小程序可以调用微信红包接口以生成一定数额的电子红包。电子红包的具体数额与用户完成的有效词汇的数量有关。若设置完成一个有效词汇奖励2元人民币,则若完成N个有效词汇,则生成数额为2*N的电子红包。
根据用户的账户信息,将电子红包转发至用户的账户。在录音主界面中显示未发放的奖励数据和奖励明细的图标,用户点开图标可以对具体的数据信息进行查看。如图4所示,右下角的礼物图标为奖励明细,人像为分享统计。当用户点击礼物图标时,显示的界面如图5所示,分别有我的奖励和分享奖励两个信息,图5显示的是我的奖励信息。通过滑动操作可以查看分享奖励信息。当用户点击人像图标时,可以分享该微信小程序给其他微信好友。
通过红包奖励机制对录入有效词汇的用户进行奖励,可以激发用户的使用兴趣,以便更有效地完成对语料的收集工作。另外,若用户完成了所有词汇的录入(本申请共有52个词汇),则会额外再生成一个电子红包转发至用户的账户,以对用户进行额外的奖励。
在一实施例中,语料收集方法还包括:在接收到用户的注册请求时,检测用户是否为受邀人。若用户为受邀人,则获取邀请用户的邀请人的账户信息。通过微信平台的红包生成机制生成对应邀请的电子红包,并将电子红包转发至邀请人的账户。
客户端显示的用于输入注册信息的指定界面可以为初始注册界面,并且,初始注册界面中可以包括用于输入邀请人标识的文本框。这样,用户在输入注册信息时,可以将邀请人标识输入至文本框中,以便于客户端在向服务器发送注册请求时,能够将邀请人标识携带在注册请求中一同发送给服务器。其中,邀请人标识可以为与邀请人的注册帐号相对应的唯一编码。
本实施方式中,微信小程序在接收到用户的注册请求时,通过检测注册请求中是否携带邀请人标识的方式,检测用户是否为受邀人,如果注册请求中携带邀请人标识,则判定用户为受邀人。具体地,客户端上的微信小程序在接收到用户的注册请求时,显示的用于输入注册信息界面可以包括用于输入邀请人标识的文本框。这样,用户在输入注册信息时,可以将邀请人标识输入至文本框中,以便于客户端在想服务器发送注册请求时,能够将邀请人标识携带在注册请求中一同发送给服务器。其中,邀请人标识可以为与邀请人的注册帐号相对应的唯一编码。服务器检测注册请求中是否携带邀请人标识,以检测用户是否为受邀人。若检测到用户为受邀人,则根据邀请人标识获取邀请人的注册帐号,并通过微信平台的红包生成机制生成对应的电子红包,并将电子红包转发至邀请人的账户,该电子红包可以理解为推广奖励红包。
在一实施例中,在检测到新的用户注册微信小程序时,自动识别邀请该用户的邀请人,并获取该邀请人的注册账号,并通过微信平台的红包生成机制生成对应的电子红包,并将电子红包转发至邀请人的账户,该电子红包可以理解为推广奖励红包。
另外,监测受邀人完成任务的状态,若受邀人完成了词汇的成功录入,一方面要生成电子红包转发至受邀人的账户,还要生成另一个电子红包至邀请人的账户,以对邀请人和受邀人均进行奖励。如图6所示,邀请人邀请的张三和李四两个用户中,其中,张三完成了2个词汇的录入,则奖励邀请人20.88元,张三完成了10个词汇的录入,则奖励邀请人50元。可以理解的是,奖励数额可以是其他数额,具体数额本申请不作限制。
在一实施例中,在接收并识别用户录入的词汇是否满足语音录入要求之后,方法还包括:
获取用户录入词汇的声纹特征,并与用户的账户信息进行匹配;
若识别到声纹特征与多个账户信息匹配,则将用户的多个账户列入黑名单。
在获取到用户录入的词汇时,对录入的词汇进行声纹特征解析,以获取用户录音的声纹特征。声纹(Voiceprint)是用电声学仪器显示的携带言语信息的声波频谱。人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,每个人在讲话时使用的发声器官:舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面的差异很大,所以任何两个人的声波频谱都有差异。声纹特征是与人类的发音机制的解剖学结构有关的声学特征,如频谱、倒频谱、共振峰、基音、反射系数、鼻音、带深呼吸音、沙哑音、笑声等。由于每个人的发音器官都不尽相同,通过识别音频信号的声纹特征可以准确辨认不同的说话人对应的音频。
不同的声纹特征对应不同的用户,由于对注册微信小程序的用户均分配给用户唯一ID号作为用户的注册账号,因此通过将识别的声纹特征与用户的账户信息进行匹配可以识别同一用户是否使用多个账户进行录音,若是,则将该用户使用的账号列入黑名单,禁止用户使用微信小程序。
在一实施例中,将待录入的词汇设置为乱序,即不同账户的微信小程序展示的待录入词汇的顺序不同,这样当同一用户使用多台电子设备登录微信小程序进行同时录音时,则所录入的词汇只会满足一台电子设备的微信小程序的录入要求,从而可以降低同一用户采用多个设备登录微信小程序同时录音的可能性。
由于通过微信小程序进行语料收集只需要一人一帐户录音即可,这样收集的语料才具备使用价值。倘若一人使用多个帐户进行录音,则最终收集到的有效语料仅为一个人,付出的奖励金和有效语料回报不成正比。通过上述方法可以杜绝上述现象发生。
在一实施例中,微信小程序的后台可以记录以下内容:导航菜单、密码修改、用户总数量、词汇收集总情况(无效、有效、方言)、今日收集情况(无效、有效、方言)、今日奖励发放情况等信息,点击任何一个区域均可以查看对应的数据。也可以浏览注册用户的信息,支持查询和录音查看功能。查看用户录音功能具体可以是展示用户完成录音的词汇,且可以在线试听。也可以查询平台发放的奖励历史记录,包括用户ID、发放时间、金额和转账单号等信息。
另外,还可以在后台设置词汇的类型、录入最高时长、各省采集的数量以及新增市名等。
应该理解的是,虽然图1和图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1和图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一实施例中,如图7所示,提供了一种基于微信小程序的语料收集装置,包括:第一采集模块710、第二采集模块720和保存模块730,其中:
第一采集模块710,用于在检测到用户登录微信小程序时,采集所述用户的账户信息;
第二采集模块720,用于获取语料收集操作事件,以采集用户的录音文本;
保存模块730,用于根据用户的账户信息,将采集的所述录音文本进行保存。
在一实施例中,在第一采集模块710检测到用户登录微信小程序时,采集所述用户的账户信息之前,还包括:
若检测到所述用户为首次进入微信小程序的用户,则展示免责声明页面;
在接收到对所述免责声明的确认指令后,进入用户身份信息登记页面;
接收并保存用户输入的身份信息,所述身份信息包括用户所在地区、所述地区的方言、用户的性别和年龄;
为所述用户分配注册帐号以生成所述用户的账户信息。
在一实施例中,第二采集模块720获取语料收集操作事件,以采集用户的录音文本包括:
接收录入指令;
推送当前待录入的词汇,并提示语音录入要求;
接收并识别用户录入的词汇是否满足所述语音录入要求,并根据识别结果将所述录入的词汇分为有效词汇和无效词汇。
在一实施例中,所述语音录入要求包括所述词汇的录入时长、录音语速以及录音语言。
在一实施例中,保存模块730若识别到所述有效录音达到预设录音次数,则根据所述用户的身份信息对所述用户录入的所有词汇进行命名;
将命名后的所有词汇按照预设保存规则保存在多级目录下。
在一实施例中,所述装置还包括奖励模块,用于统计用户完成的有效词汇的数量;
根据所述有效词汇的数量,通过微信平台的红包生成机制生成对应的电子红包;
获取所述用户的账户信息,并将所述电子红包转发至所述用户的账户。
在一实施例中,奖励模块还用于在接收到用户的注册请求时,检测所述用户是否为受邀人;
若所述用户为受邀人,则获取邀请所述用户的邀请人的账户信息;
通过微信平台的红包生成机制生成对应邀请的电子红包,并将所述电子红包转发至所述邀请人的账户。
在一实施例中,第二采集模块720接收并识别用户录入的词汇是否满足所述语音录入要求之后,还包括:
获取所述用户录入词汇的声纹特征,并与用户的账户信息进行匹配;
若识别到所述声纹特征与多个账户信息匹配,则将所述用户的多个账户列入黑名单。
关于基于微信小程序的语料收集装置的具体限定可以参见上文中对于基于微信小程序的语料收集方法的限定,在此不再赘述。上述基于微信小程序的语料收集装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于微信小程序的语料收集方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
在检测到用户登录微信小程序时,采集所述用户的账户信息;
获取语料收集操作事件,以采集用户的录音文本;
根据所述用户的账户信息,将采集的所述录音文本进行保存。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
在检测到用户登录微信小程序时,采集所述用户的账户信息;
获取语料收集操作事件,以采集用户的录音文本;
根据所述用户的账户信息,将采集的所述录音文本进行保存。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (11)
1.一种基于微信小程序的语料收集方法,其特征在于,所述方法包括:
在检测到用户登录微信小程序时,采集所述用户的账户信息;
获取语料收集操作事件,以采集用户的录音文本;
根据所述用户的账户信息,将采集的所述录音文本进行保存。
2.根据权利要求1所述的方法,其特征在于,所述在检测到用户登录微信小程序时,采集所述用户的账户信息之前,所述方法还包括:
若检测到所述用户为首次进入微信小程序的用户,则展示免责声明页面;
在接收到对所述免责声明的确认指令后,进入用户身份信息登记页面;
接收并保存用户输入的身份信息,所述身份信息包括用户所在地区、所述地区的方言、用户的性别和年龄;
为所述用户分配注册帐号以生成所述用户的账户信息。
3.根据权利要求1所述的方法,其特征在于,所述获取语料收集操作事件,以采集用户的录音文本包括:
接收录入指令;
推送当前待录入的词汇,并提示语音录入要求;
接收并识别用户录入的词汇是否满足所述语音录入要求,并根据识别结果将所述录入的词汇分为有效词汇和无效词汇。
4.根据权利要求3所述的方法,其特征在于,所述语音录入要求包括所述词汇的录入时长、录音语速以及录音语言。
5.根据权利要求3所述的方法,其特征在于,所述根据所述用户的账户信息,将采集的所述录音文本进行保存包括:
若识别到所述有效词汇达到预设录音次数,则根据所述用户的身份信息对所述用户录入的所有词汇进行命名;
将命名后的所有词汇按照预设保存规则保存在多级目录下。
6.根据权利要求3所述的方法,其特征在于,所述方法还包括:
统计用户完成的有效词汇的数量;
根据所述有效词汇的数量,通过微信平台的红包生成机制生成对应的电子红包;
获取所述用户的账户信息,并将所述电子红包转发至所述用户的账户。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在接收到用户的注册请求时,检测所述用户是否为受邀人;
若所述用户为受邀人,则获取邀请所述用户的邀请人的账户信息;
通过微信平台的红包生成机制生成对应邀请的电子红包,并将所述电子红包转发至所述邀请人的账户。
8.根据权利要求3所述的方法,其特征在于,所述接收并识别用户录入的词汇是否满足所述语音录入要求之后,所述方法还包括:
获取所述用户录入词汇的声纹特征,并与用户的账户信息进行匹配;
若识别到所述声纹特征与多个账户信息匹配,则将所述用户的多个账户列入黑名单。
9.一种基于微信小程序的语料收集装置,其特征在于,所述装置包括:
第一采集模块,用于在检测到用户登录微信小程序时,采集所述用户的账户信息;
第二采集模块,用于获取语料收集操作事件,以采集用户的录音文本;
保存模块,用于根据所述用户的账户信息,将采集的所述录音文本进行保存。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910760571.8A CN110858819A (zh) | 2019-08-16 | 2019-08-16 | 基于微信小程序的语料收集方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910760571.8A CN110858819A (zh) | 2019-08-16 | 2019-08-16 | 基于微信小程序的语料收集方法、装置和计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110858819A true CN110858819A (zh) | 2020-03-03 |
Family
ID=69636460
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910760571.8A Pending CN110858819A (zh) | 2019-08-16 | 2019-08-16 | 基于微信小程序的语料收集方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110858819A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113327593A (zh) * | 2021-05-25 | 2021-08-31 | 上海明略人工智能(集团)有限公司 | 用于语料获取的装置及方法、电子设备、可读存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6275806B1 (en) * | 1999-08-31 | 2001-08-14 | Andersen Consulting, Llp | System method and article of manufacture for detecting emotion in voice signals by utilizing statistics for voice signal parameters |
US20160217786A1 (en) * | 2006-04-05 | 2016-07-28 | Amazon Technologies, Inc. | Hosted voice recognition system for wireless devices |
CN107368724A (zh) * | 2017-06-14 | 2017-11-21 | 广东数相智能科技有限公司 | 基于声纹识别的防作弊网络调研方法、电子设备及存储介质 |
CN108831476A (zh) * | 2018-05-31 | 2018-11-16 | 平安科技(深圳)有限公司 | 语音采集方法、装置、计算机设备及存储介质 |
CN109003600A (zh) * | 2018-08-02 | 2018-12-14 | 科大讯飞股份有限公司 | 消息处理方法及装置 |
CN109150700A (zh) * | 2018-09-06 | 2019-01-04 | 北京云测信息技术有限公司 | 一种数据采集的方法及装置 |
CN109493869A (zh) * | 2018-12-25 | 2019-03-19 | 苏州思必驰信息科技有限公司 | 音频数据的采集方法及系统 |
CN109902226A (zh) * | 2019-01-25 | 2019-06-18 | 上海基分文化传播有限公司 | 一种用户推荐方法和系统及客户端设备 |
-
2019
- 2019-08-16 CN CN201910760571.8A patent/CN110858819A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6275806B1 (en) * | 1999-08-31 | 2001-08-14 | Andersen Consulting, Llp | System method and article of manufacture for detecting emotion in voice signals by utilizing statistics for voice signal parameters |
US20160217786A1 (en) * | 2006-04-05 | 2016-07-28 | Amazon Technologies, Inc. | Hosted voice recognition system for wireless devices |
CN107368724A (zh) * | 2017-06-14 | 2017-11-21 | 广东数相智能科技有限公司 | 基于声纹识别的防作弊网络调研方法、电子设备及存储介质 |
CN108831476A (zh) * | 2018-05-31 | 2018-11-16 | 平安科技(深圳)有限公司 | 语音采集方法、装置、计算机设备及存储介质 |
CN109003600A (zh) * | 2018-08-02 | 2018-12-14 | 科大讯飞股份有限公司 | 消息处理方法及装置 |
CN109150700A (zh) * | 2018-09-06 | 2019-01-04 | 北京云测信息技术有限公司 | 一种数据采集的方法及装置 |
CN109493869A (zh) * | 2018-12-25 | 2019-03-19 | 苏州思必驰信息科技有限公司 | 音频数据的采集方法及系统 |
CN109902226A (zh) * | 2019-01-25 | 2019-06-18 | 上海基分文化传播有限公司 | 一种用户推荐方法和系统及客户端设备 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113327593A (zh) * | 2021-05-25 | 2021-08-31 | 上海明略人工智能(集团)有限公司 | 用于语料获取的装置及方法、电子设备、可读存储介质 |
CN113327593B (zh) * | 2021-05-25 | 2024-04-30 | 上海明略人工智能(集团)有限公司 | 用于语料获取的装置及方法、电子设备、可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11727918B2 (en) | Multi-user authentication on a device | |
Hoegen et al. | An end-to-end conversational style matching agent | |
EP3881317B1 (en) | System and method for accelerating user agent chats | |
US10270736B2 (en) | Account adding method, terminal, server, and computer storage medium | |
CN104143326B (zh) | 一种语音命令识别方法和装置 | |
CN111355781B (zh) | 一种语音信息交流的管理方法、装置和存储介质 | |
US8095372B2 (en) | Digital process and arrangement for authenticating a user of a database | |
WO2017197953A1 (zh) | 基于声纹的身份识别方法及装置 | |
EP2109097B1 (en) | A method for personalization of a service | |
JP2021533397A (ja) | 話者埋め込みと訓練された生成モデルとを使用する話者ダイアライゼーション | |
CN109074397B (zh) | 信息处理系统和信息处理方法 | |
CN107506166A (zh) | 信息提示方法及装置、计算机装置及可读存储介质 | |
CN109346089A (zh) | 活体身份认证方法、装置、计算机设备和可读存储介质 | |
CN109948438A (zh) | 自动面试评分方法、装置、系统、计算机设备及存储介质 | |
WO2019080502A1 (zh) | 利用语音进行疾病预测的方法、应用服务器和计算机可读存储介质 | |
CN113064983B (zh) | 语义检测方法、装置、计算机设备及存储介质 | |
KR20220018461A (ko) | 음성을 분석하여 이벤트를 생성하는 플랫폼을 운용하는 서버 | |
CN112417412A (zh) | 一种银行账户余额查询方法、装置及系统 | |
CN108322770A (zh) | 视频节目识别方法、相关装置、设备和系统 | |
JP4143541B2 (ja) | 動作モデルを使用して非煩雑的に話者を検証するための方法及びシステム | |
CN110858819A (zh) | 基于微信小程序的语料收集方法、装置和计算机设备 | |
Londhe et al. | [Retracted] Extracting Behavior Identification Features for Monitoring and Managing Speech‐Dependent Smart Mental Illness Healthcare Systems | |
WO2022240411A1 (en) | System and method to determine outcome probability of an event based on videos | |
US20240038222A1 (en) | System and method for consent detection and validation | |
CN109344324A (zh) | 推送活动的方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200303 |
|
RJ01 | Rejection of invention patent application after publication |