CN110502126B - 输入方法及电子设备 - Google Patents
输入方法及电子设备 Download PDFInfo
- Publication number
- CN110502126B CN110502126B CN201910661615.1A CN201910661615A CN110502126B CN 110502126 B CN110502126 B CN 110502126B CN 201910661615 A CN201910661615 A CN 201910661615A CN 110502126 B CN110502126 B CN 110502126B
- Authority
- CN
- China
- Prior art keywords
- input
- result
- data
- user
- electronic device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 127
- 238000004590 computer program Methods 0.000 claims description 10
- 230000005236 sound signal Effects 0.000 description 43
- 230000004044 response Effects 0.000 description 14
- 238000004891 communication Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000007726 management method Methods 0.000 description 9
- 238000010295 mobile communication Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 229920001621 AMOLED Polymers 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 240000005373 Panax quinquefolius Species 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000010791 quenching Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000008719 thickening Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000002618 waking effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请实施例公开了一种输入方法及电子设备。其中,该方法包括:接收用户采用第一输入方式输入的第一数据;根据上述第一数据确定目标结果,该目标结果为用户采用第二输入方式输入第二数据的历史选择结果,上述第一数据与上述第二数据对应的音节序列相同,上述目标结果与上述音节序列对应的通用结果不同;在目标输入界面中显示该目标结果。该方法可以融合用户采用不同输入方式输入的数据,使输出的结果更加符合用户的使用习惯,提升用户的输入效率。
Description
技术领域
本申请涉及电子设备技术领域,尤其涉及一种输入方法及电子设备。
背景技术
输入法应用(input method application,IMA),也可称为输入法引擎(inputmethod engine,IME),或输入法编辑器(input method editor,IME),其是用于实现字词输入的软件。目前,比较常用的输入法应用有华为输入法、搜狗输入法、百度输入法等。通过在手机等终端中安装输入法应用,可以辅助用户在终端中实现字词的输入。现有的输入法应用汇总通常可以为用户提供多种输入方式,包括键盘输入方式、语音输入方式、图像扫描输入方式等,为用户提供了便利。
但是,用户采用某种输入方式输入过的内容,在用户采用另外一种方式输入时可能无法准确输入,导致用户输入效率低。例如,用户采用键盘输入方式输入过一个人名“章三”,在用户采用语音输入方式输入音节序列zhang’san时,可能会被识别成“张三”,而不是用户所期望的“章三”。此时用户需要在编辑框中手动将“张”修改成“章”。此过程操作繁琐,用户体验差。
发明内容
本申请实施例提供了一种输入方法及电子设备,可以提升用户的输入效率。
第一方面,本申请实施例提供了一种输入方法,包括:接收用户采用第一输入方式输入的第一数据;根据上述第一数据确定目标结果,上述目标结果为上述用户采用第二输入方式输入第二数据的历史选择结果,上述第一数据与上述第二数据对应的音节序列相同,上述目标结果与上述音节序列对应的通用结果不同;在目标输入界面中显示上述目标结果。
本申请实施例可以融合用户采用不同的输入方式输入的数据,使用户的使用习惯不受不同输入方式的影响,在用户的使用习惯与大众使用习惯不同的情况下,无论用户采用何种输入方式均可使输出的结果更加符合用户自身的使用习惯,提升用户的输入效率。
在一种可能的实现方式中,上述根据上述第一数据确定目标结果包括:根据上述第一数据查找第一语言库,输出第一结果;上述第一语言库为多种输入方式对应的语言库;根据上述第一数据查找第二语言库,输出第二结果;其中,上述第二语言库为根据上述第二数据产生的语言库;根据上述第一结果及上述第二结果确定目标结果。
本申请实施例可以融合使用该电子设备的用户采用不同的输入方式输入的数据,在不同的输入方式中共享数据,增强电子设备对输入数据的处理能力,使输出的结果与现有相比更加符合用户的使用习惯,提升用户的输入效率。
在一种可能的实现方式中,上述第一语言库及上述第二语言库均包括字词、上述字词对应的音节序列及上述字词对应的词频;上述第二语言库中的音节序列对应的词频最高的字词与上述第一语言库中上述音节序列对应的词频最高的字词不同。
本申请实施例中,第二语言库可以记录用户自身的使用习惯,且用户自身的使用习惯与大众的使用习惯不同。综合考虑用户自身的使用习惯及大众的使用习惯,使输出的结果更加准确。
在一种可能的实现方式中,上述第二语言库中的字词对应的音节序列为上述第一数据对应的音节序列的一部分。
在一种可能的实现方式中,上述第一数据对应的音节序列为上述第二语言库中的字词对应的音节序列的一部分。
在一种可能的实现方式中,第一输入方式为语音输入方式,第二输入方式为键盘输入方式、图像输入方式及手写输入方式中的至少一种。
本申请实施例可以将用户采用键盘输入方式、图像输入方式及手写输入方式输入的数据共享给语音输入方式,可以提高语音识别的准确率,提高用户的输入效率。
在另外一种可能的实现方式中,第一输入方式为键盘输入方式,第二输入方式为语音输入方式、图像输入方式及手写输入方式中的至少一种。
本申请实施例可以将语音输入方式、图像输入方式及手写输入方式输入的数据共享给语音输入方式,可以提高键盘输入的准确率,提高用户的输入效率。
在另外一种可能的实现方式中,第二结果为空,目标结果为第一结果。
可能地,第二结果为空即为第二结果不存在。
本申请实施例中,在第二结果不存在的情况下,输出结果以第一结果为准。第一结果为根据多名用户的使用习惯产生的结果,符合大多数用户的使用习惯。
在另外一种可能的实现方式中,第二结果不为空,目标结果为第二结果。
本申请实施例中,在第二结果存在的情况下,输出结果以第二结果为准。第二结果为根据使用该电子设备的使用习惯产生的结构,更加符合该用户的使用习惯,保证输出结果的准确性,提升用户输入的效率,提升用户体验。
第二方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器、存储器以及无线通信模块;上述存储器以及上述无线通信模块与一个或多个处理器耦合,上述存储器用于存储计算机程序代码,上述计算机程序代码包括计算机指令,当上述一个或多个处理器执行上述计算机指令时,电子设备执行:接收用户采用第一输入方式输入的数据;根据上述第一数据确定目标结果,上述目标结果为上述用户采用第二输入方式输入第二数据的历史选择结果,上述第一数据与上述第二数据对应的音节序列相同,上述目标结果与上述音节序列对应的通用结果不同;在目标输入界面中显示上述目标结果。
在一种可能的实现方式中,电子设备执行上述根据上述第一数据确定目标结果时具体执行:根据上述第一数据查找第一语言库,输出第一结果;第一语言库是多种输入方式对应的语言库;根据上述第一数据查找第二语言库,输出第二结果;第二语言库为根据上述第二数据产生的语言库;根据第一结果及上述第二结果确定目标结果。
在一种可能的实现方式中,上述第一语言库及上述第二语言库均包括字词、上述字词对应的音节序列及上述字词对应的词频;上述第二语言库中的音节序列对应的词频最高的字词与上述第一语言库中上述音节序列对应的词频最高的字词不同。
在一种可能的实现方式中,上述第二语言库中的字词对应的音节序列为上述第一数据对应的音节序列的一部分。
在一种可能的实现方式中,上述第一数据对应的音节序列为上述第二语言库中的字词对应的音节序列的一部分。
在一种可能的实现方式中,第一输入方式为语音输入方式,第二输入方式为键盘输入方式、图像输入方式及手写输入方式中的至少一种。
在另外一种可能的实现方式中,第一输入方式为键盘输入方式,第二输入方式为语音输入方式、图像输入方式及手写输入方式中的至少一种。
在另外一种可能的实现方式中,第二结果为空,目标结果为第一结果。
在另外一种可能的实现方式中,第二结果不为空,目标结果为第二结果。
第三方面,本申请实施例提供了一种电子设备,包括:输入模块、确定模块及显示模块。其中:输入模块用于接收用户采用第一输入方式输入的第一数据;确定模块用于根据上述第一数据确定目标结果,上述目标结果为上述用户采用第二输入方式输入第二数据的历史选择结果,上述第一数据与上述第二数据对应的音节序列相同,上述目标结果与上述音节序列对应的通用结果不同;显示模块用于在目标输入界面中显示上述目标结果。
在一种可能的实现方式中,上述确定模块包括第一查找单元、第二查找单元及确定单元;其中,第一查找单元用于根据输入模块接收的第一数据输出第一结果;第一语言库是多种输入方式对应的语言库;第二查找单元用于根据输入模块接收的第一数据输出第二结果;第二语言库为根据上述第二数据产生的语言库;确定单元用于根据第一结果和第二结果确定目标结果。
在一种可能的实现方式中,上述第一语言库及上述第二语言库均包括字词、上述字词对应的音节序列及上述字词对应的词频;上述第二语言库中的音节序列对应的词频最高的字词与上述第一语言库中上述音节序列对应的词频最高的字词不同。
在一种可能的实现方式中,上述第二语言库中的字词对应的音节序列为上述第一数据对应的音节序列的一部分。
在一种可能的实现方式中,上述第一数据对应的音节序列为上述第二语言库中的字词对应的音节序列的一部分。
在一种可能的实现方式中,第一输入方式为语音输入方式,第二输入方式为键盘输入方式、图像输入方式及手写输入方式中的至少一种。
在另外一种可能的实现方式中,第一输入方式为键盘输入方式,第二输入方式为语音输入方式、图像输入方式及手写输入方式中的至少一种。
在另外一种可能的实现方式中,第二结果为空,目标结果为第一结果。
在另外一种可能的实现方式中,第二结果不为空,目标结果为第二结果。
第四方面,本申请实施例提供了一种计算机存储介质,包括计算机指令,当计算机指令在电子设备上运行时,使得电子设备执行如第一方面或第一方面的任意一种实现方式提供的输入方法。
第五方面,本申请实施例提供一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行如第一方面或第一方面的任意一种实现方式提供的输入方法。
可以理解地,上述提供的第二方面上述的电子设备、第三方面上述的电子设备、第四方面上述的计算机存储介质或者第五方面上述的计算机程序产品均用于执行第一方面所提供的输入方法。因此,其所能达到的有益效果可参考对应方法中的有益效果,此处不再赘述。
附图说明
图1为本申请实施例提供的电子设备的硬件结构示意图;
图2A-图2C为本申请实施例涉及的应用场景示意图;
图3A-图3D为本申请实施例提供的键盘输入方式的用户界面示意图;
图4为本申请实施例提供的语音输入示意图;
图5为本申请实施例提供的语音输入结果示意图;
图6A-图6G为本申请实施例提供的图像扫描输入方式的用户界面示意图;
图7为本申请另一实施例提供的电子设备的结构示意图;
图8为本申请实施例提供的一种输入方法流程示意图;
图9为本申请实施例提供的一种具体的输入方法流程示意图。
具体实施方式
下面将结合附图对本申请实施例中的技术方案进行清楚、详尽地描述。
本申请实施例提供了一种输入方法,可以在输入法的各输入方式之间共享数据,提高语音输入的识别准确率。也即是说,采用键盘输入过的文字或图像输入过的文字,再次通过语音输入时都可以识别出来,从而提高语音输入的识别准确率。
本申请实施例中涉及的电子设备可以是便携式移动终端,例如手机、平板电脑、上网本、个人数字助理(Personal Digital Assistant,PDA)、可穿戴电子设备(如智能手环、智能手表等)、虚拟现实设备等。
本申请实施例中涉及的电子设备可以包括输入法应用。该输入法应用可以是系统应用,也可以是第三方应用。电子设备中还可以包括一个或多个具有输入框的应用。该具有输入框的应用可以是系统应用,如短信息、日历等,也可以是第三方应用,如脸书(Facebook)、亚马逊、地图、音乐播放器等。用户可以使用输入法应用在具有输入框的应用的输入框中实现字词输入。
接下来,介绍本申请以下实施例中提供的示例性电子设备。
图1示出了电子设备100的结构示意图。
电子设备100可以包括处理器110,内部存储器120,USB接口130、充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,摄像头191以及显示屏192等。其中传感器模块180可以包括陀螺仪传感器180A,加速度传感器180B,距离传感器180C,指纹传感器180D,温度传感器180E,触摸传感器180F等。
可以理解的是,本申请实施例示意的结构并不构成对电子设备100的具体限定。在本申请另一些实施例中,电子设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
充电管理模块140用于从充电器接收充电输入。充电管理模块140为电池142充电的同时,还可以通过电源管理模块141为电子设备供电。
电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器120,显示屏192,摄像头191,和无线通信模块160等供电。
电子设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。
移动通信模块150可以提供应用在电子设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。
无线通信模块160可以提供应用在电子设备100上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。
电子设备100通过GPU,显示屏192,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏192和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏192用于显示图像,视频等。显示屏192包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode 的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。本申请实施例中,显示屏192可以用于显示用户采用各种输入方式输入的数据对应的结果。
摄像头191用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。本申请实施例中摄像头191可以用于拍摄用户采用图像扫描输入方式输入的包含文本信息的图片,以使电子设备识别该图片中的文本信息,并将该文本信息显示在显示屏192中。
NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现电子设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
内部存储器120可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。内部存储器120可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储电子设备100使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。处理器110通过运行存储在内部存储器120的指令,和/或存储在设置于处理器中的存储器的指令,执行电子设备100的各种功能应用以及数据处理。本申请实施例中,内部存储器120可以用于存储第一语言库及第二语言库,以使电子设备100根据用户输入的数据分别查找第一语言库及第二语言库,得到目标结果,并通过显示屏192将目标结果显示出来。
电子设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。
扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。电子设备100可以通过扬声器170A收听音乐,或收听免提通话。
受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当电子设备100接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。本申请实施例中,麦克风170C可以用于采集用户输入的音频信号,以使电子设备将音频信号输入到声学模型中。
耳机接口170D用于连接有线耳机。
陀螺仪传感器180A可以用于确定电子设备100的运动姿态。在一些实施例中,可以通过陀螺仪传感器180A确定电子设备100围绕三个轴(即,x,y和z轴)的角速度。
加速度传感器180B可检测电子设备100在各个方向上(一般为三轴)加速度的大小。
距离传感器180C,用于测量距离。电子设备100可以通过红外或激光测量距离。
指纹传感器180D用于采集指纹。电子设备100可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。
温度传感器180E用于检测温度。
触摸传感器180F,也称“触控器件”。触摸传感器180F可以设置于显示屏192,由触摸传感器180F与显示屏192组成触摸屏,也称“触控屏”。触摸传感器180F用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏192提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180F也可以设置于电子设备100的表面,与显示屏192所处的位置不同。本申请实施例中,触摸传感器180F可以用于检测用户采用键盘输入方式或手写输入方式输入的数据,以使电子设备输出与该数据对应的结果,将结果显示在显示屏192中。
接下来结合图2A-图2C介绍本申请实施例涉及的应用场景。
图2A示例性示出了输入法的键盘输入模式界面示意图。
图2A示出了微信的联系人聊天界面30。其中,微信是一种即时通讯软件。如图2A所示,用户界面30中可以包括:状态栏301、显示区302、输入框303、导航栏304。其中:
状态栏301可以包括:运营商指示符(例如运营商的名称“中国移动”)、无线高保真(wireless fidelity,Wi-Fi)信号的一个或多个信号强度指示符、移动通信信号(又可称为蜂窝信号)的一个或多个信号强度指示符、时间指示符和电池状态指示符。
显示区302可以用于显示与该联系人(Emmy)的历史聊天内容。
用户可以对输入框303执行点击操作。响应于该点击操作,电子设备100的处理器110可以调用电子设备110中的输入法应用,并在显示屏192上显示图2B示出的输入法应用的界面305。该界面是具有26键的字母组合按键的输入界面。用户可以在该输入法应用的界面305输入字符串。电子设备100的处理器110可以根据用户输入的字符串查找该字符串对应的一个或多个字词,并通过显示屏192显示在输入法应用的界面305中。用户可从该字符串对应的一个或多个字词中选择其预期输入的字词。
可以理解,图2B中,输入法应用的界面305是以具有26键的字母组合按键的输入界面为例示出的,输入法应用的界面也可以是具有9键的数字组合按键的输入界面,用户也可以在该界面中输入字符串。
导航栏304可以包括:返回按键3041、主界面(Home screen)按键3042、呼出任务历史按键3043等系统导航键。其中,主界面为电子设备100在任何一个用户界面检测到作用于主界面按键3042的用户操作后显示的界面。当检测到用户点击返回按键3041时,电子设备100可显示当前用户界面的上一个用户界面。当检测到用户点击主界面按键3042时,电子设备100可显示主界面。当检测到用户点击呼出任务历史按键3043时,电子设备100可显示用户最近打开过的任务。各导航键的命名还可以为其他,比如,3041可以叫Back Button,3042可以叫Home button,3043可以叫Menu Button,本申请对此不做限制。导航栏304中的各导航键不限于虚拟按键,也可以实现为物理按键。
输入法应用的界面305可以包括输入方式切换控件3051。
输入方式切换控件3051可以用于切换输入方式。具体地,电子设备100可以检测到作用于输入方式切换控件3051的触控操作(如在输入方式切换控件3051上的点击操作),响应于该操作,电子设备100可在输入法应用的界面305中显示其他输入方式的图标,如图2C中示出的文字扫描输入方式的图标3052、语音输入方式的图标3053及手写输入方式的图标3054。其中:
文字扫描输入方式的图标3052可以用于通过扫描图像输入字词。具体地,电子设备100可以检测到作用于图像扫描输入方式的图标3052的触控操作(如在文字扫描输入方式的图标3052上的点击操作),响应于该操作,电子设备100开启摄像头191扫描图片,将扫描的图片内容发送至处理器110,通过处理器110识别出该图片中的文字或字符(字母、数字、符号等),通过显示屏192将识别的结果显示在输入法应用的界面305中。
语音输入方式的图标3053用于通过语音输入字词。具体地,电子设备100可以检测到作用于语音输入方式的图标3053的触控操作(如在语音输入方式的图标3053上的点击操作),响应于该操作,电子设备100可开启麦克风170C采集声音信号,将采集到的声音信号发送至处理器110,通过处理器110识别出该声音信号对应的文字或字符(字母、数字等),通过显示屏192将识别的结果显示在输入法应用的界面305中。
手写输入方式的图标3054可以用于通过用户手写输入字词。具体地,电子设备100可以检测到作用于手写输入方式的图标3054的处境操作(如在手写输入方式的图标3054上的点击操作),响应于该操作,电子设备100可以在输入法应用的界面305中显示手写检测区域,检测用户在手写检测区域中输入的触控轨迹,根据触控轨迹确定用户输入的字词,通过显示屏192将字词显示在输入法应用的界面305中。
接下来结合前述应用场景介绍本申请几个实施例提供的输入方法。
实施例一:键盘输入-语音输入,即将采用键盘输入方式输入的数据共享给语音输入方式。
接下来将分四个部分介绍实施例一提供的输入方法。
第一部分:采用键盘输入方式输入数据,输出对应的结果。
如图3A所示,电子设备100可以检测到作用于输入法应用的界面305中输入字符串zhangsan,一个或多个字母按键(该一个或多个字母按键例如可以依次是zhangsan)的点击操作,响应于该点击操作,电子设备100可在输入法应用的界面305中显示输入结果401(zhang’san),并显示该输入结果对应的待选项列表402及下拉控件403。其中,待选项列表402可以包括一个或多个待选项4021。
其中,下拉控件403可用于显示更多的待选项。电子设备100可以检测到作用于下拉控件403的触控操作(如在下拉控件403上的点击操作),响应于该操作,电子设备100可以更新显示图3B所示的输入法应用的界面305。
如图3B所示,输入法应用的界面305中可以包括待选项列表402、上翻控件404、下翻控件405及返回控件406。
其中,上翻控件404及下翻控件405均可以用于更新显示待选项列表402中的待选项。电子设备100可以检测到作用于下翻控件405的触控操作(如在下翻控件405上的点击操作),响应于该操作,电子设备100可以更新显示待选项列表402中的待选项。同理适用于上翻控件404,此处不赘述。
返回控件406可以用于使电子设备100显示图3A示出的用户界面30。
上述待选项可以是完整的输入结果“zhang’san”对应的待选项,也可以是输入结果的前半部分“zhang”对应的待选项。
用户可以点击图3B的待选项列表402中的待选项选择预期的结果。例如,用户可以点击待选项列表402中的“章”以选定输入结果“zhang”对应的字词。选定输入结果的前半部分对应的字词后,电子设备100可以显示图3C所示的输入法应用的界面305。
图3C中示出的输入法应用的界面305与图3B中示出的输入法应用界面305类似。不同之处在于,图3B中的输入法应用的界面305中的待选项列表402中显示的是完整的输入结果“zhang’san”对应的待选项或输入结果的前半部分“zhang”对应的待选项。而图3C中的输入法应用的界面305中的待选项列表402中显示的是输入结果的后半部分“san”对应的待选项。
用户可以点击图3C的待选项列表402中的待选项选择预期结果。例如,用户可以点击待选项列表402中的“三”以选定输入结果“san”对应的字词。
电子设备100确定完整的输入结果“zhang’san”对应的字词后,如图3D所示,可以将其对应的字词“章三”显示在输入框303中。
本申请实施例中涉及的键盘输入方式可以是拼音输入方式,也可以是五笔输入方式等通过键盘输入的输入方式。其中输入法应用的界面305可以包含26键的字母组合按键的输入界面,也可以包含9键的数字组合按键的输入界面等。
接下来介绍电子设备100确定该字符串对应的结果的过程。
电子设备100接收到用户输入的字符串之后,可以将该字符串组合成多种音节或音节序列,并查找这多种音节或音节序列对应的字词。
首先,电子设备100可以确定该字符串组成的多种音节或音节序列,并分别确定每种音节或音节序列的可能性。电子设备100可以在待选项列表402中优先显示可能性最高的音节或音节序列对应的字词。
其中,确定每种音节或音节序列的可能性的依据可以是搜集大量用户的使用习惯得出,进一步地还可以根据使用该电子设备100的用户的使用习惯进行调整得出。
例如,用户输入的字符串可以是xian。该字符串对应的音节或音节序列可以是xi’an,还可以是xian。若多个用户的1000次选择中,有600次选择该字符串对应的音节或音节序列是xian,有400次选择该字符串对应的音节序列是xi’an。则该字符串对应的音节或音节序列是xian的可能性为60%,该字符串对应的节序列是xi’an的可能性为40%。其中,电子设备100可以根据用户最终选择的字词确定用户选择该字符串对应的音节或音节序列。电子设备100确定该字符串对应的各种音节或音节序列的可能性后,可以在待选项列表402中优先显示可能性最高的音节或音节序列对应的字词。
进一步地,若在使用该电子设备100的用户的10次选择中,有6次选择该字符串对应的音节序列是xi’an,有4次选择该字符串对应的音节是xian。则电子设备100可以根据使用该电子设备100的用户的使用习惯进行调整,确定该字符串对应的音节序列是xi’an的可能性为60%,该字符串对应的音节是xian的可能性为40%。则电子设备100可以在待选项列表402中优先显示音节序列xi’an对应的字词。
不限于在待选项列表402中优先显示可能性最高的音节或音节序列对应的字词,还可以在待选项列表402中优先显示用户最近选择的音节或音节序列对应的字词。例如,使用该电子设备100的用户上一次选择字符串xian对应的音节序列是xi’an,则电子设备100可以在用户再次输入字符串xian时,在待选项列表402中优先显示音节序列xi’an对应的字词。
其次,电子设备100可以确定音节对应的一种或多种字词,并分别确定各种字词的可能性。电子设备100可以在待选项列表402中优先显示可能性最高的字词。
可以知道,音节或音节序列对应的字词可以有多种。例如,音节序列xi’an对应的字词可以是“西安”、“西岸”、“锡安”等,音节xian对应的字词可以是“先”、“现”、“线”、“鲜”等。
电子设备100可以搜集大量用户的使用习惯得出该音节对应的各种字词的可能性,进一步地还可以根据使用该电子设备100的用户的使用习惯进行调整得出。
例如,对于音节xian而言,若多个用户的1000次选择中,有400次选择该音节对应的字词是“先”,有300次选择该音节对应的字词是“现”,有200次选择该音节对应的字词是“线”,有100次选择该音节对应的字词是“鲜”。则该音节对应的字词是“先”的可能性为40%,该音节对应的字词是“现”的可能性为30%,该音节对应的字词是“线”的可能性为20%,该音节对应的字词是“鲜”的可能性为10%。电子设备100确定该音节对应的各种字符串的可能性后,可以在待选项列表402中优先显示可能性最高的字词。
进一步地,若在使用该电子设备100的用户的10次选择中,有5次选择该音节对应的字词是“鲜”,有3次选择该音节对应的字词是“线”,有一次选择该音节对应的字词是“现”,有一次选择该音节对应的字词是“先”。则电子设备100可以根据使用该电子设备100的用户的使用习惯进行调整,确定该音节对应的字词是“鲜”的可能性为50%,该音节对应的字词是“线”的可能性为30%,该音节对应的字词是“现”的可能性为10%,该音节对应的字词是“先”的可能性为10%。则电子设备100可以在待选项列表402中优先显示字词“鲜”。
不限于在待选项列表402中优先显示可能性最高的字词,还可以在待选项列表402中优先显示用户最近选择的该音节对应的字词。例如,使用该电子设备100的用户上一次选择音节xian对应的字词是“仙”,则电子设备100可以在用户再次输入音节xian时,在待选项列表402中优先显示字词“仙”。
上述在待选项列表402中优先显示字词的方式可以是在待选项列表402的最左列、最上排显示。
第二部分:生成个性化语言库。
具体地,电子设备100可以将用户采用键盘输入的字符串以及用户最终选择的该字符串对应的字词保存在个性化语言库中。其中,个性化语言库可以是内部存储器120中的某个存储区域。电子设备100可以根据个性化语言库确定该字符串对应的音节或音节序列,以及该音节或音节序列对应的字词,并记录该字词被选定的次数(即词频)。因此,最终生成的个性化语言库可以符合使用该电子设备100的用户的使用习惯。
例如,用户采用键盘输入字符串zhangsan,用户最终选择该字符串对应的字词为“章三”,则电子设备100可以确定该字符串zhangsan对应的音节序列为zhang’san,该音节序列zhang’san对应的字词为“章三”,而不是“张三”。
第三部分:采用语音输入方式输入数据。
用户点击图2B中的图标3053后,电子设备100可以显示图4示出的输入法的应用界面305,并开启麦克风170C(图4中示例性示出了麦克风170C的位置),开始采集声音信号。此时,用户可以输入音频信号。
具体地,电子设备100可以抽取用户输入的音频信号的音频特征,将该音频特征输入到声学模型中,输出音节或音节序列。接下来以输出的音节序列为zhang’san为例,示例性对以下第四部分进行说明。
第四部分:查找通用语言库及个性化语言库,并输出最终结果。
电子设备100确定声学模型输出的音节序列为zhang’san后,分别在通用语言库及个性化语言库中查找与该音节序列对应的结果,根据查找通用语言库的结果和查找个性化语言库的结果确定最终结果,并将最终结果显示在图5中示出的输入框303中。
具体地,通用语言库是预设的语言库,该语言库可以根据大量用户采用多种输入方式输入的数据得到。因此,通用语言库可以符合大多数用户的使用习惯。通用语言库可以是用户在下载输入法时该输入法自带的语言库,通用语言库还可以是电子设备100自带的语言库。
具体地,通用语言库中可以但不限于包括多种字词、各个字词对应的音节序列及该字词对应的词频。此外,通用语言库还可以用于计算候选字词在句子结构中的得分,从而使电子设备100将得分最高的候选字词优先显示在待选项列表402中。可能地,同一个音节序列可以对应多种不同的字词,这些字词对应的词频可以不同。
电子设备100在确定用户输入的音频信号对应的音节或音节序列后,可以查找通用语言库,确定该音节或音节序列对应的可能性最高的结果。将查找通用语言库的可能性最高的结果称为第一结果。
电子设备100还可以在确定用户输入的音频信号对应的音节或音节序列后,查找个性化语言库,确定该音节或音节序列对应的可能性最高的结果。将查找个性化语言库的可能性最高的结果称为第二结果。
上述个性化语言库中可能性最高的结果可以是用户选择次数最多的结果,也可能是用户最近一次选择的结果,本申请实施例对此不作限定。
查找通用语言库的结果和查找个性化语言库的结果可能存在以下几种情况:
情况一、第一结果和第二结果一致。此时采用语音输入的最终输出的结果即为第一结果,也为第二结果。
情况二、第一结果和第二结果不一致。此时采用语音输入的最终结果即为第二结果。即在第一结果和第二结果不一致的情况下,优先以第二结果为准。
情况三、第一结果存在,第二结果不存在或者第二结果为空。此时采用语音输入的最终结果即为第一结果。
另外,本申请实施例对上述查找通用语言库和查找个性化语言库的先后顺序不做限定,上述查找通用语言库和查找个性化语言库的时间关系也可以是同时进行。
例如,电子设备100确定用户输入的音频信号对应的音节序列为zhang’san后,在通用语言库中查找该音节对应的可能性最高的结果为“张三”,而在个性化语言库中查找该音节对应的可能性最高的结果为“章三”。即第一结果为“张三”,第二结果为“章三”,则用户输入的音频信号对应的最终结果为“章三”。
实施本申请实施例可以将用户使用键盘输入方式输入的数据共享给语音输入方式,在采用语音输入时可以同时根据用户采用键盘输入方式输入的历史数据和符合大众的使用习惯来确定输入结果。增强电子设备对输入数据的处理能力,提升语音识别的准确性,提高用户的输入效率。
实施例二:图像扫描输入-语音输入,即将采用图像扫描输入方式输入的数据共享给语音输入方式。
接下来将分四个部分介绍实施例二提供的输入方法。
第一部分:采用图像扫描输入方式输入数据,输出对应的结果。
如图2C所示,电子设备100可以检测到作用于图像扫描输入方式的图标3052的触控操作(如在文字扫描输入方式的图标3052上的点击操作),响应于该操作,电子设备100开启摄像头191扫描图片,并显示扫描界面。
示例性地,如图6A所示,扫描界面70可以包括:扫描内容预览区域701、扫描要求提示框702、扫描控件703、返回控件704及参考线705。其中:
扫描内容预览区域701可以用于显示摄像头191捕捉到的图像。
扫描要求提示框702可以用于显示扫描要求,提示用户按照要求进行扫描。
扫描控件703可以用于确定扫描内容。电子设备100可以检测到作用于扫描控件703的触控操作(如在扫描控件703上的点击操作),响应于该操作,电子设备100可以确定摄像头191在当前时刻捕捉到的图像即为扫描内容,提取扫描内容中有文字的区域。在后续描述中将有文字的区域简称为文字区域。
返回控件704可以用于使电子设备100显示图2C所示的用户界面30。
参考线705可以用于提示用户使扫描图像中的文字方向与该参考线705平行,以便于电子设备100识别扫描图像中的文字。
响应于作用于扫描控件703的触控操作,电子设备100还可以显示图6B所示的用户界面80。
示例性地,如图6B所示,用户界面80可以包括:文字区域801A、文字区域801B、确定控件802及返回控件803。
其中,文字区域801A及文字区域801B为电子设备100在扫描内容中提取的有文字的区域。文字区域801A及文字区域801B均可用于确定待选的文字区域。电子设备100可以检测到作用于文字区域801A和/或文字区域801B上的触控操作(如在文字区域801A和/或文字区域801B上的点击操作),响应于该操作,电子设备100可以特殊显示文字区域801A或文字区域801B,以提示用户文字区域801A和/或文字区域801B为待选的文字区域。其中,特殊显示的方式例如可以但不限于是加粗显示待选文字区域的边框。具体可以参考图6C所示的文字区域801B。
确定控件802可以用于确定目标文字区域。电子设备100可以检测作用于确定控件802的触控操作(如在确定控件802上的点击操作),响应于该操作,电子设备100可以确定待选的文字区域为目标文字区域,并显示图6D所示的用户界面90。
返回控件803可以用于使电子设备100显示图6B所示的用户界面70。
如图6D所示,用户界面90可以包括:目标文字区域显示框901、扫描结果显示区域902、发送控件903、复制控件904及返回控件905。其中:
目标文字区域901可以用于显示目标文字区域。
扫描结果显示区域902可以用于显示电子设备100从目标文字区域中提取的内容,即扫描结果。
发送控件903可以用于使扫描结果显示在输入框305中。电子设备100可以检测到作用于发送控件903的触控操作(如在发送控件903上的点击操作),响应于该操作,电子设备100可以显示图6E示出的用户界面30,用户界面30的输入框303中可以显示扫描结果。
复制控件904可以用于复制扫描结果。
返回控件905可以用于使电子设备100显示图6C所示的用户界面80。
第二部分:生成个性化语言库。
具体地,电子设备100可以将用户采用图像扫描输入方式输入的文字保存在个性化语言库中。此外,电子设备100还可以将用户采用图像扫描输入方式输入的文字对应的音节或音节序列保存在个性化语言库中。因此,最终生成的个性化语言库可以符合使用该电子设备100的用户的使用习惯。其中,个性化语言库可以是内部存储器120中的某个存储区域。保存在个性化语言库中的结果可以包括字词、该字词对应的音节序列以及该字词被选定的次数(即词频)等。可能地,同一个音节序列可以对应多种不同的字词,这些字词对应的词频可以不同。
例如,用户采用图像扫描方式输入的结果为“湖北省武汉市东湖高新区金融港B17栋1006室”,电子设备100可以保存在个性化语言库中的结果示例性的可以如下表:
表1个性化语言库中的结果列表
字词 | 音节序列 | 词频 |
湖北省 | hu’bei’sheng | 8 |
武汉市 | wu’han’shi | 10 |
东湖高新区 | dong’hu’gao’xin’qu | 13 |
金融港 | jin’rong’gang | 6 |
B17栋 | bi’shi’qi’dong | 8 |
1006室 | yi’ling’ling’liu’shi | 9 |
不限于表1列举的词语,在具体实现中保存在个性化语言库中的字词还可以是其他,本申请实施例对此不作限定。
可以知道,表1中列举的各个字词对应的词频均为举例说明,实际是根据用户输入的历史数据记录的,上述列举的词频对本申请实施例不构成限制。
第三部分:采用语音输入方式输入数据。
具体地,该实施例中的第三部分与实施例一中的第三部分类似。
假设,电子设备100抽取用户输入的音频信号的音频特征,将该音频特征输入到声学模型中后,输出的音节序列为hu’bei’sheng’wu’han’shi’dong’hu’gao’xin’qu’jin’rong’gang’bi’shi’qi’dong’yi’ling’ling’liu’shi。
不限于输入的音频信号对应的音节序列与采用图像扫描方式输入的结果对应的音节序列完全一致,在具体实现中,输入的音频信号对应的音节序列可以是采用图像扫描方式输入的结果对应的音节序列的一部分,例如图6F所示,根据用户输入的音频信号输出的音节序列可以是dong’hu’gao’xin’qu。
相反的,采用图像扫描输入方式输入的结果对应的音节序列还可以是输入的音频信号对应的音节序列的一部分,例如图6G所示,根据用户输入的音频信号输出的音节序列可以是wo’yao’qu’dong’hu’gao’xin’qu。
第四部分:查找通用语言库及个性化语言库,并输出最终结果。
具体地,该实施例中的第四部分与实施例一中的第四部分类似,此处不赘述。
实施本申请实施例可以将用户使用图像扫描入方式输入的数据共享给语音输入方式,在采用语音输入时可以同时根据用户采用图像扫描方式输入的历史数据和符合大众的使用习惯来确定输入结果。提升语音识别的准确性,提高用户的输入效率。
实施例三:语音输入-键盘输入,即将采用语音输入方式输入的数据共享给键盘输入方式。
接下来将分四个部分介绍实施例三提供的输入方法。
第一部分:采用语音输入方式输入数据,输出对应的结果。
具体地,用户采用语音输入方式输入数据的过程可以参考图4,此处不赘述。
假设电子设备100抽取用户采用语音输入方式输入的音频信号的音频特征,将该音频特征输入到声学模型中,输出的音节序列为wu’he’da’dao。电子设备100可在输入框303中显示该音节序列对应的可能性最高结果为“五河大道”。若该结果不符合用户的预期,用户可在输入框中再次采用键盘输入方式进行编辑,例如可以将“河”更改为“和”。电子设备100可以确定更改后的结果“五和大道”为音节序列wu’he’da’dao对应的字词。
不限于更改部分结果,例如上述将“河”更改为“和”,在具体实现中用户还可以在输入框中再次采用键盘输入方式对全部结果进行再次编辑,例如将语音识别的结果“五河大道”全部删除后重新采用键盘输入方式编辑。电子设备100可以确认重新编辑后的结果为音节序列wu’he’da’dao对应的字词。本申请实施例对此不作限定。
第二部分:生成个性化语言库。
电子设备100可以保存用户采用语音输入方式输入的音频信号对应的音节序列(如wu’he’da’dao)以及最终确定的该音节序列对应的字词(如“五和大道”)在个性化语言库中,并记录该字词被选定的次数(即词频)。其中,个性化语言库可以是内部存储器120中的某个存储区域。因此,最终生成的个性化语言库可以符合使用该电子设备100的用户的使用习惯。
第三部分:采用键盘输入方式输入数据。
具体地,用户采用键盘输入方式输入数据的过程可以参考图3A,此处不赘述。接下来以用户采用键盘输入方式输入的字符串为wuhedadao为例,示例性地对第四部分进行说明。
第四部分:查找通用语言库及个性化语言库,确定最终结果,并在待选项列表402中优先显示最终结果。
具体地,该实施例中确定最终结果的过程与实施例一中的第四部分类似,此处不赘述。
例如,电子设备100可以确定字符串wuhedadao对应的音节序列为wu’he’da’dao。电子设备100可以查找通用语言库,确定该音节序列对应的结果为“五河大道”,即第一结果为“五河大道”。电子设备100可以查找个性化语言库,确定该音节序列对应的结果为“五和大道”,即第二结果为“五和大道”。电子设备100可在待选项列表402中优先显示第二结果“五和大道”,其次显示第一结果“五河大道”。
实施本申请实施例可以将用户使用语音输入方式输入的数据共享给键盘输入方式,在键盘输入方式的待选项列表中优先显示符合用户语音输入习惯的选项,减少用户在待选项列表中查找目标选项的时间,提升用户的输入效率。
不限于上述列举的几个实施例,在具体实现中还可以将图像扫描输入方式输入的数据共享给键盘输入方式,还可以将手写输入方式输入的数据共享给键盘输入方式或语音输入方式,具体实现过程可以与前述三个实施例类似,在此不再赘述。
不限于图4中示出的用户界面,在具体实现中,用户可以通过语音助手输入音频数据,本申请实施例对输入音频数据的用户界面不做限定。具体地,通过语音助手输入音频数据时电子设备100可以显示任意用户界面,或者电子设备100可以处于锁屏状态或熄屏状态。电子设备可以将语音识别的结果显示在语音助手的界面中。其中,语音助手可以是电子设备100具备的一个功能,通常需要通过特定的关键词唤醒该功能,该关键词例如可以但不限于是“小艺小艺”。
接下来介绍本申请另一实施例提供的电子设备。
如图7所示,电子设备100可以包括输入模块810、通用语言库820、个性化语言库830、确定模块840及显示模块850。其中:
输入模块810可以用于接收用户输入的数据。
具体地,当用户采用语音输入方式输入数据时,输入模块810可以是麦克风170C。当用户采用键盘输入方式或手写输入方式输入数据时,输入模块810可以是触摸传感器180F。当用户采用图像扫描输入方式输入数据时,输入模块810可以是摄像头191。
通用语言库820可以根据输入模块810接收的数据输出第一结果。
具体地,通用语言库820可以是预设的语言库,该语言库可以根据大量用户采用多种输入方式输入的数据得到。在本申请实施例中可以将通用语言库称为第一语言库。
具体地,通用语言库中可以但不限于包括多种字词、各个字词对应的音节序列及该字词对应的词频。此外,通用语言库还可以用于计算候选字词在句子结构中的得分,从而使电子设备100将得分最高的候选字词优先显示在待选项列表402中。可能地,同一个音节序列可以对应多种不同的字词,这些字词对应的词频可以不同。
个性化语言库830可以根据输入模块810接收的数据输出第二结果。在本申请实施例中可以将个性化语言库称为第二语言库。
具体地,当用户采用键盘输入方式输入数据时,个性化语言库830可以是记录了用户采用除键盘输入方式以外的其他输入方式(如图像扫描输入方式、语音输入方式及手写输入方式)输入的数据。
当用户采用语音输入方式输入数据时,个性化语言库830可以是记录了用户采用除语音输入方式以外的其他输入方式(如图像扫描输入方式、键盘输入方式及手写输入方式)输入的数据。
上述通用语言库820和个性化语言库830可以是内部存储器120中的某个存储区域。
确定模块840可以用于接收通用语言库820输出的第一结果以及个性化语言库830输出的第二结果,根据第一结果和第二结果确定最终结果。在本申请实施例中可以将最终结果称为目标结果。
显示模块850,用于在目标输入界面中显示上述最终结果。具体地,显示模块850可以是显示屏192。其中,目标输入界面可以是具有输入框的应用的用户界面。具有输入框的应用可以是系统应用,如短信息、日历等,也可以是第三方应用,如脸书(Facebook)、亚马逊、地图、音乐播放器等。目标输入界面还可以是语音助手的界面。
本申请实施例提供的电子设备可以融合不同的输入方式的用户数据,在不同的输入方式中共享数据,提升用户的输入效率。
接下来介绍本申请实施例提供的输入方法。
如图8所示,本申请实施例提供的输入方法至少可以包括以下几个步骤:
S901:接收用户采用第一输入方式输入的第一数据。
具体地,第一输入方式可以是前述实施例中提到的语音输入方式或者键盘输入方式。其中,键盘输入方式可以是拼音输入方式或者五笔输入方式。
用户采用语音输入方式输入数据的过程可以参考实施例一或实施例二中第三部分的描述,此处不赘述。
用户采用键盘输入方式输入数据的过程可以参考图3A的描述或者参考实施例三中第三部分的描述,此处不赘述。
S902:根据第一数据确定目标结果,该目标结果为用户采用第二输入方式输入第二数据的历史选择结果,第一数据与第二数据对应的音节序列相同,目标结果与音节序列对应的通用结果不同。
其中,历史选择结果为用户在此之前采用其他输入方式输入第二数据时选择的结果。通用结果是符合大多数用户使用习惯的结果。
例如,若第一输入方式为语音输入方式,输入的第一数据为音频信号,根据该音频信号提取的音频特征输入到声学模型中后输出的音节序列可以是zhang’san,第二输入方式为键盘输入方式,第二数据为字符串zhangsan,用户采用第二输入方式输入第二数据的历史选择结果为“章三”,音节序列zhang’san对应的通用结果为“张三”。可知,根据第一数据确定的目标结果为“章三”,而非“张三”。
也即是说,目标结果不符合大众的使用习惯,但与用户采用其他输入方式输入的数据关联,符合自己采用其他输入方式输入数据时的使用习惯。
在一种具体的实现方式中,上述S902具体可以包括以下几个步骤:
S9021:根据用户输入的第一数据查找第一语言库,输出第一结果。
具体地,第一语言库可以是前述实施例中提到的通用语言库。通用语言库可以是预设的语言库,该语言库可以根据大量用户采用多种输入方式输入的数据得到。通用语言库可以是用户在下载输入法时该输入法自带的语言库,通用语言库还可以是电子设备100自带的语言库。
具体地,通用语言库中可以但不限于包括多种字词、各个字词对应的音节序列及该字词对应的词频。此外,通用语言库还可以用于计算候选字词在句子结构中的得分,从而使电子设备100将得分最高的候选字词优先显示在待选项列表402中。可能地,同一个音节序列可以对应多种不同的字词,这些字词对应的词频可以不同。
S9022:根据用户输入的第一数据查找第二语言库,输出第二结果。
具体地,第二语言库可以是前述实施例中提到的个性化语言库。个性化语言库可以记录用户采用除第一输入方式以外的其他输入方式输入的数据。
可能地,个性化语言库中的音节序列对应的词频最高的字词与通用语言库中该音节序列对应的词频最高的字词不一致。即个性化语言库记录的使用该电子设备的用户自己的使用习惯,而通用语言库记录的是大众的使用习惯。该用户自己的使用习惯不同于大众的使用习惯。
可能地,用户采用第一输入方式输入的数据对应的音节序列可以是个性化语言库中记录的数据对应的音节序列的一部分。例如,用户采用第一输入方式输入的数据对应的音节序列可以是gao’xin’qu,而个性化语言库中记录的数据对应的音节序列可以是dong’hu’gao’xin’qu。
相反的,个性化语言库中记录的数据对应的音节序列也可以是用户采用第一输入方式输入的数据对应的音节序列中的一部分。例如,用户采用第一输入方式输入的数据对应的音节序列可以是wo’yao’qu’dong’hu’gao’xin’qu,而个性化语言库中记录的数据对应的音节序列可以是dong’hu’gao’xin’qu。
电子设备100包括的输入方式可以包括但不限于:键盘输入方式、语音输入方式、图像扫描输入方式及手写输入方式。
若第一输入方式为语音输入方式,则个性化语言库可以记录用户采用键盘输入方式、图像扫描输入方式及手写输入方式输入过的数据。
若第一输入方式为键盘输入方式,则个性化语言库可以记录用户采用图像扫描方式、语音输入方式及手写输入方式输入过的数据。
第二结果可以存在或者不存在。当第二结果不存在时,可以看作第二语言库输出的第二结果为空。
本申请实施例中涉及的键盘输入方式可以是拼音输入方式,也可以是五笔输入方式。其中输入法应用的界面305可以包含26键的字母组合按键的输入界面,也可以包含9键的数字组合按键的输入界面。
可以知道,本申请实施例对上述S9021和S9022实现的先后顺序不作限定。
S9023:根据第一结果及第二结果,确定目标结果。
可能地,第一结果和第二结果一致。目标结果为第一结果或第二结果。
可能地,第一结果和第二结果不一致,且第二结果不为空。目标结果为第二结果。
可能地,第一结果和第二结果不一致,且第二结果为空。目标结果为第一结果。
S903:在目标输入界面中显示目标结果。
具体地,确定目标结果后,可以将目标结果显示在目标输入界面中。
若用户通过具有输入框的应用如微信中输入音频数据,则电子设备100可以将目标结果显示在微信界面中的输入框303中。目标输入界面即为具备该输入框303的接收用户输入语音数据的用户界面。例如图5所示的用户界面。
若用户在唤醒语音助手后,通过语音助手输入音频数据,则电子设备100可以将目标结果显示在语音助手的界面中。语音助手的界面即为目标输入界面。
实施本申请实施例可以融合使用该电子设备的用户采用不同的输入方式输入的数据,在不同的输入方式中共享数据,增强电子设备对输入数据的处理能力,使输出的结果与现有相比更加符合用户的使用习惯,提升用户的输入效率。
在另外一些实施例中,用户采用第一输入方式输入的数据在第一语言库中查找,得出完整的输入数据对应的第一结果。而在第二语言库中查找,得出输入数据中的一部分存在第二结果,输入数据的另一部分不存在第二结果。则最终结果可以是输入数据的另一部分在第一语言库中的结果(即第一结果中与该另一部分对应的结果)与上述第二结果的拼接结果。
例如,用户采用语音输入方式输入音频信号,根据该音频信号得出的对应的音节序列为wo’ming’tian’yao’he’xiao’ming’yi’qi’qu’guang’jie。将上述音节序列在第一语言库中查找得出的的第一结果为“我明天要和小明一起去逛街”。而在第二语言库中,得出输入的音频信号的一部分对应的音节序列xiao’ming存在第二结果为“小铭”,其他音节序列不存在第二结果。则最终结果可以是将第一结果中除音节序列xiao’ming之外的结果与第二结果进行拼接,得到的最终结果为“我明天要和小铭一起去逛街”。
需要说明的是,提供上述第一输入方式的应用程序及提供上述第二输入方式的应用程序可以相同,也可以不同。例如,提供键盘输入方式的应用程序可以是输入法,而提供语音输入方式的应用程序可以是语音助手等。
接下来介绍本申请实施例提供的一种具体的输入方法。
如图9所示,输入方法可以包括以下几个步骤:
S1001:接收采用键盘输入方式输入字符串wuhedadao的用户操作。
具体地,用户可以在输入法的应用界面中输入上述字符串。
S1002:接收用于确定上述字符串对应的结果为“五和大道”的用户操作。
具体地,用户确定上述字符串对应的结果的过程可以参考图3A-图3D示出的过程。
本申请实施例中键盘输入方式即为第二输入方式,用户采用第二输入方式输入的数据即为字符串wuhedadao,历史选择结果即为“五和大道”。
S1003:将上述字符串以及该字符串对应的结果保存至个性化语言库。
S1004:接收采用语音输入方式输入的音频信号。
具体地,用户可以采用语音助手输入上述音频信号,用户还可以采用谷歌地图输入上述音频信号,用户还可以采用输入法输入上述音频信号。本申请实施例对此不作限定。
本申请实施例中语音输入方式即为第一输入方式,用户输入的音频信号即为第一数据。
S1005:确定上述音频信号对应的音节序列为wu’he’da’dao。
具体地,电子设备100可以抽取该音频信号的音频特征,将该音频特征输入到声学模型中后,得到该音频信号对应的音节序列。
S1006:查找通用语言库,确定第一结果为“五河大道”。
本申请实施例中“五河大道”为音节序列wu’he’da’dao对应的通用结果。
S1007:查找个性化语言库,确定第二结果为“五和大道”。
本申请实施例中“五和大道”即为历史选择结果。
S1008:对比第一结果和第二结果,确定目标结果为“五和大道”。
可以看出,目标结果与通用结果不同,与历史选择结果相同。
S1009:将目标结果“五和大道”显示在目标输入界面中。
具体地,若用户在S1004中采用语音助手输入音频信号,则目标输入界面为语音助手的界面;若用户在S1004中采用谷歌地图输入上述音频信号,则目标输入界面为谷歌地图的界面;若用户在S1004中采用输入法输入上述音频信号,则目标输入界面可以是接收用户输入语音数据的用户界面,如图5所示的用户界面。
具体地,在第一结果和第二结果不一致的情况下,优先以第二结果为准,即优先将第二结果作为目标结果。由于第二结果是查找个性化语言库得到的结果,而个性化语言库是根据使用该电子设备的用户采用其他输入方式输入的数据得到的。因此,个性化语言库输出的结果更加符合用户的使用习惯,准确性更高,用户输入效率高。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机或处理器上运行时,使得计算机或处理器执行上述任一个方法中的一个或多个步骤。上述电子设备的各组成模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在所述计算机可读取存储介质中。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者通过所述计算机可读存储介质进行传输。所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如,固态硬盘(solid state disk,SSD))等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来指令相关的硬件完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:ROM或随机存储记忆体RAM、磁碟或者光盘等各种可存储程序代码的介质。
Claims (9)
1.一种输入方法,其特征在于,包括:
接收用户采用第一输入方式输入的第一数据;
根据所述第一数据确定目标结果,所述目标结果为所述用户采用第二输入方式输入第二数据的历史选择结果,所述第一数据与所述第二数据对应的音节序列相同,所述目标结果与所述音节序列对应的通用结果不同;
在目标输入界面中显示所述目标结果;
所述根据所述第一数据确定目标结果包括:
根据所述第一数据查找第一语言库,输出第一结果;所述第一语言库为通用语言库;
根据所述第一数据查找第二语言库,输出第二结果;所述第二语言库为根据所述第二数据产生的语言库;
根据所述第一结果及所述第二结果确定目标结果;所述第二结果不为空,所述目标结果为所述第二结果;
所述第一语言库及所述第二语言库均包括字词、所述字词对应的音节序列及所述字词对应的词频;
所述第二语言库中的音节序列对应的词频最高的字词与所述第一语言库中所述音节序列对应的词频最高的字词不同。
2.如权利要求1所述的方法,其特征在于,所述第二语言库中的字词对应的音节序列为所述第一数据对应的音节序列的一部分。
3.如权利要求1所述的方法,其特征在于,所述第一数据对应的音节序列为所述第二语言库中的字词对应的音节序列的一部分。
4.如权利要求1-3任一项所述的方法,其特征在于,所述第一输入方式为语音输入方式,所述第二输入方式为键盘输入方式、图像扫描输入方式及手写输入方式中的至少一种。
5.如权利要求1-3任一项所述的方法,其特征在于,所述第一输入方式为键盘输入方式,所述第二输入方式为语音输入方式、图像输入方式及手写输入方式中的至少一种。
6.如权利要求1-5任一项所述的方法,其特征在于,所述第二结果为空,所述目标结果为所述第一结果。
7.一种电子设备,其特征在于,包括:一个或多个处理器及存储器;
所述存储器与所述一个或多个处理器耦合,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,当所述一个或多个处理器执行所述计算机指令时,所述电子设备执行如权利要求1-6任一项所述的输入方法。
8.一种计算机存储介质,其特征在于,包括计算机指令,当所述计算机指令在电子设备上运行时,使得所述电子设备执行如权利要求1-6中任一项所述的输入方法。
9.一种计算机程序产品,其特征在于,当所述计算机程序产品在电子设备上运行时,使得所述电子设备执行如权利要求1-6中任一项所述的输入方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2019104537333 | 2019-05-28 | ||
CN201910453733 | 2019-05-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110502126A CN110502126A (zh) | 2019-11-26 |
CN110502126B true CN110502126B (zh) | 2023-12-29 |
Family
ID=68586664
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910661615.1A Active CN110502126B (zh) | 2019-05-28 | 2019-07-22 | 输入方法及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110502126B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111627438A (zh) * | 2020-05-21 | 2020-09-04 | 四川虹美智能科技有限公司 | 语音识别方法及装置 |
CN112214115B (zh) * | 2020-09-25 | 2024-04-30 | 汉海信息技术(上海)有限公司 | 输入方式的识别方法、装置、电子设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01191199A (ja) * | 1988-01-27 | 1989-08-01 | Toshiba Corp | 音声入力装置 |
JPH0651939A (ja) * | 1992-07-29 | 1994-02-25 | Nippon Telegr & Teleph Corp <Ntt> | 音声入力装置 |
CN106774975A (zh) * | 2016-11-30 | 2017-05-31 | 百度在线网络技术(北京)有限公司 | 输入方法和装置 |
CN106873799A (zh) * | 2017-02-16 | 2017-06-20 | 北京百度网讯科技有限公司 | 输入方法和装置 |
CN106873798A (zh) * | 2017-02-16 | 2017-06-20 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN107731229A (zh) * | 2017-09-29 | 2018-02-23 | 百度在线网络技术(北京)有限公司 | 用于识别语音的方法和装置 |
CN108428446A (zh) * | 2018-03-06 | 2018-08-21 | 北京百度网讯科技有限公司 | 语音识别方法和装置 |
CN109243430A (zh) * | 2017-07-04 | 2019-01-18 | 北京搜狗科技发展有限公司 | 一种语音识别方法及装置 |
-
2019
- 2019-07-22 CN CN201910661615.1A patent/CN110502126B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01191199A (ja) * | 1988-01-27 | 1989-08-01 | Toshiba Corp | 音声入力装置 |
JPH0651939A (ja) * | 1992-07-29 | 1994-02-25 | Nippon Telegr & Teleph Corp <Ntt> | 音声入力装置 |
CN106774975A (zh) * | 2016-11-30 | 2017-05-31 | 百度在线网络技术(北京)有限公司 | 输入方法和装置 |
CN106873799A (zh) * | 2017-02-16 | 2017-06-20 | 北京百度网讯科技有限公司 | 输入方法和装置 |
CN106873798A (zh) * | 2017-02-16 | 2017-06-20 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN109243430A (zh) * | 2017-07-04 | 2019-01-18 | 北京搜狗科技发展有限公司 | 一种语音识别方法及装置 |
CN107731229A (zh) * | 2017-09-29 | 2018-02-23 | 百度在线网络技术(北京)有限公司 | 用于识别语音的方法和装置 |
CN108428446A (zh) * | 2018-03-06 | 2018-08-21 | 北京百度网讯科技有限公司 | 语音识别方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110502126A (zh) | 2019-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2440988B1 (en) | Touch anywhere to speak | |
JP5996783B2 (ja) | 声紋特徴モデルを更新するための方法及び端末 | |
US20150213127A1 (en) | Method for providing search result and electronic device using the same | |
US20110223893A1 (en) | Genius Button Secondary Commands | |
CN111553464B (zh) | 基于超网络的图像处理方法、装置及智能设备 | |
CN112130714B (zh) | 可进行学习的关键词搜索方法和电子设备 | |
CN109599104B (zh) | 多波束选取方法及装置 | |
CN103811005A (zh) | 移动终端及其控制方法 | |
CN110781813B (zh) | 图像识别方法及装置、电子设备和存储介质 | |
KR20110052898A (ko) | 배경 화면 설정 방법 및 이를 이용한 휴대 단말기 | |
US11335348B2 (en) | Input method, device, apparatus, and storage medium | |
CN114692639A (zh) | 一种文本纠错方法和电子设备 | |
CN110659690A (zh) | 神经网络的构建方法及装置、电子设备和存储介质 | |
CN113298091A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN109685041B (zh) | 图像分析方法及装置、电子设备和存储介质 | |
CN111339737A (zh) | 实体链接方法、装置、设备及存储介质 | |
CN110502126B (zh) | 输入方法及电子设备 | |
CN111652107A (zh) | 对象计数方法及装置、电子设备和存储介质 | |
CN110569329A (zh) | 数据处理方法及装置、电子设备和存储介质 | |
CN112445906A (zh) | 一种生成回复消息的方法及装置 | |
CN110837557A (zh) | 摘要生成方法、装置、设备及介质 | |
CN118153110B (zh) | 一种数据处理方法及相关装置 | |
CN112764600B (zh) | 资源处理方法、装置、存储介质及计算机设备 | |
CN112740148A (zh) | 一种向输入框中输入信息的方法及电子设备 | |
CN112002313B (zh) | 交互方法及装置、音箱、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |