CN110275988A - 获取图片的方法及装置 - Google Patents
获取图片的方法及装置 Download PDFInfo
- Publication number
- CN110275988A CN110275988A CN201910517630.9A CN201910517630A CN110275988A CN 110275988 A CN110275988 A CN 110275988A CN 201910517630 A CN201910517630 A CN 201910517630A CN 110275988 A CN110275988 A CN 110275988A
- Authority
- CN
- China
- Prior art keywords
- phonetic order
- picture
- voice messaging
- target photo
- obtaining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7834—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种获取图片的方法和装置,其中,该方法包括:通过获取生物对象的语音信息;在语音信息中识别出满足预设条件的语音指令;根据识别出的语音指令在图片集中获取目标图片,其中,图片集的图片为从视频中每帧对应的画面中得到的图片,目标图片中包括:语音指令所对应的关键信息,解决了相关技术中用户无法根据语音信息得到视频中携带对应语音信息的关键信息的图片的问题。
Description
技术领域
本发明涉及图片处理领域,具体而言,涉及一种获取图片的方法及装置。
背景技术
目前,许多喜爱书写的人们在遇到一些特殊事情的时候,喜欢记录下来。例如,人们在户外活动时,可以将沿途的风景拍照留下,也可以将沿途的风景通过录制视频的方式记录下来,但实时的拍照较为麻烦,所有人们往往选择录制下来,但人们又想将一些风景打印保存。例如,会记录此处的位置、天气和今天的日期等。但人们不能实时的将路途的风景拍摄下来,而可以简单的将风景先录下来或者将看到风景时的感受通过语言表达出来,记录了这种随时随地的感想。但人们无法准确的通过视频获取想要的图片。
因此,相关技术中用户无法根据语音信息得到视频中携带对应语音信息的关键信息的图片的问题。
发明内容
本发明实施例提供了一种获取图片的方法及装置,以至少解决相关技术中解决了相关技术中用户无法根据语音信息得到视频中携带对应语音信息的关键信息的图片的问题。
根据本发明的一个实施例,提供了一种获取图片的方法,包括:获取生物对象的语音信息;在所述语音信息中识别出满足预设条件的语音指令;根据识别出的所述语音指令在图片集中获取目标图片,其中,所述图片集的图片为从视频中每帧对应的画面中得到的图片,所述目标图片中包括:所述语音指令所对应的关键信息。
可选地,在所述语音信息中识别出满足预设条件的语音指令包括:将所述语音信息与预先设置的语音指令对应的关键词相匹配,得到匹配结果;当所述匹配结果大于预定阈值时,将大于预定阈值的所述匹配结果所指示的语音指令作为所述满足预设条件的语音指令。
可选地,获取语音信息之前,所述方法包括:在获取多个生物对象的语音信息的情况下,将获取的多个生物对象的语音信息分离出多个语音信息。
可选地,根据识别出的所述语音指令在图片集中获取目标图片之后,所述方法还包括:将目标信息写入所述目标图片,其中,所述目标信息至少包括以下之一:日期信息、天气信息、地点信息。
可选地,根据识别出的所述语音指令在图片集中获取目标图片之后,所述方法还包括:将所述目标图片通过3D设备输出,以便展示所述目标图片。
根据本发明的一个实施例,提供了一种获取图片的装置,包括:第一获取单元,用于获取生物对象的语音信息;识别单元,用于在所述语音信息中识别出满足预设条件的语音指令;第二获取单元,用于根据识别出的所述语音指令在图片集中获取目标图片,其中,所述图片集的图片为从视频中每帧对应的画面中得到的图片,所述目标图片中包括:所述语音指令所对应的关键信息。
可选地,所述识别单元包括:匹配模块,用于将所述语音信息与预先设置的语音指令对应的关键词相匹配,得到匹配结果;确定模块,用于当所述匹配结果大于预定阈值时,将大于预定阈值的所述匹配结果所指示的语音指令作为所述满足预设条件的语音指令。
可选地,所述装置包括:写入单元,用于根据所述语音指令在图片集中获取目标图片之后,将目标信息写入所述目标图片,其中,所述目标信息至少包括以下之一:日期信息、天气信息、地点信息。
根据本发明的又一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本发明,通过获取生物对象的语音信息;在语音信息中识别出满足预设条件的语音指令;根据识别出的语音指令在图片集中获取目标图片,其中,图片集的图片为从视频中每帧对应的画面中得到的图片,目标图片中包括:语音指令所对应的关键信息,解决了相关技术中用户无法根据语音信息得到视频中携带对应语音信息的关键信息的图片的问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种获取图片的方法的流程图;
图2是根据本发明实施例的一种获取图片的装置的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
实施例1
在本实施例中提供了一种获取图片的方法,图1是根据本发明实施例的一种获取图片的方法的流程图,如图1所示,该流程包括如下步骤:
步骤S102,获取生物对象的语音信息。
其中,上述生物对象可以包括但不限于人。即在上述步骤S102中可以用于获取人在对话中语音信息。例如,可以获取用户A和用户B对话中A的语音信息“想得到在山顶处拍的照片”。
步骤S104,在语音信息中识别出满足预设条件的语音指令。
其中,在语音信息中识别出满足预设条件的语音指令可以包括:将语音信息与预先设置的语音指令对应的关键词相匹配,得到匹配结果;当匹配结果大于预定阈值时,将大于预定阈值的匹配结果所指示的语音指令作为满足预设条件的语音指令。
例如,在上述步骤S04中,可以将在步骤S 102中的从获取的“想得到在山顶处拍的照片”的到“获取山顶照片”的语音指令,其中。上述的预设条件可以包括但不限于根据匹配的关键词的个数。也可以通过智能语音识别出用户A的语义,根据语义转换成语音指令。
还需要说明的是,预先在设备系统中存储视频中的每一帧对应的图片,其中,每张图片中可能包括一定的语言文字。
步骤S106,根据识别出的语音指令在图片集中获取目标图片,其中,图片集的图片为从视频中每帧对应的画面中得到的图片,目标图片中包括:语音指令所对应的关键信息。
通过上述步骤,通过获取生物对象的语音信息;在语音信息中识别出满足预设条件的语音指令;根据识别出的语音指令在图片集中获取目标图片,其中,图片集的图片为从视频中每帧对应的画面中得到的图片,目标图片中包括:语音指令所对应的关键信息,解决了相关技术中用户无法根据语音信息得到视频中携带对应语音信息的关键信息的图片的问题。
为了更准确的将从语音信息中识别出语音指令,获取语音信息之前,上述方法可以包括:在获取多个生物对象的语音信息的情况下,将获取的多个生物对象的语音信息分离出多个语音信息。进而将不同的用户分离开,方便获取不同的图片。
为了将获取的图片更有序的存储或者方便用户观看,根据识别出的所述语音指令在图片集中获取目标图片之后,上述方法还可以包括:将目标信息写入所述目标图片,其中,所述目标信息至少包括以下之一:日期信息、天气信息、地点信息。
例如,视频是人们在爬山时、开会时所录制的等不同的场景下录制的。以爬山时录制的视频为例,人们为了记录时间,可以在得到的图片中写入日期、天气、地点等信息,以便人们在制作路由手册时有更多的信息被记录。
为了存储的方便,根据识别出的所述语音指令在图片集中获取目标图片之后,上述方法还可以包括:将所述目标图片通过3D设备输出,以便展示所述目标图片。即通过该方法人们可以获取语音指令对应的3D照片。
实施例2
在本实施例中还提供了一种获取图片的装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图2是根据本发明实施例的获取图片的装置的结构框图,如图2所示,该装置包括:第一获取单元21、识别单元23和第二获取单元25,其中,
第一获取单元21,用于获取生物对象的语音信息。
识别单元23,用于在语音信息中识别出满足预设条件的语音指令。
其中,上述识别单元23包括:匹配模块,用于将语音信息与预先设置的语音指令对应的关键词相匹配,得到匹配结果;确定模块,用于当匹配结果大于预定阈值时,将大于预定阈值的匹配结果所指示的语音指令作为满足预设条件的语音指令。
第二获取单元25,用于根据识别出的语音指令在图片集中获取目标图片,其中,图片集的图片为从视频中每帧对应的画面中得到的图片,目标图片中包括:语音指令所对应的关键信息。
需要说明的是,本实施例中的第一获取单元21可以用于执行本申请实施例中的步骤S102,该实施例中的识别单元23可以用于执行本申请实施例中的步骤S104,该实施例中的第二获取单元25可以用于执行本申请实施例中的步骤S106。
可选地,上述装置可以包括:写入单元,用于根据语音指令在图片集中获取目标图片之后,将目标信息写入目标图片,其中,目标信息至少包括以下之一:日期信息、天气信息、地点信息。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
实施例3
本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取生物对象的语音信息;
S2,在语音信息中识别出满足预设条件的语音指令;
S3,根据识别出的语音指令在图片集中获取目标图片,其中,图片集的图片为从视频中每帧对应的画面中得到的图片,目标图片中包括:语音指令所对应的关键信息。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种获取图片的方法,其特征在于,包括:
获取生物对象的语音信息;
在所述语音信息中识别出满足预设条件的语音指令;
根据识别出的所述语音指令在图片集中获取目标图片,其中,所述图片集的图片为从视频中每帧对应的画面中得到的图片,所述目标图片中包括:所述语音指令所对应的关键信息。
2.根据权利要求1所述的方法,其特征在于,在所述语音信息中识别出满足预设条件的语音指令包括:
将所述语音信息与预先设置的语音指令对应的关键词相匹配,得到匹配结果;
当所述匹配结果大于预定阈值时,将大于预定阈值的所述匹配结果所指示的语音指令作为所述满足预设条件的语音指令。
3.根据权利要求1所述的方法,其特征在于,获取语音信息之前,所述方法包括:
在获取多个生物对象的语音信息的情况下,将获取的多个生物对象的语音信息分离出多个语音信息。
4.根据权利要求1所述的方法,其特征在于,根据识别出的所述语音指令在图片集中获取目标图片之后,所述方法还包括:
将目标信息写入所述目标图片,其中,所述目标信息至少包括以下之一:日期信息、天气信息、地点信息。
5.根据权利要求1所述的方法,其特征在于,根据识别出的所述语音指令在图片集中获取目标图片之后,所述方法还包括:
将所述目标图片通过3D设备输出,以便展示所述目标图片。
6.一种获取图片的装置,其特征在于,包括:
第一获取单元,用于获取生物对象的语音信息;
识别单元,用于在所述语音信息中识别出满足预设条件的语音指令;
第二获取单元,用于根据识别出的所述语音指令在图片集中获取目标图片,其中,所述图片集的图片为从视频中每帧对应的画面中得到的图片,所述目标图片中包括:所述语音指令所对应的关键信息。
7.根据权利要求6所述的装置,其特征在于,所述识别单元包括:
匹配模块,用于将所述语音信息与预先设置的语音指令对应的关键词相匹配,得到匹配结果;
确定模块,用于当所述匹配结果大于预定阈值时,将大于预定阈值的所述匹配结果所指示的语音指令作为所述满足预设条件的语音指令。
8.根据权利要求6所述的装置,其特征在于,所述装置包括:
写入单元,用于根据所述语音指令在图片集中获取目标图片之后,将目标信息写入所述目标图片,其中,所述目标信息至少包括以下之一:日期信息、天气信息、地点信息。
9.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至5任一项中所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至5任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910517630.9A CN110275988A (zh) | 2019-06-14 | 2019-06-14 | 获取图片的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910517630.9A CN110275988A (zh) | 2019-06-14 | 2019-06-14 | 获取图片的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110275988A true CN110275988A (zh) | 2019-09-24 |
Family
ID=67960877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910517630.9A Pending CN110275988A (zh) | 2019-06-14 | 2019-06-14 | 获取图片的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110275988A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112289339A (zh) * | 2020-06-04 | 2021-01-29 | 郭亚力 | 一种将语音转化为画面的系统 |
CN114327718A (zh) * | 2021-12-27 | 2022-04-12 | 北京百度网讯科技有限公司 | 界面展示方法及装置、设备和介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018217685A1 (en) * | 2017-05-23 | 2018-11-29 | Rovi Guides, Inc. | Systems and methods for updating a priority of a media asset using a continuous listening device |
CN109271533A (zh) * | 2018-09-21 | 2019-01-25 | 深圳市九洲电器有限公司 | 一种多媒体文件检索方法 |
EP3477506A1 (en) * | 2016-06-22 | 2019-05-01 | Tencent Technology (Shenzhen) Company Limited | Video detection method, server and storage medium |
-
2019
- 2019-06-14 CN CN201910517630.9A patent/CN110275988A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3477506A1 (en) * | 2016-06-22 | 2019-05-01 | Tencent Technology (Shenzhen) Company Limited | Video detection method, server and storage medium |
WO2018217685A1 (en) * | 2017-05-23 | 2018-11-29 | Rovi Guides, Inc. | Systems and methods for updating a priority of a media asset using a continuous listening device |
CN109271533A (zh) * | 2018-09-21 | 2019-01-25 | 深圳市九洲电器有限公司 | 一种多媒体文件检索方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112289339A (zh) * | 2020-06-04 | 2021-01-29 | 郭亚力 | 一种将语音转化为画面的系统 |
CN114327718A (zh) * | 2021-12-27 | 2022-04-12 | 北京百度网讯科技有限公司 | 界面展示方法及装置、设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7123122B2 (ja) | 認知的洞察を使用したビデオ・シーンの移動 | |
EP3579140A1 (en) | Method and apparatus for processing video | |
CN109688463A (zh) | 一种剪辑视频生成方法、装置、终端设备及存储介质 | |
CN110674350B (zh) | 视频人物检索方法、介质、装置和计算设备 | |
Hong et al. | Dynamic captioning: video accessibility enhancement for hearing impairment | |
CN109618222A (zh) | 一种拼接视频生成方法、装置、终端设备及存储介质 | |
CN109783642A (zh) | 多人会议场景的结构化内容处理方法、装置、设备及介质 | |
CN114465737B (zh) | 一种数据处理方法、装置、计算机设备及存储介质 | |
CN108833973A (zh) | 视频特征的提取方法、装置和计算机设备 | |
CN111368141B (zh) | 视频标签的扩展方法、装置、计算机设备和存储介质 | |
KR20070118635A (ko) | 오디오 및/또는 비주얼 데이터의 서머라이제이션 | |
CN103052953A (zh) | 信息处理设备、信息处理方法和程序 | |
CN109474843A (zh) | 语音操控终端的方法、客户端、服务器 | |
CN108292322A (zh) | 使用从查看环境捕捉的信号的媒体数据文件的组织、检索、注释和呈现 | |
CN108924604A (zh) | 用于播放视频的方法和装置 | |
CN110275988A (zh) | 获取图片的方法及装置 | |
CN110347869B (zh) | 一种视频生成方法、装置、电子设备及存储介质 | |
CN111859970B (zh) | 用于处理信息的方法、装置、设备和介质 | |
CN107369450A (zh) | 收录方法和收录装置 | |
KR101804679B1 (ko) | 스토리에 기초하는 멀티미디어 콘텐츠 개발 장치 및 방법 | |
CN113573128A (zh) | 一种音频处理方法、装置、终端以及存储介质 | |
CN113762056A (zh) | 演唱视频识别方法、装置、设备及存储介质 | |
CN114697762B (zh) | 一种处理方法、装置、终端设备及介质 | |
CN110062116A (zh) | 用于处理信息的方法和设备 | |
CN112333554B (zh) | 多媒体数据的处理方法、装置、电子设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190924 |
|
RJ01 | Rejection of invention patent application after publication |