Nothing Special   »   [go: up one dir, main page]

CN101408874A - 图像文字翻译装置及方法 - Google Patents

图像文字翻译装置及方法 Download PDF

Info

Publication number
CN101408874A
CN101408874A CNA2007102019835A CN200710201983A CN101408874A CN 101408874 A CN101408874 A CN 101408874A CN A2007102019835 A CNA2007102019835 A CN A2007102019835A CN 200710201983 A CN200710201983 A CN 200710201983A CN 101408874 A CN101408874 A CN 101408874A
Authority
CN
China
Prior art keywords
image
literal
character
translation
seized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007102019835A
Other languages
English (en)
Inventor
毛华仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Futaihong Precision Industry Co Ltd
Chi Mei Communication Systems Inc
Original Assignee
Shenzhen Futaihong Precision Industry Co Ltd
Chi Mei Communication Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Futaihong Precision Industry Co Ltd, Chi Mei Communication Systems Inc filed Critical Shenzhen Futaihong Precision Industry Co Ltd
Priority to CNA2007102019835A priority Critical patent/CN101408874A/zh
Priority to US11/967,033 priority patent/US20090094016A1/en
Publication of CN101408874A publication Critical patent/CN101408874A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

一种图像文字翻译装置,其包括:存储单元,用于存储多个字库,每个字库对应一个文字类型;图像输入单元,用于攫取图像,提供翻译模式供用户选择以对所攫取图像中的文字进行翻译,确认所攫取图像中的文字所属的类型,并指定翻译语言;文字识别单元,用于分析所攫取的图像,转换图像的格式为可编辑的文本资料,从该文本资料中提取文字物件,将文字物件转化为内码,并将该内码与所确认的文字类型对应的字库中的数据进行比对从而识别文字;及语言翻译单元,用于将识别出的文字翻译成指定语言并得出翻译结果。本发明还提供一种图像文字翻译方法。利用本发明可实时翻译不同语言的图像数据,以识别图像中的文字信息。

Description

图像文字翻译装置及方法
技术领域
本发明涉及一种图像文字翻译装置及方法。
背景技术
目前,我们所面对的是一个多语种的环境,不同国家之间的人们彼此的交流越来越频繁,出国旅游、购物、交友,不可避免的需要接触很多种未曾学习的外语。例如,一个不懂任何外语的旅游者去往法国旅游,无法看懂路标、菜单、景点介绍等等,如此造成诸多不便。
光学字符识别(Optical Character Recognition,OCR)技术的发展,可以在一定程度上实现文本图像信息的自动获取,其通常用于将纸本文件经过扫描成电子文件,并对该电子文件进行处理以识别其中的文字内容。然而,生活场景中的很多外文字无法通过纸本扫描的方式进行操作。
发明内容
鉴于以上内容,有必要提供一种图像文字翻译装置,其可实时拍摄不同语言的图像数据,通过对图像中的文字进行识别与翻译以获取文字信息。
此外,还有必要提供一种图像文字翻译方法,其可实时拍摄不同语言的图像数据,通过对图像中的文字进行识别与翻译以获取文字信息。
一种图像文字翻译装置,其包括:存储单元,用于存储多个字库,其中每个字库对应一个文字类型;图像输入单元,用于攫取图像,提供翻译模式供用户选择,确认所攫取图像中的文字所属的类型,并指定翻译语言;文字识别单元,用于分析所攫取的图像,转换图像的格式为可编辑的文本资料,从该文本资料中提取文字物件,将文字物件转化为内码,并将该内码与所确认的文字类型对应的字库中的数据进行比对从而识别文字;及语言翻译单元,用于将识别出的文字翻译成指定语言并得出翻译结果。
一种图像文字翻译方法,该方法包括如下步骤:提供一个存储单元以存储多个字库,其中每个字库对应一个文字类型;攫取图像,并提供翻译模式供用户选择以对所攫取图像中的文字进行翻译;确认所攫取图像中的文字所属的类型,并提供多个翻译语言供用户指定;分析所攫取的图像,转换图像的格式为可编辑的文本资料,并从该文本资料中提取文字物件;将文字物件转化为内码,并将该内码与所确认的文字类型对应的字库中的数据进行比对从而识别文字;及将识别出的文字翻译成指定语言并得出翻译结果。
相较于现有技术,所述的图像文字翻译装置及方法,其可实时拍摄不同语言的图像数据,通过对图像中的文字进行识别与翻译以知悉文字信息。此外,该图像文字翻译装置及方法还可为数字移动产品增加附加价值。
附图说明
图1是本发明图像文字翻译装置的较佳实施例的功能模块图。
图2是本发明图像文字翻译装置的较佳实施例的翻译界面示意图。
图3是本发明图像文字翻译方法的较佳实施例的流程图。
图4是本发明图像文字翻译装置的较佳实施例的数据流向示意图。
具体实施方式
如图1所示,是本发明图像文字翻译装置的较佳实施例的功能模块图。本较佳实施例的图像文字翻译装置1可以安装在各类电子装置中,例如:计算机,尤其适用于移动式电子装置,例如:移动电话、数码相机、数码摄影机、笔记本电脑、PDA(Personal DigitalAssistant,个人数字助理)等。所述的图像文字翻译装置1提供一个操作界面给用户进行相关操作,例如,获取图像、选择获取图像的模式、对图像中包括的文字进行翻译、查看翻译结果等操作。
所述的图像文字翻译装置10主要包括五个功能模块,分别是:存储单元10、图像输入单元12、文字识别单元14、语言翻译单元16及显示单元18。
在本较佳实施例中,以一个具备摄像头的移动电话为例,该图像文字翻译装置1安装在该移动电话中。用户在需要利用图像文字翻译装置10翻译某件事物上的文字时,例如菜单上的菜肴名称、旅游地点的地理标示、书籍中的文字等等,可先通过图像输入单元12拍摄包括待翻译文字的图像并利用文字识别单元14及语言翻译单元16对图像中的文字进行翻译。
所述的存储单元10用于存储多个字库,其中每个字库对应一个文字类型。例如,存储单元10所存储的字库包括:汉字字库、英文字库、符号字库、德语字库等,每一字库对应一个文字类型。字库中包括不同文字的内码(也可称为机内码),用于机器内部对文字进行存储与处理,例如,计算机、移动电话、PDA等对汉字进行存储与处理的是汉字内码。此外,汉字字库中还包括汉字字型码(也叫字模或汉字输出码)以确定一个汉字字形点阵的代码。一个汉字字型码的信息占若干字节,所占字节数由汉字的字形决定。
以计算机对汉字的存储为例,汉字和图形符号在计算机中通常是用点阵来描述的,其中,点阵是一组二进制数。一个m行n列的点阵共有m×n个点。每个点可以是“黑”点或“白”点,用二进制位值0表示点阵中对应点为“白”点,而位值1表示对应点为“黑”点。一个汉字在存储时所占用的字节,是由该汉字的点阵信息决定。例如,对于16×16点阵的汉字来说,一个汉字的点阵信息共有16行,每一行上有16个点,每一行上的16个点需要用两个字节来存放,因此,一个16×16点阵的汉字字形需要用32个字节来存放。
该存储单元10可以是任何一种存储装置,例如:闪存(Flash Memory)、硬盘(HD)等。
所述的图像输入单元12用于攫取图像以输入到图像文字翻译装置10中。该图像输入单元12可以是拍摄装置,例如摄像头,也可以是扫描装置,例如:与计算机连接的扫描仪器等。经由图像输入单元12所获取的图像可存储为不同的格式,例如BMP(位图文件)、JPG(使用JPEG文件交换格式存储的编码图像文件)、GIF(可交换的图像文件)、PNG(PortableNetwork Graphic,可移植的网络图象文件格式)等。用户可通过图像输入单元12拍摄所有包括待翻译文字的事物以生成二维图像,并通过显示单元18呈现给用户。
所述的图像输入单元12在攫取图像时提供多种模式供用户进行选择,例如图2所示的模式选择界面30中列举了三种拍摄模式,分别是:户外模式、室内模式以及翻译模式。若用户选择户外模式以及室内模式,则图像输入单元12仅对图像进行拍摄及存储;若用户选择翻译模式,则图像输入单元12在进行图像拍摄与存储后,还将该图像传输至文字识别单元14及语言翻译单元16对图像中的文字进行辨识与翻译。其中,不同的拍摄模式下可对分辨率等进行不同等级的设置。
此外,所述的图像输入单元12还用于通过用户的选择以确认所攫取图像中的文字所属的类型,以及提供多个翻译语言供用户指定。其中,该翻译语言是为后续对识别后的文字进行翻译,其可预先指定为用户母语,例如中文简体,或者根据用户情况进行调整。
例如,若用户在法国旅行时无法识别路标,其可利用图像输入单元12拍摄该路标,选择拍摄模式为翻译模式,选择图像中的文字类型为法语,并通过图像输入单元12选择翻译语言为简体中文,则文字识别单元14与语言翻译单元16进行后续的识别与翻译动作。
所述的文字识别单元14用于分析所攫取的图像,转换图像的格式为可编辑的文本资料,从该文本资料中提取文字物件,将文字物件转化为内码,并将该内码与所确认的文字类型对应的字库中的数据进行比对从而识别文字。其中,分析图像包括对图像的格式进行分析。
此外,所述的文字识别单元14还用于对图像进行版面分析及定位,例如判别图像内文字是横排文本区、竖排文本区、表格区还是图像区,从而将识别后的文字依序排列。
对于汉字、英文与数字的识别,该文字识别单元14可自动识别宋、仿宋、楷、隶书、行楷等中文简繁体、英文、数字、表格、图片混排的稿件,识别出来的文字内码可以是GB码、BIG5码、GBK码。
所述的语言翻译单元16用于将识别出的文字翻译成指定语言并得出翻译结果。
所述的显示单元18用于显示各类数据,例如:攫取的图像、识别后的文字、翻译结果等数据。该显示单元18可以是液晶显示屏、也可以是LED(发光二级管,Light-EmittingDiode)荧幕等显示装置。
所述的存储单元10还用于储存其他各类数据,包括攫取的图像、识别后的文字、翻译结果等数据。
如图2所示,是本发明图像文字翻译装置的较佳实施例的翻译界面示意图。用户在对图像进行拍摄之前,首先需在图像输入单元12所提供的模式选择界面30中选择一种拍摄模式,例如,该模式选择界面30列举了三种拍摄模式,分别是:户外模式、室内模式以及翻译模式。若用户选择户外模式以及室内模式,则图像输入单元12仅对图像进行拍摄及存储;若用户选择翻译模式,则图像输入单元12在进行图像拍摄与存储后,还将该图像传输至文字识别单元14及语言翻译单元16对图像中的文字进行辨识与翻译。在其它实施例中,可包括更多的拍摄模式供用户进行选择。
选择翻译模式,通过图像输入单元12确定该图像中文字所属的类型以及翻译语言,继而将拍摄下图像传送至文字识别单元14。该文字识别单元将图像的格式转换为可编辑文本资料后从该文本资料中提取文字物件,并识别该文字物件中的文字,如界面32所示即为识别后的文字,例如:“How are you?”。识别后的文字将传送至语言翻译单元16进行翻译,界面34显示翻译正在后台进行中,若得出翻译结果,则通过界面36显示该翻译结果,例如:对“How are you?”的翻译结果是“你好吗?”。
如图3所示,是本发明图像文字翻译方法的较佳实施例的流程图。首先,步骤S2,提供一个存储单元10以存储多个字库,其中每个字库对应一个文字类型。
步骤S4,用户通过图像输入单元12所提供的拍摄模式中选择翻译模式,该图像输入单元12攫取相关事物的图像。
步骤S6,图像输入单元12通过用户的选择以确认所攫取图像中的文字所属的类型,以及提供多个翻译语言供用户指定,继而将所攫取的图像传送至文字识别单元14以对图像中的文字进行识别,以及存储该图像至存储单元10中。该翻译语言可预先指定为用户母语,例如中文简体,或者根据用户情况进行调整。例如,图象中的文字为“MENU”,则用户可选择文字类型为“英文”,并指定翻译语言为简体中文。
步骤S8,文字识别单元14分析所攫取的图像,转换图像的格式为可编辑的文本资料,并从该文本资料中提取文字物件。其中,分析图像包括对图像的存储格式进行分析。
步骤S10,文字识别单元14将提取的文字物件转化为内码,并将该内码与存储单元10中的字库进行比对从而识别文字。此外,该文字识别单元14还可对图像进行版面分析及定位,例如判别图像内文字是横排文本区、竖排文本区、表格区还是图像区,从而将识别后的文字依序排列。
步骤S12,语言翻译单元16将识别出的文字翻译成指定语言并得出翻译结果。
步骤S14,显示单元18显示翻译结果,并结束本流程。该翻译结果可存储至存储单元10中。
如图4所示,是本发明图像文字翻译装置的较佳实施例的数据流向示意图。首先,图像输入单元12通过拍摄等方式获取图像来源20的二维图像22,该图像来源20可以是任何事物,例如路标、菜单、书籍、名片等物,并且用户在利用图像输入单元12攫取图像22之前需选择“翻译模式”。文字识别单元14分析所攫取的图像22,转换图像22的格式为可编辑的文本资料并从中提取文字物件,以及将文字物件转化为内码以识别文字24。语言翻译单元16将识别出的文字24翻译成指定语言并得出翻译结果26。最终,显示单元18将翻译结果26呈现给用户。

Claims (6)

1.一种图像文字翻译装置,其特征在于,该装置包括:
存储单元,用于存储多个字库,其中每个字库对应一个文字类型;
图像输入单元,用于攫取图像,提供翻译模式供用户选择,确认所攫取图像中的文字所属的类型,并指定翻译语言;
文字识别单元,用于分析所攫取的图像,转换图像的格式为可编辑的文本资料,从该文本资料中提取文字物件,将文字物件转化为内码,并将该内码与所确认的文字类型对应的字库中的数据进行比对从而识别文字;及
语言翻译单元,用于将识别出的文字翻译成指定语言并得出翻译结果。
2.如权利要求1所述的图像文字翻译装置,其特征在于,该装置还包括显示单元,用于显示所攫取的图像、识别的文字以及翻译结果。
3.如权利要求1所述的图像文字翻译装置,其特征在于,该文字识别单元还用于对所攫取的图像进行版面分析及定位。
4.一种图像文字翻译方法,其特征在于,该方法包括如下步骤:
提供一个存储单元以存储多个字库,其中每个字库对应一个文字类型;
攫取图像,并提供翻译模式供用户选择以对所攫取图像中的文字进行翻译;
确认所攫取图像中的文字所属的类型,并提供多个翻译语言供用户指定;
分析所攫取的图像,转换图像的格式为可编辑的文本资料,并从该文本资料中提取文字物件;
将文字物件转化为内码,并将该内码与所确认的文字类型对应的字库中的数据进行比对从而识别文字;及
将识别出的文字翻译成指定语言并得出翻译结果。
5.如权利要求4所述的图像文字翻译方法,其特征在于,该方法还包括如下步骤:
显示所攫取的图像、识别的文字以及翻译结果。
6.如权利要求4所述的图像文字翻译方法,其特征在于,该方法在分析步骤之前还包括如下步骤:
对所攫取的图像进行版面分析及定位。
CNA2007102019835A 2007-10-09 2007-10-09 图像文字翻译装置及方法 Pending CN101408874A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CNA2007102019835A CN101408874A (zh) 2007-10-09 2007-10-09 图像文字翻译装置及方法
US11/967,033 US20090094016A1 (en) 2007-10-09 2007-12-29 Apparatus and method for translating words in images

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2007102019835A CN101408874A (zh) 2007-10-09 2007-10-09 图像文字翻译装置及方法

Publications (1)

Publication Number Publication Date
CN101408874A true CN101408874A (zh) 2009-04-15

Family

ID=40524014

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007102019835A Pending CN101408874A (zh) 2007-10-09 2007-10-09 图像文字翻译装置及方法

Country Status (2)

Country Link
US (1) US20090094016A1 (zh)
CN (1) CN101408874A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102346731A (zh) * 2010-08-02 2012-02-08 联想(北京)有限公司 一种文件处理方法及文件处理装置
CN103294665A (zh) * 2012-02-22 2013-09-11 汉王科技股份有限公司 电子阅读器文本翻译的方法及电子阅读器
CN103699527A (zh) * 2013-12-20 2014-04-02 上海合合信息科技发展有限公司 图像翻译系统及图像翻译方法
CN105117390A (zh) * 2015-08-26 2015-12-02 广西小草信息产业有限责任公司 一种基于屏幕捕捉的翻译方法及系统
CN105279152A (zh) * 2014-06-24 2016-01-27 腾讯科技(深圳)有限公司 一种取词翻译的方法和装置
CN105518675A (zh) * 2013-07-09 2016-04-20 柳仲夏 提供符号图像搜索服务的方法及用于该方法的符号图像搜索服务器
CN106127837A (zh) * 2015-05-07 2016-11-16 顶漫画股份有限公司 网络漫画的多国语言支持系统
CN106384109A (zh) * 2016-09-08 2017-02-08 广东小天才科技有限公司 一种电子终端确定对焦的方法和装置
CN106407923A (zh) * 2016-09-08 2017-02-15 广东小天才科技有限公司 一种应用于电子终端的信息处理方法和装置
CN107145318A (zh) * 2017-04-21 2017-09-08 苏州艾克威尔科技有限公司 一种光明灯系统的显示装置和显示方法
CN107480145A (zh) * 2017-08-07 2017-12-15 中译语通科技(青岛)有限公司 一种基于互联网的多语菜单翻译方法
CN109271910A (zh) * 2018-09-04 2019-01-25 阿里巴巴集团控股有限公司 一种文字识别、文字翻译方法和装置
CN111047933A (zh) * 2020-01-07 2020-04-21 上海奇初教育科技有限公司 一种教辅自动批改系统
CN111047934A (zh) * 2020-01-07 2020-04-21 上海奇初教育科技有限公司 一种试卷制作及自动批改系统
CN116384418A (zh) * 2023-05-24 2023-07-04 深圳市微克科技有限公司 一种应用智能手表进行翻译的数据处理方法及系统

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009026193A2 (en) * 2007-08-17 2009-02-26 Accupatent, Inc. System and method for search
WO2011066364A2 (en) * 2009-11-25 2011-06-03 Adc Telecommunications, Inc. Methods, systems and devices for providing fiber-to-the-desktop
CN102214167A (zh) * 2010-04-09 2011-10-12 倪劲松 一种即时翻译系统、终端及方法
US9223769B2 (en) 2011-09-21 2015-12-29 Roman Tsibulevskiy Data processing systems, devices, and methods for content analysis
US9304990B2 (en) * 2012-08-20 2016-04-05 International Business Machines Corporation Translation of text into multiple languages
US9898935B2 (en) * 2013-12-23 2018-02-20 Maurice Hazan Language system
KR20160071144A (ko) 2014-12-11 2016-06-21 엘지전자 주식회사 이동단말기 및 그 제어 방법
KR101769981B1 (ko) * 2016-03-29 2017-08-22 네이버 주식회사 이미지를 이용한 번역문 제공 방법, 사용자 단말, 서버, 시스템 및 컴퓨터 프로그램
KR102457894B1 (ko) * 2017-08-22 2022-10-25 삼성전자주식회사 디스플레이에 표시된 텍스트를 번역하는 방법 및 장치

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3233194C2 (de) * 1981-09-08 1986-04-10 Sharp K.K., Osaka Elektronischer Taschenübersetzer
US4996707A (en) * 1989-02-09 1991-02-26 Berkeley Speech Technologies, Inc. Text-to-speech converter of a facsimile graphic image
US5497319A (en) * 1990-12-31 1996-03-05 Trans-Link International Corp. Machine translation and telecommunications system
US5461488A (en) * 1994-09-12 1995-10-24 Motorola, Inc. Computerized facsimile (FAX) system and method of operation
JP3959690B2 (ja) * 2003-10-01 2007-08-15 ソニー株式会社 撮像装置および撮像方法
US7817855B2 (en) * 2005-09-02 2010-10-19 The Blindsight Corporation System and method for detecting text in real-world color images

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10210148B2 (en) 2010-08-02 2019-02-19 Lenovo (Beijing) Limited Method and apparatus for file processing
CN102346731B (zh) * 2010-08-02 2014-09-03 联想(北京)有限公司 一种文件处理方法及文件处理装置
CN102346731A (zh) * 2010-08-02 2012-02-08 联想(北京)有限公司 一种文件处理方法及文件处理装置
CN103294665A (zh) * 2012-02-22 2013-09-11 汉王科技股份有限公司 电子阅读器文本翻译的方法及电子阅读器
CN105518675A (zh) * 2013-07-09 2016-04-20 柳仲夏 提供符号图像搜索服务的方法及用于该方法的符号图像搜索服务器
CN103699527A (zh) * 2013-12-20 2014-04-02 上海合合信息科技发展有限公司 图像翻译系统及图像翻译方法
CN105279152A (zh) * 2014-06-24 2016-01-27 腾讯科技(深圳)有限公司 一种取词翻译的方法和装置
CN106127837A (zh) * 2015-05-07 2016-11-16 顶漫画股份有限公司 网络漫画的多国语言支持系统
CN105117390A (zh) * 2015-08-26 2015-12-02 广西小草信息产业有限责任公司 一种基于屏幕捕捉的翻译方法及系统
CN106384109B (zh) * 2016-09-08 2020-01-03 广东小天才科技有限公司 一种电子终端确定对焦的方法和装置
CN106407923A (zh) * 2016-09-08 2017-02-15 广东小天才科技有限公司 一种应用于电子终端的信息处理方法和装置
CN106407923B (zh) * 2016-09-08 2020-01-03 广东小天才科技有限公司 一种应用于电子终端的信息处理方法和装置
CN106384109A (zh) * 2016-09-08 2017-02-08 广东小天才科技有限公司 一种电子终端确定对焦的方法和装置
CN107145318A (zh) * 2017-04-21 2017-09-08 苏州艾克威尔科技有限公司 一种光明灯系统的显示装置和显示方法
CN107480145A (zh) * 2017-08-07 2017-12-15 中译语通科技(青岛)有限公司 一种基于互联网的多语菜单翻译方法
CN109271910A (zh) * 2018-09-04 2019-01-25 阿里巴巴集团控股有限公司 一种文字识别、文字翻译方法和装置
CN111047933A (zh) * 2020-01-07 2020-04-21 上海奇初教育科技有限公司 一种教辅自动批改系统
CN111047934A (zh) * 2020-01-07 2020-04-21 上海奇初教育科技有限公司 一种试卷制作及自动批改系统
CN116384418A (zh) * 2023-05-24 2023-07-04 深圳市微克科技有限公司 一种应用智能手表进行翻译的数据处理方法及系统
CN116384418B (zh) * 2023-05-24 2023-08-15 深圳市微克科技有限公司 一种应用智能手表进行翻译的数据处理方法及系统

Also Published As

Publication number Publication date
US20090094016A1 (en) 2009-04-09

Similar Documents

Publication Publication Date Title
CN101408874A (zh) 图像文字翻译装置及方法
JP6303594B2 (ja) 単一セル中の画像データ及びシンボルデータによるテーブルのソート及びフィルタリング
US20130238968A1 (en) Automatic Creation of a Table and Query Tools
US8958644B2 (en) Creating tables with handwriting images, symbolic representations and media images from forms
US10339378B2 (en) Method and apparatus for finding differences in documents
US9058516B2 (en) Automatic identification of fields and labels in forms
US9081412B2 (en) System and method for using paper as an interface to computer applications
CN113221181B (zh) 具有隐私保护的表格类信息抽取系统及方法
CN111753717B (zh) 用于提取文本的结构化信息的方法、装置、设备及介质
US8792730B2 (en) Classification and standardization of field images associated with a field in a form
KR101377601B1 (ko) 모바일 카메라를 이용한 자연 영상 다국어 문자 인식과 번역 시스템 및 방법
US9298685B2 (en) Automatic creation of multiple rows in a table
KR101552525B1 (ko) 폰트를 인식하고 폰트정보를 제공하는 시스템 및 그 방법
Cheng et al. M6doc: A large-scale multi-format, multi-type, multi-layout, multi-language, multi-annotation category dataset for modern document layout analysis
CN111897781A (zh) 一种知识图谱数据抽取方法和系统
CN113642569A (zh) 非结构化数据文档处理方法及相关设备
Zharikov et al. DDI-100: dataset for text detection and recognition
JP2007241355A (ja) 画像処理装置及び画像処理プログラム
Pattnaik et al. A Framework to Detect Digital Text Using Android Based Smartphone
Guruprasad et al. An end-to-end, interactive deep learning based annotation system for cursive and print English handwritten text
Al-Barhamtoshy et al. Universal metadata repository for document analysis and recognition
CN102110082B (zh) 一种小样文件的补字输出方法及系统
Mukherjee et al. OCR Using Python and Its Application.
Gautam et al. The Dataset for Printed Brahmi Word Recognition
Shetty et al. Text Identification System for Translation of English Language

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20090415