CN111913930A - 物种数据解析方法、系统及电脑程序产品 - Google Patents
物种数据解析方法、系统及电脑程序产品 Download PDFInfo
- Publication number
- CN111913930A CN111913930A CN201910389715.3A CN201910389715A CN111913930A CN 111913930 A CN111913930 A CN 111913930A CN 201910389715 A CN201910389715 A CN 201910389715A CN 111913930 A CN111913930 A CN 111913930A
- Authority
- CN
- China
- Prior art keywords
- species data
- strings
- string
- title
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000007405 data analysis Methods 0.000 title claims abstract description 24
- 238000004590 computer program Methods 0.000 title claims abstract description 11
- 238000004458 analytical method Methods 0.000 claims abstract description 20
- 238000004891 communication Methods 0.000 claims description 10
- 238000012216 screening Methods 0.000 claims 1
- 241000894007 species Species 0.000 description 78
- 230000007246 mechanism Effects 0.000 description 7
- 238000007619 statistical method Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 229910052500 inorganic mineral Inorganic materials 0.000 description 3
- 239000011707 mineral Substances 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 244000099147 Ananas comosus Species 0.000 description 1
- 235000007119 Ananas comosus Nutrition 0.000 description 1
- 208000003464 asthenopia Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000001454 recorded image Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种物种数据解析方法、系统以及电脑程序产品。该方法包含:一解析单元辨识一标本记录影像以产生相对应的一文字讯息,并将文字讯息区分出多个字串;运算单元判断多个字串未符合一物种数据表的多个标题栏位时,决定多个字串对应于多个标题栏位的多个权重值;以及运算单元依据多个权重值计算出最关联的字串,并写入物种数据表中与每一标题栏位相邻的一物种数据栏位。
Description
技术领域
本发明是有关一种物种数据解析方法、系统及电脑程序产品,特别是一种适于各类标本的物种数据解析方法、系统及电脑程序产品。
背景技术
目前在各类标本的数字化管理上,例如:动物、植物、矿物、化石或搜藏品等,使用者需透过人工阅读各个标本记录、将相关数据输入归档、以进行后续统计分析,因此,在上述流程步骤中均需透过大量人工进行作业。
然而,各种标本记录的格式可能因不同的制作者而有所不同,亦即,来自全球各地的标本可能缺乏统一的记载格式,透过人工逐一判读,不仅容易由于人眼疲劳导致作业效率降低,也可能因为作业员经验不足导致不必要的数据误读。
发明内容
有鉴于此,本发明的部分实施例提供一种物种数据解析方法、系统及电脑程序产品。
本发明一实施例的物种数据解析方法包含:一解析单元辨识一标本记录影像以产生相对应的一文字讯息,并将文字讯息区分出多个字串;运算单元判断多个字串未符合一物种数据表的多个标题栏位时,决定多个字串对应于多个标题栏位的多个权重值;以及运算单元依据多个权重值计算出最关联的字串,并写入物种数据表中与每一标题栏位相邻的一物种数据栏位。
本发明另一实施例的电脑程序产品,其包括一组指令,当电脑载入并执行此组指令后能完成根据本发明任一实施例的物种数据解析方法。
本发明又一实施例的物种数据解析系统包含一解析单元、一运算单元以及一储存单元。解析单元辨识一标本记录影像以产生相对应的一文字讯息,并将文字讯息区分出多个字串。运算单元电性连接于解析单元。运算单元判断多个字串未符合一物种数据表的多个标题栏位时,决定多个字串对应于多个标题栏位的多个权重值,依据多个权重值计算出最关联的字串,并写入物种数据表中与每一标题栏位相邻的一物种数据栏位。储存单元电性连接于运算单元。储存单元储存物种数据表。
以下藉由具体实施例配合附图详加说明,当更容易了解本发明的目的、技术内容、特点及其所达成的功效。
附图说明
图1为本发明一实施例的物种数据解析方法的步骤示意图。
图2为实施图1的物种数据解析方法的物种数据解析系统的一实施例的电子装置架构示意图。
图3为本发明一实施例的物种数据解析方法的步骤示意图。
符号说明
S0-S4 步骤
1 电子装置
10 解析单元
20 运算单元
30 储存单元
40 影像撷取单元
50 通信单元
具体实施方式
以下将详述本发明的各实施例,并配合附图作为例示。在说明书的描述中,为了使读者对本发明有较完整的了解,提供了许多特定细节;然而,本发明可能在省略部分或全部特定细节的前提下仍可实施。图式中相同或类似的元件将以相同或类似符号来表示。特别注意的是,附图仅为示意之用,并非代表元件实际的尺寸或数量,有些细节可能未完全绘出,以求附图的简洁。
请一并参照图1及图2,显示本发明任一实施例的物种数据解析方法可由一电脑程序实现,以致于当电脑(即,具有解析单元10、运算单元20与储存单元30的任意电子装置1,如:伺服器、平板电脑或智慧型手机)载入程序并执行后可完成任一实施例的物种数据解析方法。
使用者先提供对应于标本的标本记录影像给电脑,接续进行自动解析及归档流程,以利数字化管理及应用。于部分实施例中,本文所谓物种标本或简称标本,系指动物、植物、矿物、化石或搜藏品等采集样本,但不以此为限。一般而言,标本上/侧边通常附有相对应的标本记录来说明相关讯息,例如:标本采集日期、地点、生物/矿物分类、采集者等数据记录,例如:下方表一所示多标题栏位格式数据记录、表二所示单一标题栏位格式数据记录或表三所示无标题栏位格式数据记录。
表一多标题栏位格式数据记录
表二单一标题栏位格式数据记录
表三无标题栏位格式数据记录
于本实施例中,储存单元30电性连接于运算单元20,且储存单元30内储一物种数据表,作为预设的标准格式,如下表四所示,透过后述解析流程可获取有意义的物种数据并填入物种数据栏位,以完成自动归档分类的物种数据库。
表四物种数据表
首先,解析单元10可透过例如但不限于光学字元辨识(OCR)机制,自动辨识出标本记录影像中可能存在的文字讯息,然而,此文字讯息可能混合着代表不同数据意义的数字及文字(以下简称字元),例如:日期和经纬度为数字、地点和生物分类为文字等混合资讯,这些均是未经整理过的记录数据,以往需透过人工判读始能正确理解其记录意义,而电子装置1无法直接辨识出正确的数据意义。对此,解析单元10将一整份文字讯息切分为多个文字区块以利后续辨识,举例而言,依据各单字或数字间的至少一空格或符号(例如:斜线、逗号、顿号或分号),将文字讯息区分出多个字串,并传送这些字串至运算单元20来进行数据解析。简言之,在步骤S1中,解析单元10辨识一标本记录影像以产生相对应的一文字讯息,并将文字讯息区分出多个字串。
补充说明者,单纯利用上述影像转换文字机制容易产生因机器无法或错误辨识所生的乱码符号,反而导致后续数据解析的不便及错误解读,因此,于一实施例中,运算单元20滤除文字讯息中无语法意义的字元,举例而言,运算单元20可透过内储于储存单元30的本机数据库或连线到云端数据库,查找字串以筛除无语法意义、拼字或文法错误的文字或符号,例如:@#$%无意义符号或不符合常用语言(中、英、拉丁文)拼字及文法的字元,但不以此为限。本实施例透过此滤除步骤,将有助于提高后续数据解析的准确率。
由于上述表一至表三为不同格式的标本记录,现有的影像处理技术无法同时解处理多种格式的数据记录。于本实施例中,运算单元20预先透过例如字串比对、数据查找等方式,判断文字讯息多个字串是否包含/符合预设的物种数据表的多个标题栏位,如表四所示,以区别待处理数据类型为多标题栏位格式、单一标题栏位格式或无标题栏位格式;若判断结果为不符合或无法对应,表示文字讯息可能属于单一标题栏位格式或无标题栏位格式,则运算单元20无从直接且准确地解析出对应于各标题栏位的物种数据,从而需要透过演算法筛选出对应于每一个标题栏位的物种数据。
于本实施例中,透过步骤S2,运算单元20判断多个字串未符合预设的物种数据表的多个标题栏位时,则透过演算法决定多个字串对应于多个标题栏位的多个权重值,以利后续判断各个标题栏位与各个字串之间的关联性程度。举例而言,对应于标题栏位的物种数据往往具有通用的正规格式,其中,“日期”的正规格式可为西元年月日等10个数字搭配特定分隔符号,例如:1997/12/31、1997-12-31等样式,“地点”的正规格式可为具有特定关键字的地址文字,例如:xx市xx区xx路/街,又经纬度的正规格式可为代表特定经纬度的英文字母搭配数字及上标号,例如:xxxExx’xx”、xxxWxx’xx”、xxxNxx’xx”、xxxSxx’xx”,而“分类”的正规格式可为具有特定生物分类关键字的文字,例如:xx界xx门xx纲xx目xx科xx属xx种,但不以此为限。因此,运算单元20透过具有特定格式规则或关键特征的正规格式,判断各个字串数据可能对应至何种标题栏位及相对应的权重值,例如:某一串数字及符号的组合字串经判断其为日期的权重值是90%,而其为地点(经纬度)的权重值是80%。
接着,透过步骤S3,运算单元20依据多个字串的多个权重值,计算出多个字串中与特定标题栏位最关联的字串,并写入物种数据表中与此标题栏位相邻的物种数据栏位。例如,运算单元20判断字串1997/12/31为日期的权重值为100%,且字串22N58’00”为日期的权重值为40%,从而认定多个字串中与标题栏位“日期”最关联的字串为1997/12/31而非22N58’00”,并将字串1997/12/31写入物种数据表中对应且相邻于日期标题栏位的物种数据栏位,如下表五所示。依此类推,透过例如但不限于具有特定格式规则或关键特征的正规格式,运算单元20赋予各字串对应于各个标题栏位的权重值,并计算出最符合各个标题栏位的关联字串,即可自动获得地点、采集者、分类等标题栏位所对应的多个物种数据栏位,在此不再冗述。亦即,运算单元20依据每一字串与每一物种数据栏位预设的一正规格式相比对所得的一符合程度,决定此字串对应于每一标题栏位的权重值。
表五
依据上述架构,本揭露透过人工智慧演算流程,将影像转换为混乱的文字、符号、数字讯息后,初步找出有语法意义的字串数据,进一步利用各项物种数据栏位所预设的特定格式规则或关键特征进一步解析多个字串,最后将最关联字串重新排列并储存至物种数据表及物种数据库,以完成自动归档分类的数字化自动整合作业,让使用者从搜集标本记录影像、标本记录数位化到最后统计分析一次性迅速完成。因此,无需透过人工辨识、输入、归档等方式将所有文字数据进行分类统合,有效防免效率低落以及人为误读的疏忽,可大幅提升实用性及便利性。
当大量标本经过上述解析方法获得并储存具有相关数据的物种数据表后,将产生一庞大的物种数据库。可使用电脑自动对大量数据库进行各种统计分析,得出各种统计分析文字与图表,供学者、政府等单位做各项研究及政策的参考依据。统计分析项目例如但不限:标本的采集地点与地图的结合,呈现出该物种或物品的地理散布资讯;数量及时间(如数年或月份区间)的统计关系图,呈现其出现频率及时间的关系;以分类(如物种分类)占比呈现图表分析;根据海拔高度与时间关系进行统计,呈现出物种在不同时间点的分布状况;结合海拔高度与地理相关资讯,呈现不同地区的海拔高度分度情况;同时结合多维特征如物种、地点、时间……等进行大数据分析及数据探勘,分析其各项特征间的相依关系。
以下说明本发明的部分衍生实施例的物种数据解析方法。请一并参照图2及图3,在本实施例中,透过步骤S0,电子装置1取得一标本记录影像。举例而言,电子装置1选择性包含一影像撷取单元40,且影像撷取单元40电性连接于运算单元20。影像撷取单元40撷取标本记录影像并传送至解析单元10,例如:电子装置1撷取实体标本及其标本记录的影像以进行影像数位化程序,其结果将产生包含标本记录(如表一内容)的标本影像(如凤梨照片),例如:电子装置1可为影像扫描器、摄影装置或行动装置等,但不以此为限;或者,电子装置1选择性包含一通信单元50,且通信单元50电性连接于运算单元20。举例而言,通信单元50可为一无线通信介面,透过一无线通信协定与远端的装置建立连线。通信单元50接收标本记录影像并传送至解析单元10,亦即,电子装置1可透过有线及无线网络通信方式接收外部电子装置所传来的一个或多个标本记录影像,藉此,各地的使用者可透过不同的电子装置来撷取多个标本记录影像,并上传至伺服器或云端系统的电子装置1来进行后续影像解析处理,以加速数位化作业的速度及效率,例如:电子装置1可为伺服器或桌上型电脑等,但不以此为限。
承前所述,由于各地标本记录均未统一格式,当运算单元20透过例如字串比对、数据查找等方式,判断文字讯息中多个字串当中包含/符合预设的物种数据表的多个标题栏位,表示文字讯息属于多栏位格式,若文字讯息中相关字串可对应于如表四所示的多个标题栏位,纵使栏位先后次序有所不同,运算单元20仍可依据字串判断结果获得对应于物种数据表中各标题栏位的标题字串,并在文字讯息内容多个字串当中,将标题字串后第一次出现的字串视为物种数据字串,并写入物种数据表中与标题栏位相邻的物种数据栏位,亦即,透过步骤S4,将文字讯息中与对应于标题栏位的字串(例如:标题字串)相邻的另一字串(例如:物种数据字串),写入物种数据表中与标题栏位相邻的物种数据栏位。
于一实施例中,电子装置1透过步骤S2决定多个字串对应于多个标题栏位的多个权重值,系由运算单元20建立一候选表单包含多个候选栏位,其中多个候选栏位对应于物种数据表的多个标题栏位,接着,分配多个字串至候选表单中多个候选栏位以供候选,同时赋予字串相对应的权重值。于至少一实施例中,运算单元20依据不同的多个字串出现于同一候选栏位的先后顺序,赋予每一字串由高至低相对应的权重值,例如:字串1997/12/31出现于日期候选栏位的第一行,所赋予的权重值为100%,而字串22N58’00”出现于日期候选栏位的第二行,所赋予的权重值为60%,如下表六所示,但不以此为限,例如:若一并考量正规式表示法的权重值考量参数,亦有可能将后序位出现的字串修正调整为具有较高的权重值,如下表六中采集者栏位所对应的字串张三的权重值高于字串台南市的权重值。换言之,决定权重值的变数包含但不限于正规格式及字串排列先后顺序。
表六候选表单
于一实施例中,电子装置1透过步骤S3计算出最关联的字串,是由运算单元20自同一候选栏位的多个字串中计算出最关联的字串,例如:在对应于日期标题栏位的同一个候选物种数据栏位中,依权重值高低判断出最关联的字串,例如:运算单元20筛选出具有最高权重值100%的字串1997/12/31,后续将此字串写入物种数据表中相对应的物种数据栏位。其余候选物种数据栏位的演算逻辑及工作原理可依此类推,在此不再冗述。
于另一实施例中,电子装置1透过步骤S3计算出最关联的字串,是由运算单元20自同一字串对应于不同的多个候选栏位的多个权重值中,筛选出此字串具有最高权重值的候选栏位,例如:字串120E19’00”对应于候选表单中日期标题栏位的权重值为60%,但字串120E19’00”对应于候选表单中地点标题栏位的权重值为100%,因此认定与候选表单中地点标题栏位最关联的字串为120E19’00”,后续将此字串写入物种数据表中相对应的物种数据栏位。其余候选物种数据栏位的演算逻辑及工作原理可依此类推,在此不再冗述。
请参照图2,显示本发明一实施例的物种数据解析系统的电子装置架构示意图。物种数据解析系统可为包含一解析单元10、一运算单元20以及一储存单元30的任意电子装置1,已如前所述。解析单元10可为一光学字元辨识处理器。解析单元10辨识标本记录影像以产生相对应的文字讯息并区分出多个字串,相关技术内容及功效已如前述。
运算单元20电性连接于解析单元10。于一实施例中,运算单元20可由一个或多个诸如微处理器、微控制器、数位信号处理器、微型计算机、中央处理器、场编程闸阵列、可编程逻辑设备、状态器、逻辑电路、模拟电路、数字电路和/或任何基于操作指令操作信号(模拟和/或数字)的处理元件来实现。运算单元20判断多个字串未符合一物种数据表的多个标题栏位时,决定多个字串对应于多个标题栏位的多个权重值,相关判断机制、各个权重值决定机制及其衍生实施例已如前述。运算单元20依据多个权重值计算出最关联的字串,并写入物种数据表中与每一标题栏位相邻的一物种数据栏位,相关计算机制、最关联字串判断机制、物种数据字串决定机制及其衍生实施例已如前述。
储存单元30电性连接于运算单元20。于一实施例中,储存单元30可由一个或多个记忆体实现。储存单元30储存物种数据表、经计算后写入一笔或多笔数据的物种数据库、以及选择性具有候选表单,可供使用者管理、查询、维护以及电脑对大量数据库进行各种统计分析。
在部分实施例中,用于物种数据解析的电脑程序产品是由一组指令所组成,当电脑载入并执行该组指令后能完成上述任一实施例的物种数据解析方法。
综合上述,本发明的部分实施例提供一种物种数据解析方法、系统及电脑程序产品,主要是利用解析单元由数位化影像撷取出有标本记录意义的多个字串,并透过运算单元依据物种数据表的预设规则及特征决定各个字串的权重值以进行人工智慧演算,自动筛选出最关联的物种数据字串并写入物种数据库,以完成自动归档分类的数字化自动整合作业,让使用者从搜集标本记录影像、标本记录数位化到最后统计分析一次性迅速完成。因此,无需透过人工辨识、输入、归档等方式将所有文字数据进行分类统合,有效防免效率低落以及人为误读的疏忽,可大幅提升实用性及便利性,具有诸多优点及功效已如前述。
以上所述的实施例仅是为说明本发明的技术思想及特点,其目的在使熟悉本技术领域者能够了解本发明的内容并据以实施,当不能以此限定本发明的专利范围,即凡依本发明所揭示的精神所作的均等变化或修饰,仍应涵盖在本发明的专利范围内。
Claims (20)
1.一种物种数据解析方法,包含:
一解析单元辨识一标本记录影像以产生相对应的一文字讯息,并将该文字讯息区分出多个字串;
一运算单元判断该多个字串未符合一物种数据表的多个标题栏位时,决定该多个字串对应于该多个标题栏位的多个权重值;以及
该运算单元依据该多个权重值计算出最关联的该字串,并写入该物种数据表中与每一该标题栏位相邻的一物种数据栏位。
2.如权利要求1所述的物种数据解析方法,其特征在于,该将该文字讯息区分出该多个字串的步骤包含:该运算单元滤除该文字讯息中无语法意义的一字元。
3.如权利要求1所述的物种数据解析方法,其特征在于,分配该多个字串的该多个权重值的步骤还包含:依据该每一该字串与该物种数据栏位预设的一正规格式相比对所得的一符合程度,决定每一该字串对应于每一该标题栏位的该权重值。
4.如权利要求1所述的物种数据解析方法,其特征在于,决定该多个字串对应于该多个标题栏位的该多个权重值的步骤包含:该运算单元建立一候选表单包含对应于该多个标题栏位的多个候选栏位,分配该多个字串至该多个候选栏位并指定该多个权重值。
5.如权利要求4所述的物种数据解析方法,其特征在于,决定该多个字串对应于该多个标题栏位的该多个权重值的步骤还包含:依据不同的该多个字串出现于同一该候选栏位的先后顺序赋予由高至低的该多个权重值。
6.如权利要求4所述的物种数据解析方法,其特征在于,该依据该多个权重值计算出最关联的该字串的步骤包含:自同一该候选栏位的该多个字串中计算出最关联的该字串。
7.如权利要求4所述的物种数据解析方法,其特征在于,该依据该多个权重值计算出最关联的该字串的步骤包含:由同一该字串对应于该多个候选栏位的该多个权重值中,筛选出具有最高该权重值的该候选栏位。
8.如权利要求1所述的物种数据解析方法,其特征在于,在该辨识该标本记录影像的步骤前,还包含:
一通信单元或一影像撷取单元取得并传送该标本记录影像至该解析单元。
9.如权利要求1所述的物种数据解析方法,其特征在于,在区分出该多个字串的步骤后,还包含:
该运算单元判断该多个字串符合该物种数据表的该多个标题栏位时,将该文字讯息中与对应于每一该标题栏位的该字串相邻的另一该字串,写入该物种数据表中与每一该标题栏位相邻的该物种数据栏位。
10.一种电脑程序产品,包括一组指令,当电脑载入并执行该组指令后能完成如权利要求1至9中的任一项所述的物种数据解析方法。
11.一种物种数据解析系统,包含:
一解析单元,用以辨识一标本记录影像以产生相对应的一文字讯息,并将该文字讯息区分出多个字串;
一运算单元,电性连接于该解析单元,用以判断该多个字串未符合一物种数据表的多个标题栏位时,决定该多个字串对应于该多个标题栏位的多个权重值,依据该多个权重值计算出最关联的该字串,并写入该物种数据表中与每一该标题栏位相邻的一物种数据栏位;以及
一储存单元,电性连接于该运算单元,用以储存该物种数据表。
12.如权利要求11所述的物种数据解析系统,其特征在于,该运算单元滤除该文字讯息中无语法意义的一字元。
13.如权利要求11所述的物种数据解析系统,其特征在于,该运算单元依据该每一该字串与该物种数据栏位预设的一正规格式相比对所得的一符合程度,决定每一该字串对应于每一该标题栏位的该权重值。
14.如权利要求11所述的物种数据解析系统,其特征在于,该运算单元建立一候选表单包含对应于该多个标题栏位的多个候选栏位,分配该多个字串至该多个候选栏位并指定该多个权重值。
15.如权利要求14所述的物种数据解析系统,其特征在于,该运算单元依据不同的该多个字串出现于同一该候选栏位的先后顺序赋予由高至低的该多个权重值。
16.如权利要求14所述的物种数据解析系统,其特征在于,该运算单元自同一该候选栏位的该多个字串中计算出最关联的该字串。
17.如权利要求14所述的物种数据解析系统,其特征在于,该运算单元由同一该字串对应于该多个候选栏位的该多个权重值中,筛选出具有最高该权重值的该候选栏位。
18.如权利要求11所述的物种数据解析系统,其特征在于,还包含:
一通信单元,电性连接于该运算单元,用于接收该标本记录影像并传送至该解析单元。
19.如权利要求11所述的物种数据解析系统,其特征在于,还包含:
一影像撷取单元,电性连接于该运算单元,用于撷取该标本记录影像并传送至该解析单元。
20.如权利要求11所述的物种数据解析系统,其特征在于,该运算单元判断该多个字串符合该物种数据表的该多个标题栏位时,将该文字讯息中与对应于每一该标题栏位的该字串相邻的另一该字串,写入该物种数据表中与每一该标题栏位相邻的该物种数据栏位。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910389715.3A CN111913930A (zh) | 2019-05-10 | 2019-05-10 | 物种数据解析方法、系统及电脑程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910389715.3A CN111913930A (zh) | 2019-05-10 | 2019-05-10 | 物种数据解析方法、系统及电脑程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111913930A true CN111913930A (zh) | 2020-11-10 |
Family
ID=73241902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910389715.3A Pending CN111913930A (zh) | 2019-05-10 | 2019-05-10 | 物种数据解析方法、系统及电脑程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111913930A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1673995A (zh) * | 2004-03-24 | 2005-09-28 | 微软公司 | 从扫描文档填充电子表格的方法和装置 |
CN101661512A (zh) * | 2009-09-25 | 2010-03-03 | 万斌 | 一种识别传统表单信息并创建对应Web表单的系统及方法 |
CN106940804A (zh) * | 2017-02-23 | 2017-07-11 | 杭州仟金顶卓筑信息科技有限公司 | 建筑工程物料管理系统表单数据自动录入方法 |
CN107516004A (zh) * | 2017-07-06 | 2017-12-26 | 贵阳朗玛信息技术股份有限公司 | 医学影像图片的识别处理方法及装置 |
TWI648685B (zh) * | 2017-07-28 | 2019-01-21 | 捷思達數位開發有限公司 | 自動化辨識表單並建立動態表單之系統及其方法 |
-
2019
- 2019-05-10 CN CN201910389715.3A patent/CN111913930A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1673995A (zh) * | 2004-03-24 | 2005-09-28 | 微软公司 | 从扫描文档填充电子表格的方法和装置 |
CN101661512A (zh) * | 2009-09-25 | 2010-03-03 | 万斌 | 一种识别传统表单信息并创建对应Web表单的系统及方法 |
CN106940804A (zh) * | 2017-02-23 | 2017-07-11 | 杭州仟金顶卓筑信息科技有限公司 | 建筑工程物料管理系统表单数据自动录入方法 |
CN107516004A (zh) * | 2017-07-06 | 2017-12-26 | 贵阳朗玛信息技术股份有限公司 | 医学影像图片的识别处理方法及装置 |
TWI648685B (zh) * | 2017-07-28 | 2019-01-21 | 捷思達數位開發有限公司 | 自動化辨識表單並建立動態表單之系統及其方法 |
Non-Patent Citations (1)
Title |
---|
王华树: "《翻译技术教程 上》", 商务印书馆 上海外语音像出版社, pages: 94 - 95 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107766371B (zh) | 一种文本信息分类方法及其装置 | |
US10936906B2 (en) | Training data acquisition method and device, server and storage medium | |
US6996268B2 (en) | System and method for gathering, indexing, and supplying publicly available data charts | |
CN109325414A (zh) | 证件信息的提取方法、装置和文本信息的提取方法 | |
CN107357902B (zh) | 一种基于关联规则的数据表分类系统与方法 | |
CN112818785B (zh) | 一种气象纸质表格文档的快速数字化方法及系统 | |
Mann et al. | Automatic flower detection and phenology monitoring using time‐lapse cameras and deep learning | |
CN111709575A (zh) | 基于c-lstm的学业成绩预测方法 | |
KR100974064B1 (ko) | 사용자 맞춤형 정보 제공 시스템 및 그 방법 | |
Barber et al. | The SALIX method: A semi‐automated workflow for herbarium specimen digitization | |
CN107357765A (zh) | Word文档碎片化方法及装置 | |
CN110968664A (zh) | 一种文书检索方法、装置、设备及介质 | |
Owen et al. | Towards a scientific workflow featuring Natural Language Processing for the digitisation of natural history collections. | |
CN117112648A (zh) | 一种基于智慧教育数据的高校学生学习画像生成系统及方法 | |
CN116010552A (zh) | 一种基于关键词词库的工程造价数据解析系统及其方法 | |
Pedersen et al. | Lessons learned developing and using a machine learning model to automatically transcribe 2.3 million handwritten occupation codes | |
CN105279392A (zh) | 一种基于云平台的大数据分析装置 | |
TWI684950B (zh) | 物種數據解析方法、系統及電腦程式產品 | |
CN111913930A (zh) | 物种数据解析方法、系统及电脑程序产品 | |
CN110852376A (zh) | 用于识别生物种类的方法及系统 | |
CN115661834A (zh) | 一种多功能数据检索系统及方法 | |
CN116680422A (zh) | 一种多模态题库资源查重方法、系统、装置及存储介质 | |
CN116595207A (zh) | 一种相似商标检测模型的构建方法及相似商标检测方法 | |
CN111341404B (zh) | 一种基于ernie模型的电子病历数据组解析方法及系统 | |
CN114021716A (zh) | 一种模型训练的方法、系统及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20201110 |
|
WD01 | Invention patent application deemed withdrawn after publication |