CN102708114B - 通过相互连接的计算机网络进行实时在线搜索处理的方法 - Google Patents
通过相互连接的计算机网络进行实时在线搜索处理的方法 Download PDFInfo
- Publication number
- CN102708114B CN102708114B CN201210028555.8A CN201210028555A CN102708114B CN 102708114 B CN102708114 B CN 102708114B CN 201210028555 A CN201210028555 A CN 201210028555A CN 102708114 B CN102708114 B CN 102708114B
- Authority
- CN
- China
- Prior art keywords
- seller
- information
- price
- buyer
- page
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种通过相互连接的计算机网络进行实时在线搜索处理的方法。其中来自该相互连接的计算机网络的许多卖家站点的离线数据库信息被保存下来。该信息包括URL,搜索表格URL,域说明,以及卖家说明,而卖家说明中包含每个卖家站点中产品信息组织方式的通用化的规则。使用保存在离线数据库中的信息处理目标产品价格对比请求的参数,该价格对比请求从在线用户或购买者和/或本发明的系统接收。然后从多个卖家站点中的经识别的站点提取实时价格和产品信息,其中所提取的价格和产品信息以站点本机语言的形式出现;所提取的价格和产品信息显示给用户。
Description
本申请是分案申请,其原案申请的申请号为01819690.X,申请日为2001年9月27日,发明名称为“通过互联计算机网络的多语种电子数据源的在线智能信息比较代理器”。
计算机程序列表附录
请参照所提交的共计10页的计算机程序列表附录。包含在该附录中的材料一并结合于此作为参考。
技术领域
本发明总体上涉及万维网(worldwideweb)上的自动化任务,尤其涉及关于在线买家或用户的自动化任务,比如在万维网上通过一个单独的界面与多语种卖家进行互动或比较购物,以提高通讯效率,并且提供个性化的购物经验。
背景技术
自从20世纪90年代中期万维网产生以来,互联网的规模已扩大了上千倍。如今人们被“互联”了起来,并非以直接面对面的方式互动,而是通过虚拟的通讯渠道。这种新的技术革命从根本上改变了人们的生活方式。
和万维网并行发展的是“信息技术时代”,它带来了从产品信息到学术论文的各种令人目眩的在线信息资源。由于电子商务利用了互联网所给予的低成本和便利性,这些因素导致电子商务的规模成指数级增长。
在万维网上有数百万或更多的在线卖家。虽然当前购物比较或价格比较搜索引擎能够按照在线买家或用户的要求从不同的在线竞争者中检索到与所要求的产品和价格在某种程度上相关的搜索结果,但是该买家或者用户有可能面对无边无际的信息海洋。有时,该买家或者用户得到了一个“搜索失败”的网页面,原因是搜索引擎遗漏了现在互联网联接的(目前有245个)国家中其它国家中的在线多语种的卖家的站点,而这些国家又确实是在销售用户所要求的商品或服务。此外,虽然关于产品和卖家的信息在网上很容易得到,但是买家或者用户仍然徘徊于该购买过程的全部阶段。
互联网将当前电子商务的模式转变成真正的全球整体市场的潜力至今大部分未能实现,电子购物也没有实现自动化。网上购物远非那么简单、高效和有趣。对于搜寻在线买家所需要的产品和愿意出售这样产品和服务的商家来说,搜索引擎和集中目录服务是不够的。而且,通常的在线购物过程几乎都是人工完成的,为了得到他或她要搜索的东西,要求买家输入全部条件和关键词。因此,一个预期的买家就面对一个可畏的任务,他需要收集和理解关于产品和商家的信息,并对这些信息做出决定,最后输入购买和支付的有关信息。情况便是,过多的信息使该用户或买家感到不堪重负,而他们却没有这么多的时间和专门技能。
依照复杂的程度,眼下采用和实施了两种不太完美的办法以部分地实现在线商品目录价格比较过程的自动化,如下:
(1)非实时的方法
(2)实时硬编码封装器(hard-codedwrapper)的方法
非实时方法是最简单的执行价格比较代理的方法。其实施包括了人工收集网上所有必要的信息,然后为每一个搜索结果的项目写出各自的超文本链接标示语言的文件,以便该搜索结果得以可视地显示出。
以上所述的好处是显而易见的——容易实施且搜索迅速。尽管有这么多好处,但是仍然有三个主要的不尽人意的缺点。首先,由于价格比较是人工完成的,所以维护一个庞大的封装器资源库(wrapperrepository)变得非常地昂贵,尤其是当考虑到互联网的持续增长态势的因素时。其次,必须投入很大的力量来使价格和其它信息更新。最后,需要储存和协调所有以上信息的数据库的容量应当极大。
实时硬编码封装器的方法是非实时方法的一种替代。与非实时方法中直接地取得项目那种方式不同的是,实时方法试图将超文本链接标示语言页面概括为一个特定的格式。为了实现提取任务,则调用一个叫做pcwrapHLRT(程序简称)的定制封装器程序。图1提供了该程序相关部份的一个范例,该程序中有一个“while”循环。在这个范例中,在一个封装器创建后的运算法则是通过一对分隔符(定界符)把目标数据限制在一个超文本链接标示语言(HTML)的页面上。该pcwrapHRLT程序由于该站点表现出一个统一的格式规则而运行。产品项以粗体而价格以斜体的形式被呈现出来。pcwrapHRLT通过对超文本链接标示语言文件特殊的字符串{″<B>,″</B>,″<l>,″″</l>″}进行扫描而运行,由这些字符串来识别将被提取的文本片段。这些字串又被pcwrapHRLT程序分别认定为Ii,ri,lp和rp。符号lk(k∈{i,p})表示了该字符串划定了被提取属性左边的界限,而rk则标示右边的分隔符。其他可能被封装器提取的属性则是产品名称、图形、条件和状况等等。
当给出一个超文本链接标示语言页面时,pcwrapHLRT依次从大字标题行号开始扫描整个页面。通过在该页的非扫描部份搜索分隔符“<B>”,外循环对提取数进行检查是否有附加的型号和/或价格对。只要一个型号的开头被发现,内循环则被调用以提取一个恰当的页面子字符串。
很少有网站公布他们的格式规则。于是,一个使用pcwrapHLRT的信息收集系统的设计者就为每一种信息源手工建立这样一个封装器。遗憾的是,这一硬式编码的过程不仅单调,而且容易出错,原因是一个普通超文本链接标示语言页面就可能包含数千行的编码。而且,多数站点都会周期性地改变他们的格式规则,从而打乱封装器。
pcwrapHLRT另一个缺点是搜索速度不算快,理由是代理器不得不在收到一个来自用户的请求后联络该卖家站点。由于这种封装器是半自动的,所以额外的管理工作必须以人工分析超文本链接标示语言页面格式的方式来实施,以确定封装器。
发明内容
由于前述的这种普遍遇到的问题,基于一个新的互联网策略,作为对人工和半自动操作的替代的一种方法是自动处理-在线智能价格比较代理器,它能减轻在线买或卖(拍卖等等)目录的价格比较过程的负担,同时,它还能以一个互联网际友好的交互式代理器角色图像使用者界面(IACGUI)来提供一个较好的导航环境。当所谓的第四代全球总体市场框架-代理器中介的B-to-C、C-to-C、B-to-B的电子采购和拍卖以及G-to-B/C(政府对商家/消费者)这些模式使e商务(电子商务)和m商务(移动商务)变得更加“柔和”-亦即更普及时,这种方法将非常有用。因此,本发明的系统为消费者-商家的交易提供了一个较好的环境。
简而言之,在线智能价格比较代理器就是一种自动在线买卖助手,它对众多的全球在线多语种的商店快速搜索,然后针对每一商品寻找到成交的机会。它们也向在线买家或者使用者提供增值的(按照顾客等级)商业-网络(Business-Web)服务。这样的代理器具有很大的吸引力,理由是它们能够减轻用户在消费者购买行为模式中人工进行每一操作的单调性。
按照惯例,一个买家/用户通过前端的界面同在线服务的网络服务器进行通讯,该界面提供了一个供用户或者买家填报的用于录入待搜索的商品项目的表格。一旦买家或者用户呈交搜索请求,在线服务的网络服务器便查询它的数据库以找到相匹配的内容,然后将查询结果送到用户的网络浏览器。
在本发明中,在线目录价格比较过程中的用户代理器(在线智能价格比较代理器代替买家/用户(人)而动作)以待查的商品项目类别和关键词来进行搜索,并且,为了买家/用户的最大利益,该用户代理器同在万维网上的计算机网络相联的246个联网国家中的多语种网络服务器进行通讯。接着,该用户代理器将它发现的在线卖方地址分类排列,并通过网络浏览器向该在线用户(使用人)提交上一份搜索结果的摘要。
应用本发明的系统来使e商务(电子商务)所占的市场份额倍增,其好处是非常显著的。通讯的效率和效果可以大幅度增加,同时,无论对于在线卖家还是在线买家,可最大程度上节省时间和成本。最重要的是,该买家或者用户将会在全球范围内得到空前的、无数的信息来源和无数的商品来源,以及不可估量的商业机会。本发明的系统和方法也将会有助于消除时间和语言障碍、人口学上的疆界,真正使电子商务全球化。除此之外,该用户代理器的个性化、持续的运作、自动性这些特征还使它们得以很好地适应居间(mediate中介)买家/消费者的行为方式。据此,本发明将有助于使整个购买过程最优化并使现在的电子商务发生革命性的变革。
因此,本发明的一个目的是提供一种改进的在线卖家产品或服务的价格比较方法。
本发明的另一个目的是建立在线商店的卖家说明(vendordescription)。
本发明的另一个目的是收集包括商品样品和URL的数据,这些数据用于培训(training)。
本发明的另一个目的是在执行在线商店或卖家网址的搜寻之前重获培训数据。
本发明的另一个目的是利用从培训数据中得到的信息从在线卖家收集培训网页。
本发明的另一个目的是从培训数据和所收集的培训网页中产生卖家说明。
本发明的另一个目的是将产生的卖家说明储存在一个数据库中。
本发明的另一个目的是为系统管理员提供一个界面以便于其增添、修改和删除该系统支持的卖家。
本发明的另一个目的是为系统管理者提供一个界面以便于其查看卖家信息。
本发明的另一个目的是提供一个价格比较方法,借此一个顾客能主动进行价格比较。
本发明的另一个目的是把超文本链接标示语言解析为有用的数据。
本发明的另一个目的是对所要求的产品/服务加以分类和过滤。
本发明的另一个目的是提供一个单独的界面,以便对万维网或互联网上不同的在线多语种的卖家和不同区域的价格进行比较。
在本发明的系统中具体实施了一个第一用户代理器,以语意识别获知者代理器(SRLA)的模式工作。它用归纳获知方法来获悉卖家网址及其域说明的URL,从而实施一个实时自主封装归纳,并基于先前由系统管理员提供编辑的或准备的培训实例概括出关于卖家网址的组织规则。(在一个实施例中,SRLA联接至Microsoftbrandback-endSQL-compliant服务器或MicrosoftAccess数据库来产生一个卖家和产品的说明,每个在线商店仅一次。)该封装归纳通过实时地创建一个从存储在离线数据库中的卖家和产品说明中提取的实例的封装来完成。然后,该SRLA根据所提供的URL以这些实例自动地通过互联网实时地快速地抵达远程的卖家网址的主机以访问展示具体实例样品的网页,然后智能地依照域名或者产品信息填报一个相关的搜索表,并且虚拟地“按下回车键”,由此而向该网址提交一份搜索请求。对搜索指标做出响应的搜索结果页面既可能包含搜索成功的精确信息,也可能包含搜索失败的内容。这些结果页面,有着对具体卖家来说是唯一的产品和卖家说明(就该系统来说既有注册的也有未注册的),因此而被存储在由系统管理员所维护的离线数据库(比如一个SQL-compliant服务器或者MicrosoftAccess数据库)里的卖家说明之中。卖家的URL,卖家说明和其他信息,优选每日一次按时自动地更新升级。
本发明系统实施的第二用户代理器被称为语意识别买家代理器(SRBA)。当在万维网上同时访问不同的在线多语种卖家站点时,该SRBA利用先前被该语意识别获知者代理器所获悉的卖家说明来搜索一个匹配值。该SRBA智能地以在线用户或者买家提供的产品信息来填报一个卖家搜索表格,并且虚拟地“按下回车键”。卖家接着将搜索结果页面通过万维网返还给该SRBA,其方式是这样的:结果页面和其他卖家返还的结果页面几乎同时到达。(该语意识别买家代理器将这些返还的页面作为采样存储在一个单独的存储器或高速缓冲存储器位置以供其他SRBA在以后使用)该SRBA按照相应的卖家说明来分析这些返还的页面,从中提取相关的信息和数据,将价格和型号的数据分类,并通过网络浏览器向在线用户或者买家以格式化的摘要的形式在客户机上的屏幕显示这些页面。
根据本发明,提供了用于一个计算机执行的语意识别获知者代理器的方法,来执行一归纳获知。该方法包括重新取得针对一具体在线卖家的培训数据,这样便从互联的计算机网络产生相应的卖家说明。该方法包括收集培训网页,使用所提供的培训网页,使用所提供的存储于卖家列表中的培训数据。使用该培训数据以及该重新提取的培训页面,该方法包括一归纳获知方法,以便从自培训数据和重新提取的培训页面提取的信息中产生针对具体卖家的卖家说明。
本发明提供了一种方法,用于在一个离线数据库中存储被重获与/或被提取的卖家说明,这些卖家说明稍后将为语意识别买家代理器(SRBA)所用。
本发明提供了一种方法,用于对在线卖家的产品或服务的价格进行比较。该方法包括:一在线用户初始化对具体产品或服务的一个请求,然后一个语意识别买家代理器利用先前确定的卖家说明创建多个搜索查询参数。该方法包括传递若干请求给不同的在线卖家,优选同时传递,并且利用一个由该卖家说明构成的解析器(parser)从该在线卖家发还的结果页面中提取数据。该方法包括创建/调整由一个语意识别买家代理器以超文本链接标示语言格式所存储和所过滤的数据,目的是将这些数据呈现给在线买家/用户。
本发明提供了一种为了下述目的而被实施方法,即通过该语意识别买家代理器分析来自在线卖家所返回的页面以重获有用的数据。该方法还包括:从离线数据库重获卖家说明,分析从万维网上当前的246个联网国家中任一在线卖家返回的网页面,利用来自该返回的卖家说明的信息收集有用的数据。
在本发明的一个实施例中,只有当一个在线买家注册为临时会员或者长期会员之后,上述功能才能在该会员网页中实现。
本发明提供了一种方法,用以通过互联的计算机网络对所选择的各类型的信息进行实时在线搜索处理。该方法包括诸多步骤:为互联的计算机网络中大量的站点组接站点说明,对于这些站点中的每一个包括:(a)该站点的URL;该站点的URL搜索表;(b)该站点上所选择的各种类型的信息如何组织的通用性规则;(c)从与所选择的各类型的信息相对应的站点中重新获得的采样数据;和(d)在该站点发现的域名说明;从一个在线用户处接收特定类型的信息的请求;根据站点说明识别出可能含有该特定类型的信息的站点;为每一个该识别出的站点,利用该站点说明创建该特定类型的信息的搜索请求;将所创建的搜索请求提交给经过识别的站点;从该识别的站点接收搜索结果,并且在从该接收的搜索结果中找到准确的匹配内容之后,以该站点自身的语言提取与该特定类型的信息相对应的信息,并且向该用户显示所提取的信息。
更一般地说,本发明涉及一种在该互联计算机网络上实时在线搜索处理的方法。该方法包括如下步骤:(a)在一个离线数据库中,为多个卖家站点保存来自互联计算机网络的信息;该信息包括URL、搜索表格URL、域说明和卖家说明,其中该卖家说明包括诸如关于该卖家站点中每一个站点的产品信息是如何组织的这样的概括性规则;(b)当从一个在线用户和/或语意识别买家代理器接收到价格对比请求时,使用保存在离线数据库中的信息处理目标产品的价格对比请求的参数;(c)从多个卖家站点中的经识别的站点中提取实时价格和产品信息,其中所提取的价格和产品信息以站点本机(原有)语言的形式出现;和(d)向该用户显示所提取的价格和产品信息。
附图说明
图1是现有的实时硬编码封装方法中从一卖家网站重获信息的的pcwrapHLRT程序的相关部分的一个范例。
图2是一个通用性图表,它描述了以万维网或者互联网的方式在一个本发明的较佳实施例、本发明的用户代理器、一个用户或者买家和在线卖家之间的交互作用。
图3是该语意识别获知者代理器(SRLA)利用培训数据以产生一个卖家说明的概括的简化流程图100。
图4是根据本发明的能包含在一个卖家说明中的各种信息的一个说明。
图5是根据本发明提供的一个数据实例,它可以居于该卖家说明的字段中。
图6是一个流程图200,该图就该语意识别获知者代理器(SRLA)如何进行归纳获知并产生一个通用性的跨网页的有效的卖家说明提供了一个概貌。
图7提供了一个网站页面的排列的部分的范例,其形式与向浏览网页的上网人所显示的相同,并包括用于生成或者定义这种排列的相应的超文本链接标示语言代码。
图8提供了标签的范例,按照本发明,此标签用于确定一培训网页中的价格信息和项目明细的位置。
图9是对在本发明的一个实施例的培训过程中使用的标签所代表的内容的通用性的说明。
图10A和10B提供了在图5到图9中描述的培训过程的例子中的可能的备用分隔符示例。
图11是一个网页拷屏图片的简要说明,根据本发明,该拷屏图片采用导航规则,带有一个可检索的目录和产品域名字段的网络,用以容易地访问具体所要求的数据库。
图12提供了一个网页的屏幕抓图的简要说明,阐明对所有项目采用统一规则,所有项目以一种简单的一致的格式排布。在该页面的框架中包含了所查询信息的搜索结果,这些搜索结果都得以统一地格式化。
图13是该同一屏幕抓图的简要说明,如图12所示,该图阐明了垂直分离规则的应用,搜索结果显示被定位在头尾之间的中央部分所排列的产品目录。
图14是依照本发明的语意识别获知者代理器的运作过程的一个概括性说明。
图15A是一个屏幕抓图,显示的是在卖家网站“www.800.com”上关键词“电子”的搜索结果,在这个网站上,每一种产品都被简单的介绍所概括,诸如它的特征和功能(所列图框的左边和中部),还有相关的“列表价格”和“您的出价”信息,这些信息都显示在所列图框的右侧,本发明的该语意识别获知者代理器的智能价格识别程序能够在卖家说明的获知过程中加以区别。
图15B是本发明的语意识别买家代理器的运作的概括性说明,即卖家说明的获知过程之后的某一时刻访问卖家站点“www.800.com”的运作过程,正如图14所示的卖家标示设计随后变成了一个整体,和图15B展示的一样。
图15C是一个流程图300,它概括地解释了图2中的语意识别买家代理器(SRBA)20与一个卖家说明如何进行交互作用,以便针对一个乃至全部所搜寻到的在线多语种卖家,回应在线用户/买家的价格比较请求。
图16是一个扮演交互式代理器角色的获知者界面屏幕的范例,它可用于获取培训信息以便在本发明中应用。
图17是一个所提供的范例,其中培训信息已经被提交到该卖家网站“1cache.com”。
图18是该获知者界面屏幕的一个示意图,它可以用于显示卖家说明中已经获知的信息。
图19是该获知者界面的一个屏幕抓图,其中标注了“卖家信息”标签,通过此标签,卖家信息就能被输入和检索了。
图20提供了一个获知者界面的屏幕抓图,用以显示先前输入的对于一具体卖家的培训范例。
图21是该获知者界面的一个屏幕抓图,当打开一个叫“卖家说明”的文件时,它作为回应被显示。
图22说明了按照本发明对获知选项进行选择,即,“获取一个”选项被显示选中,已经被填充的该卖家的名称是“1cache.com”。
图23展示的是对卖家“1cache.com”所获取的结果。
图24解释了以信息提取的一个简单模式限定的解决方案所公式化的封装归纳问题。
图25提供了一个“execHLRT”的伪码.
图26是一个以伪码编码的简单方法的模块,用以获取头尾分隔符。
图27A和图27B为该learnHLRT程序提供了一个详细表和子例程。
图28解释了按照本发明的一个实施例,买家或者用户如何与服务器进行交流,以便在该服务器机器上通过一个ASP(活动服务器页面)文件(NextGen.asp)运行该内处理DLL文件(NextGen.dll)。
图29说明了一种方式,通过该方式语意识别买家代理器使该用户和该数据库服务器之间的通讯更加便利。
图30提供了一个详细的流程图,按照本发明的一个实施例,该图阐明了如何建立该SQLSever数据库。
图31说明了该语意识别买家代理器是如何将检索表虚拟地传递给一个在线卖家网站的。
图32是主菜单屏幕的一个简化示意图,表示一个用于本发明的GUI或者交互式代理器角色购买者/买家界面(IACS/BI)。应注意,在该主菜单屏幕的右上角为该用户提供了产品的“信道”(即种类)选择。屏幕的左边还提供了的是快速检索功能。在它下面的右边,设计了一个框,其中有一个自键入的活动部分指示在线用户如何使用快速搜索选项。左边的屏幕面板也提供了一套对话框,以便临时成员试用和永久会员登录。(请注意本发明的多数入口功能都被停用,直到用户身份被鉴别为有效)在左下角,提供了一套连接到本发明入口已注册在线卖家的方法,在右侧,可以观察到一个标注着“反馈”的大信息框,这用于在线用户通过电子邮件向邮件服务器输入注释信息,最好是使用微软公司的OutlookExpress品牌的EMAIL服务器。
图33简单说明了一个用于本发明的GUI或者购买者/买家界面屏幕,其中,公司被显示出以回应政府对商家的文本图标,此文本图标已经被在线买家/用户在先前的屏幕(未标明)中所点击。尽管如此,应该注意到,恰恰是这个屏幕窗口不能发挥作用,理由是当前这些公司或者所谓的政府对商家的电子商务服务或者平台卖家为成员特许权严格限制了这些通往他们的网站数据库的通路,方法是在整个闭路计算机网络化的环境中插入一个验证安全接口。
图34简要说明了一个用于本发明的GUI或者购买者/买家界面的屏幕显示,其中该用户于图33屏幕视窗里已点击“高级搜索”选项之后,在所提供的若干选择中也提供了关于用户所选择公司的细节。请注意到,在这个屏幕视窗中,框架中的横标位于五种类型的域的正下方,可以看见以大写字母标注的一条信息“高级代理运行中”。除此之外,该屏幕视窗的底部,提供了一个用户对话框,此框可填写,以便利用语意识别买家代理器的功能性执行搜索,这种功能性由本发明提供。此外,尽管如此,应该注意到,这个屏幕窗口不能发挥作用,理由是当前这个公司或者所谓的政府对商家的电子商务服务或者平台卖家为成员特许权严格限制了这些通往其网站数据库的通路,方法是在整个闭路计算机网络化的环境中插入一个验证安全界面。
图35简单说明了一个用于本发明的GUI或者购买者/买家界面的屏幕,其中,公司被显示出以回应商家对商家的文本图标,此文本图标已经被在线买家或者用户在先前的屏幕(未标明)中所点击。尽管如此,应该注意到,这个屏幕窗口不能发挥作用,理由是当前这些公司或者所谓的商家对商家的电子商务服务或者平台卖家为成员特许权严格限制了这些通往他们的网站数据库的通路,方法是在整个闭路计算机网络化的环境中插入一个验证安全界面。
图36简单说明了一个用于本发明的GUI或者购买者/买家界面的屏幕,其中,提供了在该用户于图35的屏幕视窗点击“高级搜索”选项之后,关于用户从提供的选择中所选定公司的细节。
图37简单说明了一个用于本发明的GUI或者购买者/买家界面的屏幕,其中,在该屏幕上显示了所选项目及其说明,以便回应选择域A标签的用户。
图38简单说明了一个用于本发明的GUI或者购买者/买家界面的屏幕显示,其中,所列出的卖家在A域中出售各项商品,回应在图37屏幕视窗中点击“高级搜索”选项的用户。
图39简单说明了一个用于本发明的GUI或者购买者/买家界面的屏幕显示,其中,提供了利用本发明语意识别买家代理器的特点进行搜索的结果的细节。购物者/买家界面对用户进行回应,该用户通过搜索参数界面提供一个搜索请求,该界面显示于图38的屏幕视窗底部。
具体实施方式
参见图2,提供了一个概括性的图表,用以解释通过万维网/互联网16,在本发明在优选实施例10,用户/买家12,和在线卖家14之间的交互作用。
在本发明的优选实施例10中,提供了一个获知者代理器18(也可以称作语意识别获知者代理器SRLA)和一个购物者代理器20(也可以称之为语意识别买家代理器SRBA)。用一个服务器22向离线数据库24提供通路,此数据库中存储着全球多语种卖家信息。系统管理员26为所选择的卖家网站准备/编辑培训数据,并且通过服务器22将它们存储在离线数据库24的“卖家列表”27中。接着,该系统管理员26使用该培训数据,利用语意识别获知者代理器18从培训页面来进行“归纳获知”,此培训页面是通过万维网16从卖家站点重获而来的。“归纳获知”生成卖家说明,表现形式为卖家说明(列表)28,该列表储存在离线数据库24中。
一个用户/买家12可以利用本发明的优选实施例来重获关于指定主题的指定信息,方法是利用语意识别买家代理器20(SRBA)。SRBA20通过利用包含在先前被获知的卖家说明28中的信息,来处理一个自用户/买家12的请求。卖家说明中的信息24则允许语意识别买家代理器20立即在很多卖家站点充分地同时地通过万维网16准备并发送搜索命令。卖家说明也允许语意识别买家代理器20立即处理收到的搜索结果,并且将从全部卖家站点搜索到的结果送到买家/用户12处,这些搜索结果已经被过滤掉外部的和不相关的信息。
现在参考图3,流程图100说明了本发明的一个实施例的语意识别获知者代理器(SRLA)18的操作。在本发明的优选实施例中,语意识别获知者代理器18以运行在个人电脑或者服务器上的计算机程序的方式实施。在步骤110中,语意识别获知者代理器18从“卖家列表”27重获先前定义的或者及早准备的培训数据,而此列表存储的地方是培训数据库24。培训数据库24优选处于离线状态。
该培训数据包括属于在线卖家的一组数据,从这组数据中,信息将被获悉。这些数据可能包含URL、域说明、产品样品、属性和其他域具体的信息,如下面右列所示:
根据本发明,图4提供了本发明的培训和“获知”数据的名称标签的类型和说明的一个范例。图5是所获知的实际“数据元素”的表格的说明性范例,此数据元素产生于该卖方说明获知的过程中,如图4所示,并存储于离线数据库中的卖家说明中,由系统管理员26维护。
该“培训”数据优选存储在一个SQL-compliant或者MicrosoftAccess数据库中。于是,这就增加了不同的卖家对数据容器选择的余地。通常,该培训数据独立于该产品域名、所写入的字符和在线卖家的呈现风格。培训数据中的该URL路径是一个例外,它被要求唯一地确定不同的卖家。
回到图3,在步骤120,强制性地规定了一个检查,了解语意识别获知者代理器18是否需要认识更多的卖家。如果有未决的卖家被认识,语意识别获知者代理器18将进行步骤130;否则,获知对话将终止。在步骤130中,通过使用预先定义的培训数据,语意识别获知者代理器18智能地访问指定的在线卖家,该预先定义的培训数据与之符合。对于每一个在该培训数据中指定的具体产品,语意识别获知者代理器18通过搜寻该卖家站点的特征搜寻该具体产品。通常,语意识别获知者代理器18重获培训数据的若干页面,该培训数据将要从本发明系统获悉的、或者将要从系统管理员手工输入中获悉,这样的页面被称作“培训页面”,它们稍后将用于执行归纳法获知的过程。在该优选实施例中,这个阶段中也包含控制数据(亦即在该卖家站点导致错误页面的培训数据)。
接着,在步骤140中,计算机程序在由语意识别获知者代理器18获得的培训页面上执行一个归纳获知过程。归纳获知的目的是得到一个该站点的普通说明,并弄清它是如何组织该产品数据并按照一定的逻辑向潜在的在线客户呈递该产品的数据。此获知的产品被叫做“卖家说明”28-这一阶段将按照图6被进一步说明和解释。
然后,在步骤150中,语意识别获知者代理器18储存该被获知的结果,优选储存在SQL-compliant或者MicrosoftAccess数据库24中。(储存在离线数据库24的卖家信息或者“卖家说明”稍后将为在线语意识别买家代理器20所使用)。在储存步骤150完成后,语意识别获知者代理器18回到步骤120以判断是否有更多的卖家要获知,如果有,130到150的步骤被重复。否则,获知过程终结。
卖家说明获知过程
现在参考图7,卖家说明获知过程将被进一步详细地说明,采用一种信息提取的简单模式和一个简化的培训页面实施例。图7的左侧显示该型号和价格信息的排列,正如其向一个浏览卖家站点的潜在客户所示的。图7的右侧指示了产生该数据排列的超文本链接标示语言(HTML)编码。例如,位于的右侧前三行(3)确认该码为超文本链接标示语言,并提供了该列的名称-“简单产品目录”,指示出这个要被显示的信息的开头。第四行(4)提供了表格-“MD价格”的标题的文本内容。第六行(6)和第七行(7)则分别按照“型号”和“价格(美元)”的列名提供文本内容。第8行到第11行(8-11)则提供型号和价格信息。其余行确定下列信息:表格末尾、表格的列,和该产品目录整体的末尾。
首先,封装功能为所给予的培训页面产生一套标签。一个标签用于确认在培训页面的培训产品信息的位置。为了说明图7所示的简单产品培训页面,图8描述了由语意识别获知者代理器18所产生的一套标签。图8中的标签的指示出,图7的简单产品目录页面包含四个(4)“元组”,每一个元组又包括一个“项目”值和一个“价格”值。每一个值由一对整数来代表。
考虑第一对数值,<174,180>,这些整数指明第一元组的属性就是位于174和180之间的所述子字符串,即字符串‘HM381MD’位于位置174和位置180之间。正如这个范例中所应用的那样,位置的意思即从指定的起始点算起的字符的数量,比如从一个页面的开头,或者是一个页面“头”的末尾。文本字符之间的空间按照一个字符的位置来记数。检查图7,可以看见,字串“HM381MD”中的字母“H”从首行中符号“<”起出现于174字符位置,该字串中的“D”出现于字符位置180。同样地,最后一个“元组”或者整数对<356,361>表明,最后一个价格属性出现于字符位置356和361之间,并且确认字串“399.95.”。可以理解。在这个范例中,虽然字符位置用于确认“标签”,但是其他标准也可以用于根据本发明的构思进行使用。其他标准可以以本发明方法应用的方式来使用。例如,再次检查图7,应当考虑到,图2的语意识别获知者代理器18向型号和“你的价格”为四个电子产品自动地分派数值-尽管它把它们表现为如下公式中所呈现的样子:
于是,如果“b”代表开始,“e”代表结束,那么确认第二元组位置的数组就包含了字串b_,i,亦即型号“M,”开头的数值,反之,字串e_,i就是型号“0.”结尾的数值。类似地,就可以理解本发明使标注自动化得以实施,方法是启用一个模块化试探性的搜索,而这种搜索是基于标准相关数据模型的。本发明包括一个项目识别器和一个智能价格识别器,其中,一个元组反复地作为两个字串中的一个向量<b2,i,b2,p>。字串b_,i是项目属性中的值,字串b_,p是价格属性中的值。因此,属性代表列,而元组代表行。在“b”和,””之间的该数字的值“b2,i″意味着第二行的一个位置-位置数值的计算(即标注),由此而在卖家说明生效的可获知的封装归纳的调用期间,得以实时、自动、同步运行地执行,同时也确认给整个Ppc(产品目录页面-一个叫“P”的页面是包含所要求信息的网页)贴上标签而无论依该卖家站点格式的网页(在此范例中,即www.800.com)是以何种语言的本机(native)字符串,或者以自然语言、或者以HTML,XML,cXML,Java等等编码的。
培训页面的内容标签的更通常地如图9所示。在首列中,被贴以标签的信息得以确认,在此实施例中,产品和价格为待搜索的目标信息。在第二列中,该“元组”的若干入口对应该“标签”-有如:<PRODUCTLEFTDELIMITER(产品左分隔符),PRODUCTRIGHTDELIMITER(产品右分隔符)>和<PRICELEFTDELIMITER(价格左分隔符),PRICERIGHTDELIMITER(价格右分隔符)>。
系统管理器执行获知系统一次后,在编辑一组可能的备用分隔符以便与图10A和图10B中可能的这组备用分隔符的编辑同步的过程中,它就从离线数据库中的卖家列表中重获培训页面。接着,它利用另外一组培训页面同步地自动地(标注)执行实时、同步的计算,且包括位置值,如同上面所述的实施例一样。两个备用组的交集产生一个有效的备用集合,然后语意识别获知者代理器18就从该有效备用集合中选择一个作为卖家说明。
现在参考图2,流程图200说明了本发明语意识别获知者代理器18的一个实施例。此方法使用了3个环境性规则,以此规则来支配购物网站提供的产品详情(说明)的编排,而该网站允许信息提取独立于该域地进行下去。该规则性包括带有可搜索索引的导航规则、统一规则和垂直分离规则。
对于导航规则,在线商店或者卖家站点被指派向消费者和商业买家询问提供服务。于是,几乎所有在线卖家提供了一个可搜索的索引以利于访问具体的所指定的数据库。使用卖家站点的可搜索格式使语意识别获知者代理器18得以归纳出多语种主页及网页的格式性的形式。图11是一个简化图,说明一个带有可搜索索引和产品域字段的主页。
对于统一规则,虽然就在线卖家或者商店的产品详情编目格式来说,相差很大,但是任何给定的在线卖家都会按照简单而一致的格式来排布所有项目说明。图12是一个网页屏幕图像简化图,它说明了统一格式化搜索结果的设计形式。于是,可以清楚的看出,每一个被列出的搜索结果都以“型号(MODELNUMBER)”字串为开头,其下则提供“产品说明(PRODUCTDESCRIPTION)”。除此之外,“价格1”和“价格2”位于“产品说明”的右侧。
图13提供了一个同样的搜索结果屏幕图像的简化图,其中说明了采用垂直分隔规则以显示产品目录。这个垂直格式可分为文档的开头、内容和末尾几种。
作为互联网最初设计思想的信息基础机构-网站建筑学、在线卖家产品说明以及技术手法的表现都是以人类的使用为目的而构建的。这在询问机制和具体适用于人类直接操作的输出标准的应用中是显而易见的。在线卖家遵守这些规则,原因在于这些规则使针对买家和购物人的在线销售得以实现。虽然不敢说保证使在线商店让人们得以便利地进行网络航行的这么一种工具将使人们感到亲切适用、以便让一种智能软件代理器来掌握,但是多语种电子数据源的在线智能信息比较-亦即本发明的该系统,就是本着充分利用这些规则而设计的。
依照本发明,封装的构建是通过一个归纳获知过程来完成的。该方法是通过对卖家网页的样页进行推理来获知一个卖家封装的。在本发明的方法基理中,“实例”(instance)对应卖家页面,一个页面的标签对应其相关的内容,那么假定则对应该构建的封装。
除此之外,按照本发明,结合了可有效获知的封装类,比如HLRT封装类。
而且,为了确保本方法得以很好地运用,当培训数据显示出很高的干扰时,采用了耐干扰技术。比如,在图15A中,针对www.800.com的屏幕抓图范例,一个智能价格识别器就可以区分“列表价格”和“你的出价”。该被识别的对象接着就被确认来标注整个页面。考虑到一个识别器用于产品项目,另一个用于价格,确认的结果便产生了一个标注方式,以此方式标注包括这类属性对的页面。
事实上,卖家总是想通过使用统一的外观来为所有类型的产品创造一种一致的感觉。举个例子说,一个卖家以同DVD产品一样的格式提供了一种MD产品信息。通过利用该规则,每一种产品都以同样的格式得以大致的说明。
图2中的语意识别获知者代理器18仅仅从一个样本的具体的域获知了一个封装,并且试图将此域来适用于所有其他域(所有其他产品目录都有完全不同的存在项目),这些域是在万维网上245个联网国家的所有其余网站上,以一致的格式进行组织和在线分类的。所以,本发明图2中该语意识别获知者代理器18要维护一个完全的更新全球产品数据库的命名法,同时既不在一个适应结构化查询语言的数据库模块上进行编码,又不用向微软Access数据库在每一个域名中人工输入每一种产品,这样做是可行的。
继续讨论图6,在步骤210中,语意识别获知者代理器18产生了一整套标签来表现培训页面的内容。换句话说,标注位置值的方法基理是要为该培训页面的培训产品确认信息的位置。而且,图2中的语意识别获知者代理器18自动地实时地在运行中产生标签,此标签包含了位置值,如下:
为了进一步说明,请看图8右列。
步骤220中,语意识别获知者代理器18在重获的页面上利用相关的标签输出一整套可能的备用“卖家说明”来执行归纳获知。由于这些备用内容是通过具体的培训数据从具体的培训页面产生的,所以这些备用内容对这些页面不可能无效。尽管如此,如果这些备用内容在卖家整个网站是有效的,那么一个跨页面确认(有效化)将被执行以导出通用性的卖家说明,而此说明在整个网站都将是有效的。
在步骤240中,一个卖家说明确认器(VDV)针对另外一组培训页面,验证确认一个可能的备用卖家说明(在图3步骤130中重获的)。如果一个卖家说明令人满意,该获知过程将会停止,如步骤250,否则验证过程将利用其余的备用内容和通过步骤230、240和250进行循环,继续从若干卖家说明中进行选择。卖家说明“满意”的一个标准是,每一个得以连续分析的培训页面的备用内容数量和字符和前一个的培训页面相同。如果一个连续分析培训页面有不同数量的备用内容,那么将分析另一个培训页面。
图10A和图10B是卖家说明备用内容的范例,提供了商品项目说明的左右分隔符、价格信息以及一个培训页面的开头(头部)和结尾(尾部)。图5提供了一个“卖家说明”的范例,它包括了为一个范例页面开头、结尾、项目和价格信息所确认的分隔符。
用于一个具体卖家的培训数据优选由该系统管理员26汇编。正如将进一步详细说明的,为了向本发明之系统添加一个具体的卖家,相应培训范例的卖家名称、卖家URL、所呈递表格的URL、域数据都被提供和存储在离线数据库24中,该数据库可以是MicrosoftAccess数据库。该卖家的名称将是记录的首要的关键内容。人工封装输入作为一个选择也可以被提供。为了向培训范例提供一个精确的数据组,准备培训范例数据的系统管理员或者其他个人在网页URL地址、域名设置方面要知识渊博、对用于任何正在处理的多语种卖家网站的本机语言要知识渊博、并且能以获知作为目的而确定信息类型就显得很重要,而这些数据组将反过来极大地提高由语意识别获知者代理器18在准备实时、自动地和在运行中产生卖家说明时获知的卖家信息的精度和效率。这种人无须懂得太多编码。
一旦一个卖家信息被提供,管理员26就可以对每一个卖家运行语意识别获知者代理器程序。管理员对一个卖家运行语意识别获知者代理器18一次之后,那么在运行任何要求的选项中,如图16到23,他或者她就通过获知程序随着交互式代理角色获知者界面(IACLIs)屏幕图像一步一步地进行网络导航。最后,作为结果的自经培训的返还页面重获的“卖家说明”结果将被存储于离线数据库24中,该数据库可以是例如MicrosoftAccess数据库。要删除/消除一个具体的卖家的话,管理员可以直接地从“卖家列表”或者“卖家说明列表”中删除记录。要修改/编辑一个具体的卖家,系统管理员可以从数据库中的“卖家列表”或者“卖家说明列表”中修改记录。
简言之,本发明的语意识别获知者代理器18生成了一个卖家说明,对一个具体卖家来说是唯一的。卖家说明就是该套概括性规则,这套规则指导一个卖家如何以一个具体的格式组织它的产品信息。所以,对本发明封装构架系统输入的数据,本质上是对封装进行获知的一个行为样本。在这个模式下,封装构架变成了重建一个基于它的行为样本的建立封装的过程。
语意识别获知者代理器(SRLA)18的方法论在图14中通过一个简化的范例被总结。步骤1中,两条信息被馈送到该系统以便进行该封装归纳:(1)该卖家网站的URL(如:http://www.800.com),和(2)域说明,它包含了一些具体域的培训范例,例如,一个域名描述可能是“电子产品”,和一个叫做“SonyHM381MD”的域名记录,此即用于填报卖家搜索表格的型号。在步骤2和3中,语意识别获知者代理器18利用该培训范例的URL地址和域名/型号自动从互联网到该卖家网站。对具体的范例,该获知者代理器按照步骤1中提供的URL地址去到www.800.com网页。然后它将在相关的搜索表格中填报必要的产品信息(例如域说明-“电子产品”和“HM381MD”)。最后,它将“呈递”搜索表格以请求一次搜索并等待回应。
关于步骤4,一个结果页面按照该搜索标准被发还。该结果可能是一个成功地带着相关产品说明的结果页面,也可能是一个失败页面。可以注意到,被发还页面中重要的内容是超文本链接标示语言编码、项目说明、项目价格以及关于超文本链接标示语言代码的信息位置。
在步骤5和6中,搜索结果页面通过互联网被发还到获知者代理器18以便进行分析。在步骤7中,该被执行的分析被叫做“封装归纳”,其中该页面被概括为一整套编排和格式的规则,该规则为卖家所遵循并依此以一个合理的方式呈递它的产品说明。以这些规则,在本发明语意识别买家代理器运作过程中,当一个用户/购买者正在从该卖家站点上同一域中搜索一些产品信息时,买家代理器20可以从同一的卖家提取产品信息。
可以理解的是,按照本发明,语意识别获知者代理器的程序将被启动以回应每一个卖家,卖家说明正是从它被要求的。由于本发明使用的信息分隔符方法,卖家说明可以从以任何语言的任何卖家站点得到-简单地说,虽然呈交给用户的语言可以是具体本机字符串的形式,针对被要求的信息,能被确认为分隔符的基础性编码保持不变,而不管该语言的本机字符串是什么形式。换句话说,卖家说明的信息将从一个使用的本机语言的卖家站点处得到。没有必要将本机语言翻译为一种标准语言。而且,因为用于每一个卖家站点的经确认的备用分隔符不是以用于该站点的编程语言的基础编码所编,所以依次搜寻不需要待搜索站点所使用的各种不同的编程语言就能完成。这就允许语意识别买家代理器20在多语种和多重域(产品目录)基础上进行搜索,并且与任何编程语言无关。
参见图15C,流程图300说明了本发明语意识别买家代理器20的一个实施例。在步骤310中,买家代理器20从图2中的一个用户/买家12接受一个请求,该用户/买家希望对一个产品的价格进行比较。在步骤310中,买家代理器20也最好以一个ActiveX组件建立与买家/用户12连接以便通讯。用户12必须提供至少一个参数,此参数可以包含,例如,目标产品的名称、所要求价格的范围、目标在线卖家或者分类标准。在步骤312进行检查,查看在内存中或者高速缓冲存储器中是否有任何“采样数(hits)”,该内存或缓存包含经确认的卖家站点中所要求的信息;如果是,买家代理器将到步骤370以便将所提取的目标信息进行分类。买家代理器接着进行到步骤380,以从超文本链接标示语言格式的目标信息中产生结果页面,接着在步骤390中,买家代理器将把结果页面显示给在线购买人/使用人。
如果在步骤312没有发现任何采样数,步骤320将激活购买方代理器20,使用输入参数从离线数据库24提取卖家说明。这些“卖家说明”是语意识别获知者代理器18在获知卖家说明信息的过程中确定的。在步骤330,购买者代理20器将编制一个新的用户请求来访问“卖家说明列表”中确认的不同的在线卖家。所编制的新的用户请求将基于用户给定的参数和卖家说明中的数据。如果向N个在线卖家发出请求(比如产品型号请求),那么语意识别买家代理器20就编制N个新请求。
语意识别买家代理器20使用卖家说明从卖家站点实时获得价格信息。购买者代理器20使用卖家的URL和卖家的名字访问卖家站点,该卖家的URL和卖家的名字包括在构成卖家说明的信息中。在卖家说明中还包括卖家的搜索表格URL。在步骤340,在访问到卖家站点之后,语意识别买家代理器20基于用户的新请求“虚拟”填写卖家搜索表格,并“虚拟”按下回车键来发送它。对每个确认的在线卖家都要进行这项工作。
如上所述,存放在离线数据库24中的卖家说明包括一个字段,该字段提供卖家搜索表格URL的信息,比如“http://www.onlineshop.com/search.asp?item=.”。该语意识别买家代理器20使用用户输入参数和搜索表格URL来为每个识别的在线卖家生成新HTTP请求。比如,如果用户需要购买一个“硬盘”,该语意识别买家代理器20生成的新请求如下:
“http://www.onlineshop.com/search.asp?item=harddisk,”
语意识别买家代理器20将把这个HTTP请求发送给在线卖家,就好象用户自己直接发送请求一样。如果有N个识别的卖家,那么语意识别买家代理器20将启动N个线程为每个识别的卖家填写搜索表格。语意识别买家代理器20优选并行地处理每个在线卖家的搜索表索引,填好后发送搜索请求。
在步骤350,语意识别买家代理器20将在特定的时间或用户定义的时间内等待来自在线卖家的响应。如果超时,语意识别买家代理器20转到步骤370;否则进到步骤358和360进一步处理所接收的搜索结果数据。
在等待超时时间内,语意识别买家代理器20收集搜索来自不同在线卖家的对请求的响应。在步骤358,语意识别买家代理器20接收来自在线卖家搜索结果响应,并将其存放到服务器22的缓存或内存中。在步骤360,感兴趣的数据被从接收的响应中提取。语意识别买家代理器20提取所需数据,使用存放在卖家说明28或离线数据库24中的卖家说明信息。例如,该卖家说明包括识别左边和右边封装器的代码的字段。首先,语意识别买家代理器(SRBA)20将使用左边封装器信息来定位响应页面有效数据的开始位置。然后,在目标数据的提取位置(由卖家说明列表信息确定)的数据的将被提取和存储到内存。(注意,卖家说明中的信息是语意识别获知者代理器18在图3和图6的获知期间所获得的)。重复提取目标信息直到该页面末尾。
在提取过程中,产品说明和产品价格将被提取。应该理解语意识别获知者代理器18定义的卖家说明信息是域独立的和多语言相关的。比如,假设在线用户或购买者的平台使用Windows98操作系统,运行语言版本B(或其平台优选是运行Windows2000英文专业版和/或其平台上安装了个人WEB服务器的“B”版本),MicrosoftInternetExplorer将在用户登录到本发明的入口处时提示用户下载“B”语言显示软件。在线购买者或用户“A”以“B”语言的本机字符输入作为输入到本发明入口处提供的文本框中的关键字的产品型号后,图2中的语意识别买家代理器20将使用预先描述的样本数据(样本数据是在实时封装器诱导获知之后提取的卖家说明)执行数据提取,该样本数据包含以语言“B”撰写的产品型号字符串。这些卖家说明存放在离线数据库24(最好是MicrosoftAccess数据库)有关卖家说明列表的预先定义的数据结构中。数据提取包括同时搜索“采样数”---其包含价格、说明、与前面的搜索结果相关产品信息----驻留在服务器22的内存或缓存中,使用产品型号的“B”语言的本机字符串,该字符串由用户输入,如图15C,步骤312。因为“B”语言字符串是特定的本机语言,所以对找到的任何“采样数”都要到确认的卖家站点,该站点使用本机语言“B”,并有用“B”语言写的字符串。
再来看图14的步骤7,在获知过程期间,图2中的语意识别获知者代理器18从在线卖家获知封装之后,卖家说明存放在数据库24(优选是MicrosoftAccess数据库)或数据库服务器22(优选是MicrosoftSQL-complaint数据库服务器)的卖家说明列表中。因为对语意识别买家代理器而言,每次根据在线购买者的请求提取卖家说明数据是效率很差的,所以当语意识别买家代理器20第一次请求搜索-匹配-提取期望的集合时,最好从离线数据库24或服务器22中提取卖家说明。此后,卖家说明将存放在内存或缓存中以便在今后的其他请求中即时提取和使用,其他请求来自该语意识别买家代理器,用于同一或新的在线用户。
在内存或缓存中的卖家说明优选每天自动更新一次。
换言之,语意识别买家代理器20能够使用在卖家说明中的数据根据不同的域和不同的语言来定位目标数据。这是因为,对某个特定的卖家而言,尽管语言可能变化,但是对应目标信息的底层代码不会改变。由于三个“格式化规范”主导大部分卖家站点,比如B-to-C,C-to-B,C-to-C在线仓库等,卖家站点的不同域将一致的使用同样的格式和底层代码来提供目标信息,比如项目说明和价格。
因此,对每个返回的搜索响应,语意识别买家代理器20将利用卖家说明执行数据提取。如果时间超出,则语意识别买家代理器20将跳转到步骤370,图15C。在步骤370,语意识别买家代理器20对从不同在线卖家所提取的数据按照用户定义的分类标准分类。如果用户没有定义分类标准,缺省的将是产品的价格。另外,分类标准可以是识别找到的最好的价格,并只把有含有最好价格的卖家信息提供给用户/购买者(当然,也可以使用其它排序规则)。
排序完成之后,语意识别买家代理器20将到380。在步骤380,语意识别买家代理器20基于来自步骤370的经过滤和分类的数据生成HTML页面。在步骤390,语意识别买家代理器20响应用户请求,使用前面建立的ActiveX组件,将所生成的HTML页面作为“结果”页面提供给用户。
如果在步骤350没有超时,语意识别买家代理器20将跳转到步骤358。在步骤358,语意识别买家代理器20将所查询的结果页面数据存储到内存或缓存,便于立即响应同一用户/购买者进一步的新请求或新用户/购买者的请求。在步骤358之后,语意识别买家代理器20将跳转到步骤360,其中它从所查询的结果页面提取目标信息,在步骤370对结果分类,并根据用户定义的分类标对从不同在线卖家所重获的提取的数据分类,然后在步骤380根据步骤370所过滤和分类的数据生成HTML页面,并最后在步骤390使用以前建立的ActiveX组件,响应用户/购买者。
语意识别买家代理器20的默认语言是英语。通过默认,当接收到用户请求时,语意识别买家代理器20将转到所有的卖家。当响应返回时,语意识别买家代理器20使用已被语意识别获知者代理器18获知的卖家说明将无效的结果过滤掉。
在本发明的另一个实施例中,卖家能够按照用户的本地情况分类,以便用户12能够选择“高级搜索”来查找卖家分类组。
本发明所采用的方法本质上是多语言的。当语意识别获知者代理器18获知卖家站点时,这种获知能够按照该站点的本机语言执行。所重获的结果是该站点的本机语言,该结果用于构成卖家说明。因此,当在线用户/购买者12以特定的本机语言在图15C步骤310发送请求,语意识别买家代理器20,在步骤312,将使用用户输入的原样的字符串在内存或缓存中查找“采样数”。因为字符串将以特定的本机语言表示,所以找到的任何“采样数”识别的卖家站点将使用同样的语言,并有同样的字符串。按照这种方法,应该理解在本发明中不需要“翻译”步骤将某一语言的搜索请求转换为“标准”语言。通过使用本机语言的搜索请求,在翻译过程中的错误和模糊就可以被避免。
在本发明的系统的优选实施例中采用的以数据库服务器的开发工具(优选是MicrosoftSQL-comppliant数据库)建立的计算机程序模块是标准的,本发明可以使用任何关系数据库,比如来自加利福尼亚RedwoodShores的Oracle公司的、来自加利福尼亚Emeryville的Sybase公司等的SQL数据库服务器,以及支持ODBC的其他数据库。如上所述,对本发明的优选实例而言,多线程同时搜索是十分重要的。在这方面,使用WindowsNT4.0平台(微软公司的产品)能够提供这种多线程能力。
现在参见图16到23,这些图详细解释了编写和准备“卖家列表”27中的培训数据和“卖家说明列表”28中卖家说明的数据。图16是交互式代理角色获知者接口(IACLI)的实际屏幕,它能够被用于获得用于本发明的培训信息。使用与图18显示的“增加卖家(AddVendor)”标签(tab)相对应的屏幕,提供了一个数据输入点用来输入由系统管理员获得的信息,这些信息是在系统管理员浏览卖家网站“1cache.com.”之后获得的。这样在图17中提供了一个范例,其中这些有关卖家“1cache.com.”的信息已被输入。该信息包括如下表右栏所示的内容:
此后,上述信息存放到卖家列表27,作为离线数据库24中的培训数据。要注意的是已输入的培训实例是特定产品的列表,在培训过程中这些数据将被实时搜寻,对识别的卖家站点获得其培训页。此后“卖家说明”才能从返回的培训页面中“获知”到。
然后,信息被显示在屏幕上,如图18所示,与“卖家信息(VendorInformation)”标签相对应。“卖家信息”屏幕接口(如图19所示)提供对该卖家名称的“搜索(Search)”功能。通过输入卖家名称,按下“搜索”按钮,所输入的卖家的卖家信息将从离线数据库24中提取,并显示出来。在该“卖家信息”屏幕上,要注意“封装器”字段-----“头部(Head)”、“尾部(Tail)”、“项目左定界符”、“项目右定界符”,“价格左定界符”,“价格右定界符”---是空的。这些封装器字段还有待“获知”。
图20提供了一个获知者界面的屏幕抓图,用于显示以前为某个卖家输入的培训示例。在打开名为“培训数据”的文件后该屏幕就会显示出来。获知者界面的“卖家信息”屏幕有一个搜索功能,用于搜索“培训数据”。要使用培训数据搜索功能,系统管理员需输入卖家的名称并按“开始(Go)”按钮。以前为指定卖家输入的培训数据清单会显示在屏幕上。应注意,“培训数据”界面还提供其他功能,比如“添加(Add)”(添加更多示例)、“删除(Delete)”(删除培训示例)、“编辑(Edit)”(编辑某个培训示例)、“保存(Save)”(将示例清单保存为当前状态)以及“取消(Cancel)”(取消已经输入的变更)。
现在看图21。在打开一个名为“卖家说明”的文件后,获知者界面的屏幕抓图会显示在屏幕上。该界面开始“获知”卖家说明的过程,并使系统管理员可以选择获知对“所有”卖家(其培训数据已经被输入)的描述,或根据管理员在提供的框中输入的卖家名称获知对“一个”卖家的描述。
图22显示“获知一个(LearnOne)”选项被选中,所输入的卖家名称为“1chache.com”。当系统与万维网连接之后,要按下“开始获知(LearnNow)”按钮以启动语意识别获知者代理(SRLA)18,并使用在培训示例中对该卖家指定的获知示例在其网站上实时获知关于指定卖家“1chache.com”的信息。
在获知/培训过程完成后,从其网址返回的培训或获知示例结果将被显示在获知者界面的屏幕上(如图23所示)。另外,要显示该信息,系统管理员可以使用图19卖家信息屏幕上的搜索功能,以输入卖家的名称(在此例中为“1chache.com”)并按搜索按钮。图23同时显示对卖家“1chache.com”的获知结果。应注意“封装器”字段现在已经完成。另外,该页面的“头部”显示值为“5230”。值“5230”可以确定行和字符的位置或其他关于位置的信息。“尾部”表明如下定界符标识的项目的位置:
“D></TD><TD></TD></TR></”
对于项目说明信息,左定界符被标识为如下字符串:
“GSRC=/Lmg/trans+1X1.gifBORDER-0WID…”
项目说明的右定界符被标识为字符串:“</b>”
价格的左定界符被标识为如下字符串:
“</b></A></TD><TDALIGH=right><FON…”
最后,价格的右定界符被标识为字符串:“</T”
尽管图23中项目左定界符和价格左定界符的字符串由于获知者界面的静止显示显得被截断,要知道,由语意识别获知者代理18标识的左定界符字符串中的所有字符将被存在卖家说明28中(优选存于MicrosoftAccess数据库中),并将在以后由语意识别买家代理器20使用。
现在将从“概念证明(proof-ofconcept)”的角度更详细地讲述语意识别获知者代理18的基本使用方法。
基本概念
如图24所示,封装器归纳问题被设计为一个简单的信息提取模型。
如图24所示,PAGEP为包含所需信息的网页。P为某些字符上的字符串。一般情况下,字符为ASCII字符集,PAGES为HTML文件。举例来讲,前面所示的图7为从卖家网址获取的一个非常简单的页面。按照“标记术语(labelingterminology)”,该页将被称为Ppc(产品目录页面)。请注意,本发明的方法受HTML应用的启示或启发,但并不依赖于HTML的应用。例如,页面可能为自然语言文本或与XML标准相符的文本。
系统采用标准的关系型数据模型。与每个产品记录相关的两个独特属性为项目和价格,其中“项目”代表产品的名称和型号,“价格”表示产品的价格。
“元组(tuple)”为两个字符串<Ai,Ap>的向量。字符串Ai为“项目”属性的值,字符串Ap为“价格”属性的值。鉴于属性表示关系模型中的列,“元组”表示行,因此,如图8所示,图7中产品目录页面示例中包含有四个“元组”,第一个为<`HM381MD`,`399.95`>。
页面的内容为其所包含的一组“元组”。比如,尽管有足够的文字串注释,但因为页面长度没有限制,因此使用一种更清楚、更简洁的页面内容表达方式。页面的“标签”是用于表示与页面中的一组标志相关的页面内容,而不是用于详细列举属性。
例如,用于简单产品目录页面(Ppc)的“标签”Lpc如图8右侧一列所示。
“标签”Lpc表示简单产品目录页面包含有四个“元组”,每个“元组”由项目和价格的值组成。一对整数表示一个值,如第一组<174,180>。这些整数表示第一个元组的属性为位置174和位置180之间的子串,即字符串“HM381MD”。通过检查图7右侧的字符串可以发现,这些整数与从第一行“<HTMI>”中“<”开始的字符的位置对应。同样,第四个“元组”的最后一对整数<356,361>表示最后属性的价格发生在356和361之间,即字符串`399.95`。
在更多情况下,页面P的内容可以由标签L表示。
对于只有一个“元组”的页面,采用以下标签:
L={<<b1,i,e1,i>,<b1,p,e1,p>>}
标签L用于页面P的内容编码。页面包含|L|>0个“元组”,每个元组有两个属性,即项目和价格。整数1<m<|L|表示页面中的“元组”。每一对<bm,i,em,i>用于一个项目值的编码,每一对<bm,p,em,p>为一个价格值的编码。在P中,值bm,i为mth“元组”中一个项目值的起始标志;值em,i为mth“元组”中一个项目值的结束标志。同样,在P中,值bm,p为mth“元组”中一个价格的起始标志;值em,p为mth“元组”中一个价格值的结束标志。mth“元组”的项目属性出现在<bm,i,em,i>之间,而mth“元组”的价格属性出现在<bm,p,em,p>之间。所以,图8所示的例子中的一对数值<b2,i,e2,i>=<229,234>为图7中页面的简单产品目录中第二个“元组”第二个(项目)属性的编码。
如上所示,封装器W为从页面到标签的函数;注释W(P)=L表示页面P上调用封装器W的结果为标签L。在此提取层面,封装器只是一个任意的步骤。
一个封装器类别包括一组封装器。在以下可以看到,本发明采用的封装器为HLRT封装器类别。
经过以上对术语的解释和对本发明所用方法的描述,现在将进一步解释获知者应如何获知卖家产品目录页面的封装。
从直观上来讲,输入本发明获知系统中的内容为产品目录页面样本及其相关的“标签”。在这一点,假设已经标识并给出了上述“标签”。在后文将仔细阐述为样本页面生成标签的方法。输出为封装W∈W。在理想的情况下,W为所有样本页面输出适当的标签。但一般不能作出此类保证,因此(根据归纳获知的精神),要求W为一组指定的培训样本生成正确的标签。
为找到解决方案,封装归纳问题(关于特定等级W)如下所述:
输入:一组培训范例ε={...,<Pn,Ln>,...},其中每个Pn为一个页面,每个Ln为一个标签;
输出:封装W∈W,以便使每个<Pn,Ln>∈ε可以实现W(Pn)=Ln。
HLRT封装器类
如以上解释,pcwrapHLRT程序表示一个“编程字母缩写词(programmingacronym)”-采用头部定界符、左侧的定界符、右侧定界符和尾部定界符从卖家产品目录中提取相关的产品信息及价格。头部-左侧-右侧-尾部(Head-Left-Right-Tail)HLRT封装器类(wrapperclass)是使这种缩写词格式化的一种方式。图25中所述的程序“execHLRT”是pcwrapHLRT的通用化形式,允许定界符为任意字符串,而不是以前用于pcwrapHLRT应用中的特定值“<B>”、“</B>”等。
请注意,尽管本例中的定界符全为HTML标签,本发明所采用的方法并不限于用HTML标签操作。另外,文本可以完全不是HTML。因此,美元标志“$”可以为价格的有效左侧定界符,比如“$399.95”。
execHLRT例程对HLRT封装的工作方法做了说明。以前,W(P)为通过在页面P上调用封装W生成的标签。当W为HLRT封装时,例程execHLRT是用于确定W(P)的一个程序(从W和P开始)。
li和ri的值表示项目属性的左侧定界符和右侧定界符,而lp和rp表示价格属性的右侧定界符,h和t分别表示页面的头部和尾部。(请注意,h表示行数而非字符串。比如,如果h=100,则页面的头100行为头部。语意识别购买者代理20在搜索产品时能够立即跳过这些行)。例如,如果用h=7,li=“<B>,”ri=“</B>,”lp=“<l>,”rp=“</l>“和t=“</TABLE>”参数调用execHLRT,那么execHLRT的作用同pcwrapHLRT一样。
在更多情况下,一个卖家网址的任何HLRT封装等同于一个(h,li,ri,lp,rp,t)向量,并且任何此类向量都可被解释为一个HLRT封装。假如它们相同,注释(h,li,ri,lp,rp,t)被用作通过用指定定界符部分评估execHLRT得到的HLRT封装的简略表达方式。
因为HLRT只是一个向量(h,li,ri,lp,rp,t),所以,图7和图8中的HLRT封装归纳示例是在示例页面及其标签的一组ε={...(P,(Pn,Ln),...)的基础上确定的四(4)个定界符字符串(h,li,ri,lp,rp,t)中的一个。更准确地来讲,要解决以下约束补偿(满足)问题:
变量:页面P的头部定界符:h
页面P的尾部定界符:t
项目属性的左侧定界符:li
项目属性的右侧定界符:ri
价格属性的左侧定界符:lp
价格属性的右侧定界符:rp
域:每个定界符都是一个任意字符串,头部定界符除外;
约束条件:对于每个<Pn,Ln>∈ε,W(Pn)=Ln,其中HLRT封装器W=(h,li,ri,lp,rp,t),
现在将描述learnHLRT的操作方法,它将解决以上约束补偿问题。
备用定界符
首先要了解定界符变量的域会受到示例ε的严格约束。至少,定界符将为示例页面的子串。当然还可以做的更好。根据示例(Ppc,Lpc)可以看出,rp(价格属性的右侧定界符)必须为“</l></TD></TR>”的前缀,其中表示一个新行字符。“前缀”的意思是从字符串最右边的字符开始字符串中字符的组合,比如“>”、“D>”、“TR>,”等。
注意,如果rp不是这个字符串的前缀,那么每个带有这个定界符的封装将至少不会提取“399.95”作为Ppc第四个“元组”的编码属性。因此rp的备用(候选)值为“</l></TD></TR>”的所有前缀。这些备用定界符如图10A所示。
详细来讲,简单产品目录页面定界符的备用值是以如下方式产生的:
li和lp的备用值
假设lp为价格属性的左侧定界符。可以参照图7中价格之前的“HM381MD</B></TD><TD><I>”和“MD2070</B></TD><TD><I>”等片断。按照这些片断可以看出,lp必须是“</B></TD><TD><I>”的后缀。因此,lp的备用值为该字符串的16个非空后缀。在图10A中可以看到这些备用值。所谓“后缀”指的是从字符串最左边的字符开始该字符串中字符的组合,比如“<”、“</”、“</B”、“</B>”等。
定界符li更为复杂,因为第一个属性之前的字符串出现在前面“元组”的第一个属性和最后一个属性之间,以及在页面的头部和第一个“元组”之间。在示例中所考虑的字符串为“<TR><TD><B>”和很清楚,li是这个字符串的后缀。因此,li的备用值可以通过列举一个此类片断的后缀产生。
作为总结,可以得出结论,对于示例集和书面candsl(i,p,ε),定界符li和lp的备用值是通过列举发生在每个示例中项目属性和价格属性左侧的最短字符串的后缀生成的。(如上段所述,示例项目属性有些特殊。必须列举相邻元组之间或第一个元组之前的最短字符串)。比如,如果ε={(Ppc,Lpc)},那么:
Candsl(p,ε)={</B></TD><TD><I>,
....}
ri和rp的备用值
右侧定界符备用值的生成方法与左侧定界符相似,但存在两个区别。首先,所考虑的字符串发生在适当属性的右侧(而不是左侧)。第二,ri和rp必须为这些字符串的前缀(而非后缀)。例如,在简单产品目录示例中,定界符ri必须为字符串“</B></TD><TD><I>”的前缀,而rp必须为“</I></TD><TR>”和的前缀。
特别是,在所示的示例集ε-书面candsr(k,ε)中,右侧定界符的备用值是通过列举出现在每个示例中属性k右侧的最短字符串的前缀产生的。(如上所述,li是一个特殊情况。同样,rp也是一个特殊情况。)所列举的是出现在相邻“元组”之间或最后一个“元组”之后的最短字符串的前缀。例如:
Candsr(i,ε)={</B></TD><TR><l>,
....}
头部和尾部的备用值
相似的分析适用于头部和尾部的定界符。“头部”指第一个项目属性出现之前页面的前缀。在此要注意,“头部”被表示为一个字符串。当实际执行一个封装时,为了提高发明的性能,最好用一个整数表示“头部”,这样,当顾客或购买者在使用封装器寻找产品信息时,他们可以不看内容便跳过页面的头部。要将头部字符串转换为一个整数,只要确定头部字符串所跨的行数即可。
确定“尾部”定界符的方法同确定右侧定界符li和Lp的方法非常相似。尾部备用值为页面最后一个价格属性之后的字符串的后缀。
定界符的独立性
按照每个定界符的这些备用值,用于获知这两个定界符的以伪码编制的简单方法的模块如图26所示。
因为这个模块是按照与每个定界符备用值的数量乘积成比例的时间运行的,并且因为每个定界符可以有许多备用值,执行的时间可能比较慢。
通过使ri,lp,rp相互独立,可以实现更有效的处理。另外,对于一个特定定界符而言,一个备用值是否有效在任何情况下都与任何其他定界符无关。例如,无须分析其它定界符即可判断“</B>”是否适用于ri。
为正确保持这种独立性,可以参考execHRLT程序。在其执行过程中的每一点,execHRLT将搜索每一个定界符ri、lp和rp的输入页面P。如果在搜索中没有确定在P中的正确位置,则execHRLT输出的标签将是错误的。但这些搜索能否返回正确答案仅仅取决于定界符和示例页面,而不取决于其他定界符。
换一种说法,只要某个特定备用值(ri,lp,rp)被选为某个定界符,在任何情况下这个备用值都不会失效,无论其它定界符的备用值是什么。这种倒置说法还会让人产生这样的直觉:如果一个备用值无效,没有任何办法可以对其进行修复,无论在为其他定界符选择备用值时是多么小心。请注意,这一独立性可以得到保证;它不仅仅是为便于获知而采用的直观判断。
注意这一点的重要性在于,可以分别获知三个定界符ri、lp和rp。在伪码中,可以按如下方式获知:
1.生成备用集;
2.为每个定界符选择一个有效的备用值。
这种方法比图26中的程序快的多:它是按照与每个定界符备用值数量的和(而不是乘积)成比例的时间运行的。
然而,还要注意并非所有的定界符都是相互独立的。相反,对于定界符h、t和li,一个具体字符串对于三个定界符中的一个定界符是否有效取决于其他两个定界符的选择。例如,“<B>“对li是否有效?答案取决于h和t的选择。如果h=“<HTML>”,那么“<B>“对于li不是一个有效的定界符,因为execHLRT将不会跳过无关的加粗正文“<B>ASimpleProductCatalogues</B>”。另一方面,如果h=“</TH></TR>”,那么li=“<B>“不会产生问题。同样,li和t相互作用:如果t=“</HTML>,则li=“<B>“是不可被接受的,但如果t=“</TABLE>则可以被接受。这样,必须同时考虑三个定界符h、t和li的备用值。所以需要列举h,t和li的所有组合,并选择有效的组合。
备用值的有效性
这一改进方法的第二步涉及精确描述使定界符备用值有效的条件。
首先考虑定界符ri和rp。在该方法确定属性某个示例的起始标志后,该方法试图确定该属性实例(instance)的结束标志。因此定界符ri或rp的备用值“u”必须满足两个约束条件:
约束条件C1:在任何示例页面中,“u”不得为任何一个属性实例的子串。
约束条件C2:在每个示例页面中,“u”必须是在每个属性实例之后出现的正文的前缀。
如果定界符ri或rp的备用值“u”违反这些约束条件,那么每个封装将至少对于一个示例ε无效。如果违反约束条件C1,那么属性k将会太短;如果违反约束条件C2,那么它将会太长。
总而言之,对于一组特定的示例ε,如果要使某个备用值“u”对定界符ri或rp有效,要注意必须满足条件。这些条件将被称为有效的(u,r,ε)。可以看出,对于示例集ε,只有在备用值“u”满足对定界符ri和rp的约束条件C1和C2的情况下,r(u,r,ε)才会持续有效。回到示例,如果将有效(validr)测试用于candsr生成的备用值,可以发现:
对于项目属性的右侧定界符:
validr(</B></TD><TD><I>,i,ε)=TRUE
对于价格属性的右侧定界符:
对lp的约束条件
execHLRT程序搜索定界符lp。定界符lp的备用值“u”必须满足两个约束条件:
约束条件C3:在每个示例页面中,“u”必须是在每个属性k的实例之前出现的正文的正确后缀。
如果违反这个条件,则每个封装器将与示例ε不符。至少由execHLRT计算的起始标志bm和p中将有一个不正确,至于是大于正确值、小于正确值还是未作定义,这取决于“u”是如何违反该条件的。
总而言之,根据一组特定的示例ε,如果要使某个备用值“u”对定界符lp有效,要注意必须满足条件。这些条件将称为有效的(u,l,ε)。可以看出,对于C,只有在备用值“u”满足对定界符lp的约束条件C3的情况下,validi(u,l,ε)才会持续有效。回到简单产品目录示例Ppc,可以发现:
validl(</B></TD><TD><I>,p,ε)=TRUE
要确定h,t和li的备用值Uh、Ut和Uli是否适用,应采用以下约束条件确定:
约束条件C4:Uh必须是每个页面头部部分的正确后缀。
约束条件C5:Uh必须是在第一个Uh出现后每一个页面的头部部分的正确后缀。
约束条件C6:在任何页面中,Ut不得出现在从h第一次出现到随后li的出现之间。
约束条件C7:Ut必须为每个页面尾部的子串。
约束条件C8:Uli不得在每个页面尾部中的t之前出现。
约束条件C9:在每个页面种,Uli必须是“元组”之间正文的正确后缀。
约束条件10:在任何页面中,Ut不得在“元组”之间正文中的Uli之前出现。
HLRT归纳
在上述背景下,现在将讲述程序learnHLRT。图27A和27B中提供有一个详细程序表以及相关的子例程。
获得培训数据
在对本发明的以上描述中,已经假设语意识别获知者代理18可以使用培训数据库。也就是说,一组ε={...,<Pn>,Ln>,...}培训示例已经存在,其中每个Pn为一个页面,每个Ln是一个标签。要进一步了解获知者18使用培训示例的方式,可参见图7和图13。
如以上所述,在购物/购买阶段,语意识别买家代理器20可以执行五种不同的功能。这五种功能分别如下所述:
(1)采用如图15C所述的模块化启发式搜索法制作标签(LabelOracle)。这些被称为识别器(recognizer):一种是项目识别器,另一种是智能价格识别器。
(2)因为在每次从网上购买者或使用者收到请求时语意识别购买者代理20重获卖家说明数据的效率不高,如果这是语意识别购买者代理20第一次请求对所需的一组说明进行搜索-匹配-提取,只可从数据库(最好是MicrosoftAccess数据库)或与SQL-compliant数据库服务器22获得此类说明描述。然后卖家说明将被存储在存储器或高速缓存存储器中,以便在以后的语意识别卖方代理20请求中更加快速地进行检索使用。
(3)存储器或高速缓存存储器中的卖家说明最好每天自动更新一次。
(4)本发明中的系统可以产生多条线程,并同时访问若干个语意识别购买者代理,以通过万维网接触各种指定的网上卖家网址。这一多线程方法的使用最好建立在Microsoft公司的DCOM技术基础之上。每个语意识别购买者代理可以根据购买者或使用者提供的产品信息以智能方式填写卖家搜索表并以虚拟方式按下“回车”。
(5)另一方面,通过加快卖家答复时间以及借助多线程方式将返回的搜索结果分配给不同的存储器地址,语意识别购买者代理20可以解决万维网业务量繁重的问题,目前万维网主宰着顾客/购买者网上购买的整个过程。
培训页面Pn
获得培训页面涉及对卖家网站进行示例查询。例如,图12说明从查询到网址(例如http://www.800.com)的示例页面外观。
现在将对用于按照模块化启发式搜索法制作识别器(指标签(LabelOracle))的算法进行更加详细的描述。识别器在页面上搜索一个特定属性的实例。比如图12上的样本页面,项目识别器将确定页面上包含的所有“项目”,比如产品“HM381MD,”、“MD2070,”和“MD203”。识别器的智能程度应足以消除干扰。
再举一个例子,如图12中的示例,智能价格识别器应能够区别“价格1”和“价格2”哪个是“列表价格”,哪个是“您的出价”。然后对所识别的实例进行证实以标识整个页面。比如一个识别器用于“项目”和另一个识别器用于“价格”,通过证实产生一个LabelOracle,用于标识包含有这些成对属性的页面。
在项目识别器事先知道所有项目的情况下,识别“项目”只是一个简单的模式匹配问题。然而这是不可行的,因为这需要一个大的项目名称/型号列表。另外,维护如此大的项目数据库成本较高。因此不可能保证这样的项目名称/型号列表清单是完整的、最新的。
幸运的是,卖家试图通过对所有产品采用统一的外观以产生一种一致的感觉。比如,卖家提供小型磁盘(MD)信息所采用的格式与用于DVD产品的格式相同。借助这一规则性,可以假定所有产品都是以相同格式描述的。
本项发明仅从示例的特定域中获知封装,并试图使此域适合于在全球互联网上以统一格式组织的所有使用外语的其它的域。在优先选择的实施例中,培训示例仅仅源于一个域,比如卖家网址上的MD域。在这种情况下生成的识别器仅需要识别特定的产品域,比如MD。按照这种方式,可以维持一个经过完全更新的、特定的项目名称域目录。
本发明通过调用模块化启发式搜索确定“价格”。比如价格之前总有一个美元标志($);价格经常是一个浮点数等。如果发现一个项目有多个价格,再相应地提取“您的价格”、“我们的价格”、“列表价格”、“原始价格”等关键词。
购物阶段的详细步骤
如以上简单描述,语意识别买家代理器20的工作机制如图14和图15A-15C所示。控制流程分为图中所示的八(8)个步骤。
第(1)步
当一个用户确定需要某种具体产品或服务后,本发明可以提供一个门户(入口),通过门户并经互动-代理-角色图形用户界面(IACGUI,一般称为互动-代理-角色顾客/购买者界面)输入产品需求信息以达到产品搜索目的,这种方法可以获得更好、更快更可靠的结果,而不是通过浏览万维网上各种语言的卖家网址用手动方式逐个搜索产品信息和价格。
搜索到的产品说明被存储在membervariable-m_ProdDesc-oftheSRBA20中。搜索还允许用户通过“高级搜索”功能限定代理的工作方式,上述功能提供有可选参数,比如应选择的卖家、超时(限制)、价格范围、任何生产商、关键词等。
第(2)步
例如,假定网上购买者和用户的平台使用的是Windows98操作系统并正在运行语言版本“B”(或最好其平台运行英语版的Windows2000专业版和/或其平台装有“B”版本的个人网络服务器软件),当其进入本发明的门户后,MicrosoftInternetExplorer(IE浏览器)将提示其下载语言“B”显示软件。当网上购买者或用户“A”用语言“B”的本机字符在本发明的门户网站中的文本框中输入一个产品型号作为关键词后,图2中的语意识别买家代理器20将利用预先描述的示例数据(以前实时封装归纳获知之后在卖家说明中重获的数据)进行数据提取,示例数据中包含有语言“B”本机字符串。这些卖家说明被存储在数据库24(最好为MicrosoftAccess数据库)中的卖家说明列表中预先定义的数据结构中。数据提取涉及同时采用用户输入的准确语言“B”本机字符串从以前的搜索结果中搜索“采样数”,包括价格、说明以及与产品相关的信息(如图15C第312步所示)。上述信息驻留在服务器22中的存储器和高速缓存存储器中。因为语言“B”字符串是一种特定的本机语言,所发现的任何“采样数”将适用于使用本机语言“B”并且有语言“B”字符串的指定卖家网址。
如图14第7步所示,在获知过程中,当图2中的语意识别获知者代理器18从网上卖家处获知封装后,卖家说明被保存在离线数据库24(最好为MicrosoftAccess数据库)和数据库服务器22(最好为与MicrosoftSQL-complaint数据库服务器)的卖家说明列表28中。因为在每次从网上购买者或使用者收到请求时语意识别购买者代理20对卖家说明进行检索的效率不高,如果这是语意识别买家代理器20第一次请求对所需的一组说明进行搜索-匹配-提取,只可从数据库24或服务器22中检索此类描述。然后卖家说明将被存储在存储器或高速缓存存储器中,以便在以后的语意识别买家代理器20请求同一用户或者新用户中更加快速地进行检索使用。
存储器或高速缓存存储器中的卖家说明优选每天自动更新一次。
第(3)步
利用重获的卖家说明,本发明中的系统可以产生多条线程,并同时访问若干个语意识别买方代理器,以通过万维网接触各个指定的网上卖家网址。
第(4)步
这一多线程方法的使用优选建立在Microsoft公司的DCOM技术基础之上。每个语意识别买方代理器可以根据购买者或使用者提供的产品信息以智能方式填写卖家搜索表并以虚拟方式按下“回车”。
第(5)步
然后每个卖家返回一个搜索结果页面,此页面上包括有所需产品的信息或一个错误消息。
第(6)和第(7)步
搜索结果页面通过万维网被返回语意识别买方代理器20。应注意若干结果页面会同时返回语意识别买方代理器20。通过加快卖家答复时间以及借助多线程方式将返回的搜索结果分配给不同的存储器地址,本发明的语意识别购买者代理20可以解决万维网业务繁忙的问题,目前万维网控制着顾客/购买者网上购物的整个过程。
第(8)步
语意识别买方代理器20根据相应的卖家说明分析返回的页面。在所有搜索结果页面已经到达或者搜索超时之后,相关的信息和数据会被从返回的页面上提取出来,并以格式化的输出方式被显示出来。
如图28所示,用户/购买者与服务器22进行通讯,以通过所示的活动服务页面(ASP)文件(NextGen.asp)运行服务器22上的正在处理过程中的DLL文件(NextGen.dll)。
优选的是,以ActiveX组件的形式开发语意识别买家代理器20有许多好处。第一,可以改善整体性能。用VisualC++编写的语意识别买家代理器使该代理器功能更强,并使之具有ActiveX组件的强大功能。没有必要提供HTML和脚本代码的工作区方案来满足应用需求。使用ActiveX组件,可以通过在客户端HTML文件中增加几行代码来运行该代理器,而把所有复杂的处理留给服务器端执行。
第二,ActiveX组件提供给其他应用程序以可重用性而不是在每个应用模块中拷贝类似的功能。所创建的ActiveX组件可以被所有活动服务器页面(ActiveSeverPages,也称作动态服务器主页)模块访问。换言之,不需要在ASP模块中包含所有的代码逻辑。因此,这消除了应用的冗余。虽然语意识别买家代理器在单一应用中被创建,但是这并不妨碍它与其他应用集成。进而言之,该特性有助于大大减少开发时间。
第三,这对于把ASP组件连接到DLL(动态链接库)文件有益,因为它们被独立的编译和链接。不需要附加的重编译和重链接就能更新ASP组件。因此,使用DLL的ActiveX组件的好处是改善处理速度或便于以后增加新功能。另外,DLL可以减少内存和磁盘空间需求,其方式是通过在多个模块之间共享单一的公共代码拷贝。
如果有多个组件使用同一静态链接库,那么必须同时存储和执行多个一样的库拷贝。因此,如果它们同时运行就需要在内存中有多个一样的拷贝。显然,静态链接库导致冗余和空间浪费。
如果在使用DLL代替静态链接库,那么只需要一份代码和资源拷贝。这可以保证服务器在最小的工作量下处理来自因特网的多个并发的连接。
语意识别买家代理器20优选是作为进程内动态链接库(in-processDLL)开发的ActiveX组件。这允许用户通过万维网创建SRBA对象。为了在用户和服务器之间通信,ASP被用做用户和服务器之间的网关。
ASP是开放的应用环境,在该环境中HTML页面,脚本和ActiveX组件结合起来创建基于WEB的应用程序。另外,它被构筑成因特网服务器应用程序界面(ISAPI),在微软公司的因特网信息服务器(IIS)或与IIS类似的对等WEB服务器上运行。
为了执行ASP,使用了微软的ActiveX脚本,比如VisualBasic(VB)脚本,该脚本在管理ActiveX组件的过程使用。通过增加功能使得该语言动态化来激活在服务器上以DLL形式运行的ActiveX组件。
程序逻辑-创建语意识别买家代理器对象
当用户开始查询所希望的产品价格时就要创建一个语意识别买家代理器20的对象。
在活动服务器页面,以伪码形式编写的模块如下:
当该页面被加载时,上述模块创建了一个语意识别买家代理器20对象,其中NextGen是ActiveX组件的名字。语意识别买家(Semantics-RecognitionBuyer)是代理器在NextGen组件中的名字。
连接用户和服务器
在语意识别买家代理器20的实例被创建之后就在用户和服务器之间建立了连接,如图29所示。
语意识别买家代理器使用可连接的对象来维护“一对一”(信道),用户与服务器通过该信道通信,比如用户请求服务器比较价格,而语意识别买家代理器20使用外出接口作为连接(信道),从而使服务器与用户通信,比如服务器响应请求将查询的结果返回给发出请求的用户。用户可以通过IConnectionPoint访问语意识别买家代理器的属性并激活其方法。
语意识别买家代理器20采用如下的方法:
1、OnStartPage(未知代理)
该方法用于初始化语意识别买家代理器对象,该方法当ASP被装载时自动调用。
2、OnEndPage()
该方法用于终止语意识别买家代理器对象,该方法当ASP被卸载时自动调用。
3、GetSearch(BStrinput,BStr*output)
该方法用于当用户提供了产品说明(如型号)之后,在因特网上查找所需的产品价格。Input是用户给出的产品说明,而output是查找结果页面的输出内容。调用该方法的语法是:
OutputName=AdObjectName.GetSearch(“ProductName”)
在上述代码中,“AdObjectName”是对象的实例名,而“ProductName”是购买者/用户所要比较价格的产品名,“OutputName”是存放所获得的结果值的变量。参考如下例子的伪码:
Ifresult=Agent
Getsearch(“Radardetector”)
服务器端程序逻辑
登记组件
在用户初始化语意识别买家代理器对象之前,该组件必须在服务器上用下面的命令登记(注册):
Registerpath\Nextgen.dll
其中path是Nextgen.dll的存放的绝对路径。
用户请求的响应
当语意识别买家代理器对象通过IconnectionPoint调用GetSearch方法时,在服务器机器上的语意识别买家代理器的实例执行动态链接库DLL。参见图30。
连接数据库
需要提供数据源名称(DSN),标识(ID)以及口令以便通过ODBC连接到SQLServer(SQL服务器)。RETCODE是存储SQLServer返回值的变量。SQL_SUCCESS表明成功重新获取。
执行SQL查询
在从SQL获取期望的数据之前,需要指定的查询语句。
获取字段
成功执行查询之后,卖家说明信息将存储在vendor_description数组中。该数组有两个成员变量:封装器和卖家URL。
填写表格
如果有N个卖家说明,买家代理器将初始化N个线程来填写由卖家说明指定的每个卖家的表格。
运行每个线程的语法是:
对每个线程,时间限制最好是大约5秒。如果在5秒内卖家没有返回结果,那么这次将放弃该卖家,否则,其结果将存储在内存中以便下一个程序使用。
当用户在本发明的门户(入口)处所提供的文本框中输入购买请求的关键字时,它就决定是否有相关的卖家说明,即包含关键字的卖家说明。所有包含封装器和URL的相关的卖家说明都从离线数据库中提取。这之后,语意识别买家代理器20与每个在线卖家的可搜索引擎并行执行,填写表格并发送到卖家站点。在卖家站点,买家代理器将调用成员函数httpPost来完成任务。HttpPost成员函数根据卖家说明将URL和表格数据传送给卖家,用字符变量返回HTML响应。HttpPost成员函数返回布尔值(booleanvalue),其中“真”表示成功获取HTML文档,“假”表示发生错误。如果返回值是真,所产生的项目名称和价格将从HTML文档中提取。传送表格的流程如图31所示。
在步骤1002,为该会话创建CinternetSession对象。CinternetSession类通过因特网会话连接到服务器。通常该类在早期用于会话以建立到WEB服务器的连接。
在步骤1004,通过调用CinternetSession对象的GetHttpConnection成员函数来创建ChttpConnection对象。ChttpConnection类建立与服务器的HTTP连接。
在步骤1006,通过调用ChttpConnection对象的OpenRequest成员函数来创建CHttpFile对象。CHttpFile类的功能是让因特网上传送的文件能够象工作在本地磁盘的文件一样处理。它与ChttpConnection对象一起工作来读写因特网数据。
步骤1008调用CHttpFile对象的SendRequest成员函数来发送POST请求和表格数据到远程HTTP服务器。
步骤1010,1012和1014重复调用ChttpFile对象的READ成员函数,返回大量的响应数据给程序。当Read返回0时,就没有要获取的数据了。
提取价格
获得结果页面之后,语意识别买家代理器20将用通用错误模版匹配每个结果页面。如果结果页面与模版不匹配,就认为是成功的查询。然后买家代理器20将使用对应卖家的封装器从成功页面中剥离头部和尾部信息。比如,假如用户查找MD产品,型号是MD203,给定的封装器是{7,<B>,</B>,<l>,</l>,</TABLE>},那么结果页面如下所示。
在封装器中,有用的信息开始于第七行,结束于</TABLE>,因此语意识别买家代理器20将在提取型号和价格前去掉无用的信息。去除头部和尾部信息之后的HTML文件是:
然后,语意识别买家代理器20将使用模式匹配来提取型号和产品的价格。在封装器中,型号的模式是<B>*</B>,价格的模式是</1>#</1>。其中*表示型号,#表示价格。代理器将首先提取型号HM381MD,并与用户所请求的型号MD203相比较。由于他们不匹配,语意识别买家代理器20就查找另一个型号,直到发现型号MD203。找到型号之后,语意识别买家代理器20使用价格模式提取该型号之后的第一个价格。当型号和价格被提取之后,语意识别买家代理器20停止从该页面提取信息,并把信息发送到一个名称为array_item[]的数组。
关键部分
array_item[]是N个线程共享的数据,所有的线程都能够访问该成员变量。一个危险是多个线程同时访问array_item[]时产生的访问冲突。为了保护该共享的数据在一致的状态下,使用关键部分(CriticalSection)来阻止一个以上的线程同时修改数据。描述如下:
CCriticalSectionm_csDoor;
Beforeinsertinganelementintothearray_item,theline
m_csDoor,Lock();
以上内容被增加,以用于启动关键部分。关键部分内部的所有变量都加锁,阻止其它线程访问该特定的变量。完成插入之后,行
m_osDoor.Unlock();
被增加,以用于表示关键部分结束。所有加锁的变量将解锁,允许其它线程访问成员变量。这样,array_Item的成员变量能够安全地被所有线程共享。
价格分类
在指定的时间间隔内,存放产品价格的数组sort_item将通过快速分类的方法被分类。
快速分类方法按照以下方式实现:
IFleft<rightTHEN
BEGIN
在代码的每个递归位置将选择一个“关键”结构值。该函数按两个方向重复的扫描该结构。小于关键值的数被放置在结构的左边,较大的值被放置在结构的右边。这种“从左到右”和“从右到左”的扫描和交换持续到状态标记告诉它们应该结束。
将响应返回给用户
一个HTML文件将返回给用户,该文件将存储在成员变量m_output中,它显示SRBA20查找的分类结果。
//Stringusedtodisplaycontenttobrowser
*defineHTTP_HEADER“Content-type:text/htm\n\n”
//Codestodisplaytobrower
与本申请一起提交了一个前面提到计算机程序列表附录,它提供代了实现本发明的选择特性的代码部分。具体而言,在标有“3.1ThelearningPhase(获知阶段)”的部分提供了源代码,用于:“3.1.1MainCOOSAApplicationClass”-用于COOSA应用的主要类文件;“3.1.2AddVendorClass”-向数据库添加一个卖家类;“3.1.3COOSADocClass”-调用语意识别获知者界面的文件和屏幕显示和;“3.1.4COOSAViewClass”-获知者界面及其功能屏幕;“3.1.5TrainingDataClass”-调用语意识别获知者代理器,“3.1.6VendorClass”-描述标签算法通过所有的卖家WEB页面的处理。在标记有”ShoppingPhase(购买阶段)“的部分,提供了如下的源代码,“3.2.1AgentClass”-说明语意识别买家代理器;“3.2.2ThreadProcess”-语意识别买家代理器的部分程序。
参考图32到39,下面将详细描述与本发明相互连接的GUI或交互式代理器角色购买者/买家界面(Interactive-Agent-CharacterShopper/Buyerinterface)。在图32中简单说明了与本发明相互连接的GUI或交互式代理器角色购买者界面(IACS/BI)的“主菜单“屏幕。要注意的是在该主菜单屏幕的右上角有供用户选择的产品“信道(channel)”(类目)。在屏幕的左边提供了“快速查询(QuickSearch)”特性。在它的正下方,提供了一个其中有动画打字的文本框,指导在线用户如何使用快速查询选项。屏幕左边还提供了一组文本框供访问者作为一个临时会员或者永久会员使用。(注意本发明的大部分入口的功能一直被禁用直到用户得到正确的确认)。在左下角提供了一组到在线卖家的链接,这些卖家登记在本发明的入口。在右边,可以看到一个大的消息框标记有“反馈(feedback)”,提供给在线用户通过EMAIL发送到EMAIL服务器输入意见讯息,最好是使用微软公司的OutlookExpress品牌的EMAIL服务器。
图33简单说明了与本发明一起使用的GUI或购买者界面,其中显示了一些公司信息以响应在线购买者/用户在前面的屏幕(没有显示)中点击的“政府到商业(Government-to-Business)”文本图标。但是,要注意该屏幕不能起作用,因为这些公司,或者叫政府到商业电子商务服务或平台提供商目前严格限制成员的权限来访问它们的WEB服务器数据库,其方式是在整个封闭连接的计算机网络环境中通过集成认证安全接口。
图34简单说明了与本发明一起使用的GUI或购买者界面的屏幕显示,其中提供了关于用户所选择的公司的细节,用户点击图33中屏幕的“高级搜索(AdvanceSearch)”选项从提供的多个公司中加以选择。注意在该屏幕中,框架中的旗帜位于五种类型的域的正下方,可以看到大写的消息“高级代理运行中(ADVANCEDSEARCHAGENTSAREON)”。另外,在屏幕的下边,提供给用户对话框可供填写以便使用本发明所提供的语意识别买家代理器的功能运行搜索。但是,仍要注意该屏幕不能起作用,因为这个公司,或者叫政府到商业电子商务服务或平台提供商目前严格限制成员的权限来访问它们的WEB服务器数据库,其方式是在整个封闭连接的计算机网络环境中通过集成认证安全接口。
图35是简单说明了与本发明一起使用的GUI或购买者界面的屏幕,其中显示了一些公司,其响应在线购买者/用户在前面的屏幕(没有显示)中点击的“商家到商家”文本图标。但是,要注意该屏幕不能起作用,因为这些公司,或者叫商业到商业电子商务服务或平台提供商目前严格限制访问它们的WEB服务器数据库的成员的权限,其方式是在整个封闭连接的计算机网络环境中通过集成认证安全接口。
图36简单说明了与本发明一起使用的GUI或购买者界面接口的屏幕显示,其中提供了关于用户所选择的公司的细节,用户点击图35中屏幕的“高级搜索”选项从提供的多个公司中加以选择。
图37是简单说明了与本发明一起使用的GUI或购买者界面的屏幕,其中显示了响应用户选择“域A”标签的所选择的项目及其说明。
图38简单说明了与本发明一起使用的GUI或购买者/买家界面的屏幕显示,其中列出的域A中的卖家销售产品项目,响应用户点击图37屏幕中的“高级搜索”选项。
图39简单说明了与本发明一起使用的GUI或购买者/买家界面的屏幕显示,其中提供了使用本发明的语意识别买家代理器搜索结果的细节。购买者/买家界面通过图38中屏幕底部的搜索参数响应发送搜索请求的用户。
需要进一步理解的是,尽管本发明已经按照因特网和万维网进行了说明,但是本发明同样适用于最近引入的系统和下一代系统。举例来说,无线应用开发工具,J2MF(JavatoMicroEdition)可以被用于将在线智能多语言和域独立价格比较能力结合到移动/无线平台,包括所有型号的3G或WEB电话,交互式和卫星互动电视服务(UltimateTV),口袋PC,掌上电脑(Palmorganizer),集成连网掌上同步装置(all-in-oneWeb-enabledPalmSynchronizer),无线写字板等,将主页上的许多产品和多语种的增值商业WEB服务发送给移动工作者和网民,其中该主页作为基于24/7/365基础上的一站式任意地点的信息访问点。
进而言之,本发明可以通过有线和移动/无线平台发送各种产品和多语种的增值商业WEB服务,该产品和服务具有如下能力、功能、特性:价格比较,电子钱包集成,具有协商能力的代理间通信---代理到代理(A-to-A)合同协商---对多个电子商务段的真实世界仿真能力,包括消费者到商业(C-to-B),消费者到消费者(C-to-C),和商业到商业(B-to-B)拍卖,政府到商业交易(G-to-B)等。这些A-to-A商务或A商务的活动将被在全球市场框架中被构筑和激活,这只需要用户使用键盘,鼠标或点击设备就能及时地动态地进行。
这里采用的术语和表达只是用于描述而不是限制,使用这些术语和表达无意排斥本说明中所显示和描述的特征的等同特征,要认识到在本发明要求的范围内存在各种修改的可能。
Claims (2)
1.一种通过相互连接的计算机网络进行实时在线搜索处理的方法,所述方法包括如下步骤:
a.通过相互连接的计算机网络访问一个离线数据库,所述离线数据库中具有多个卖家站点的卖家说明,其中所述多个卖家站点是多语种的,每个卖家使用其自己的本机语言,每个所述卖家说明具有关于所述多个卖家站点中的相应一个卖家站点的信息,该信息包括:
i.该卖家站点的URL,
ii.该卖家站点的搜索表格URL,
iii.在该卖家站点中发现的域说明,
iv.在该卖家站点上产品信息是如何组织的通用化规则;
v.从所述多个卖家获取的价格和产品信息的样本;
b.以特定本机语言从在线用户接收关于期望产品的价格对比请求,其中所述特定本机语言是所述在线用户用于输入价格对比请求的语言,所述价格对比请求包括以所述特定本机语言表达的至少一个参数;
c.使用所述至少一个参数获取卖家说明,并且从卖家说明中识别可能具有与所述价格对比请求相关的价格信息的使用所述特定本机语言的卖家站点;
d.利用关于每个识别的所述卖家站点的包括相应的搜索表格URL的所述卖家说明构建对期望产品的搜索请求;
e.将所构建的搜索请求直接发送给所识别的卖家站点;
f.从响应于所发送的搜索请求而接收到的搜索结果中提取价格和产品信息,其中所提取的价格和产品信息采用的是所述特定本机语言;以及
g.将所提取的价格和产品信息显示给所述用户。
2.一种通过相互连接的计算机网络进行实时在线搜索处理的方法,所述方法包括如下步骤:
a.通过相互连接的计算机网络在一个离线数据库中存储多个卖家站点的信息,其中所述多个卖家站点是多语种的,每个卖家使用其自己的本机语言,所述信息包括URL,搜索表格URL,域说明,和卖家说明,其中每个所述卖家说明包括关于在相应的一个所述卖家站点上产品信息是如何组织的通用化规则;
b.使用存储在所述离线数据库中的信息,处理以特定本机语言从在线用户接收的期望产品的价格对比请求的至少一个参数,包括使用所述至少一个参数获取卖家说明,并从获取的卖家说明中识别可能具有与所述价格对比请求相关的价格信息的使用所述特定本机语言的卖家站点,其中所述特定本机语言是所述在线用户用于输入价格对比请求的语言;
c.从所述多个卖家站点中所识别的卖家站点中响应于搜索请求而接收的信息中,提取实时价格和产品信息,其中,所述搜索请求是使用存储在所述离线数据库中有关每个所识别的卖家站点的信息而构建的,所提取的价格和产品信息采用所述特定本机语言;以及
d.把所提取的价格和产品信息显示给所述用户。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US23657400P | 2000-09-29 | 2000-09-29 | |
US60/236,574 | 2000-09-29 | ||
US19299901P | 2001-06-19 | 2001-06-19 | |
US60/192,999 | 2001-06-19 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA01819690XA Division CN1478237A (zh) | 2000-09-29 | 2001-09-27 | 通过互联计算机网络的多语种电子数据源的在线智能信息比较代理器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102708114A CN102708114A (zh) | 2012-10-03 |
CN102708114B true CN102708114B (zh) | 2016-08-03 |
Family
ID=46900906
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210028555.8A Expired - Lifetime CN102708114B (zh) | 2000-09-29 | 2001-09-27 | 通过相互连接的计算机网络进行实时在线搜索处理的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102708114B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI567628B (zh) * | 2016-01-20 | 2017-01-21 | Long press the message immediately after the search method | |
CN110347480B (zh) * | 2019-06-26 | 2021-06-25 | 联动优势科技有限公司 | 含有重合数据项标签的数据源优选访问路径方法及装置 |
CN111259732A (zh) * | 2019-12-31 | 2020-06-09 | 维沃移动通信有限公司 | 一种信息显示方法及电子设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998032289A2 (en) * | 1997-01-17 | 1998-07-23 | The Board Of Regents Of The University Of Washington | Method and apparatus for accessing on-line stores |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1173822A1 (en) * | 1998-11-12 | 2002-01-23 | AC Properties B.V. | A system, method and article of manufacture for advanced mobile bargain shopping |
KR100283103B1 (ko) * | 1998-12-01 | 2001-05-02 | 정선종 | 온라인 상점 상의 제품 정보 자동 색인 방법 및 시스템 |
EP1024448A3 (en) * | 1999-01-28 | 2001-08-08 | R-U-Sure Ltd. | E-commerce system |
-
2001
- 2001-09-27 CN CN201210028555.8A patent/CN102708114B/zh not_active Expired - Lifetime
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998032289A2 (en) * | 1997-01-17 | 1998-07-23 | The Board Of Regents Of The University Of Washington | Method and apparatus for accessing on-line stores |
Also Published As
Publication number | Publication date |
---|---|
CN102708114A (zh) | 2012-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7536323B2 (en) | Online intelligent multilingual comparison-shop agents for wireless networks | |
US6484149B1 (en) | Systems and methods for viewing product information, and methods for generating web pages | |
US20030167209A1 (en) | Online intelligent information comparison agent of multilingual electronic data sources over inter-connected computer networks | |
US7013289B2 (en) | Global electronic commerce system | |
Doorenbos et al. | A scalable comparison-shopping agent for the world-wide web | |
US10672047B2 (en) | Intelligent multimedia e-catalog | |
CN102902738B (zh) | 使用内联上下文查询的搜索系统及方法 | |
Draheim et al. | Form-oriented analysis: a new methodology to model form-based applications | |
CN101297268B (zh) | 用于设计自动业务过程应用程序的集成系统、工具和方法 | |
CN1755683B (zh) | 上下文动作的发布 | |
US20050165789A1 (en) | Client-centric information extraction system for an information network | |
EP1232451A1 (en) | Method and apparatus for automatically updating website content | |
CN102708114B (zh) | 通过相互连接的计算机网络进行实时在线搜索处理的方法 | |
CA2379306A1 (en) | Site architectures: an approach to modeling e-commerce web sites | |
TWI280488B (en) | Online intelligent information comparison agent of multilingual electronic data sources over inter-connected computer networks | |
Aiken et al. | XML in Data Management: Understanding and Applying Them Together | |
Ceri et al. | WebML application frameworks: a conceptual tool for enhancing design reuse | |
WO2002027604A2 (en) | Method and system for performing electronic commerce | |
Jakobisiak | Programming the Web: design and implementation of a multidatabase browser | |
Daum et al. | The XML shockwave | |
Huang et al. | Web-based electronic product cataloguing | |
Silverman et al. | Buyer Decision Support Systems and Search Agents for eCommerce Websites | |
Phuavong | The study of ways to implement internet marketing | |
Alice Aegidius | A web-based application for ladies shopping store/Alice Aegidius Sitiol | |
Sølvberg et al. | Structured Analysis and Design |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C41 | Transfer of patent application or patent right or utility model | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20160527 Address after: Delaware Applicant after: Kaichuang Research Co., Ltd. Address before: Delaware Applicant before: Lingqiu Co., Ltd. |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CX01 | Expiry of patent term |
Granted publication date: 20160803 |
|
CX01 | Expiry of patent term |