CN110023982B - 用于选择产品标题的系统、方法、存储设备及介质 - Google Patents
用于选择产品标题的系统、方法、存储设备及介质 Download PDFInfo
- Publication number
- CN110023982B CN110023982B CN201780062475.5A CN201780062475A CN110023982B CN 110023982 B CN110023982 B CN 110023982B CN 201780062475 A CN201780062475 A CN 201780062475A CN 110023982 B CN110023982 B CN 110023982B
- Authority
- CN
- China
- Prior art keywords
- product
- item
- title
- feature values
- machine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0641—Shopping interfaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
描述了用于选择产品标题的系统和方法。该系统识别分别描述在基于网络的市场上出售的项目的一组项目列表。每个项目列表包括与基于网络的市场上的产品标题匹配且不相关联的产品标识符。每个项目列表还包括项目标题。该系统从项目列表中提取特征值并且处理特征值。该系统评估特征值以根据在该组项目标题中包括的项目标题采用产品标题。该系统生成包括产品标题的产品用户界面。最后,该系统通过网络传送用于在客户端机器上显示的产品用户界面。产品用户界面包括产品标题。
Description
本专利文档的公开内容的一部分包括受版权保护的材料。由于该专利文档或专利公开内容出现在专利商标局的专利文件或记录中,所以版权所有者不反对任何人对该专利文档或专利公开内容的复制再现,但是除此之外保留全部的任何版权权利。以下声明适用于下文和形成该文档的一部分的附图中所描述的软件和数据:版权2014,易贝股份有限公司,保留所有权利。
相关申请
本国际申请要求于2016年10月11日提交的题为“SYSTEMS AND METHODS TOSELECT A PRODUCT TITLE”的美国专利申请序列号 15/290,648的权益,该美国专利申请的全部内容通过引用并入本文中。
技术领域
示例实施方式通常涉及准备用于信息检索的数据的技术领域,并且在一个特定示例中,涉及配置产品标题模型以使得能够选择产品标题。
背景技术
在基于网络的市场上出售的项目可以例示特定产品。此外,还可以使用包括产品名称的产品网页将项目呈现给电子社区。
附图说明
附图中的各个附图仅示出了本公开内容的示例实施方式并且不能被视为限制其范围。
图1A示出了根据实施方式的用于选择产品标题的系统;
图1B示出了根据实施方式的用于选择产品标题的方法;
图2A示出了根据实施方式的产品标题目录;
图2B示出了根据实施方式的产品标题元素;
图3A示出了根据实施方式的产品标题模型;
图3B示出了根据实施方式的特征元素;
图4A示出了根据实施方式的标题列表;
图4B示出了根据实施方式的类别信息;
图4C示出了根据实施方式的类别元素;
图5示出了根据实施方式的类别信息;
图6示出了根据实施方式的用于选择产品标题的方法;
图7A示出了根据实施方式的用于采用产品标题的方法;
图7B示出了根据实施方式的用于评估特征值的方法;
图8示出了用于提取和处理特征值的方法;
图9示出了根据实施方式的用于训练产品标题模型的方法;
图10示出了根据实施方式的用于更新产品标题模型的方法;
图11是示出基于客户端服务器的高级网络架构的示例实施方式的框图;
图12是示出发布系统的示例实施方式的框图;
图13是示出根据实施方式的由发布系统利用的表的框图;
图14是示出根据实施方式的软件架构的框图;以及
图15是计算系统的示例形式的机器的框图,在该计算系统内可以执行用于使机器执行本文中所讨论的方法中的任何一种或更多种的一组指令。
具体实施方式
以下描述包括体现本公开内容的说明性实施方式的系统、方法、技术、指令序列和计算机器程序产品。在以下描述中,出于解释的目的,阐述了许多具体细节以便提供对本发明主题的实施方式的理解。然而,对于本领域技术人员而言,明显的是,可以在没有这些具体细节的情况下实践本发明主题的实施方式。通常,未详细地示出公知的指令实例、协议、结构和技术。
图1A示出了根据实施方式的用于选择产品标题的系统100。系统100 可以从一组项目标题中选择产品标题,该组项目标题分别与例示相同产品但先前未通过系统100与产品标题相关联的项目相关联。也就是说,制造商的产品标题尽管可用,但是不使用。而是,系统100从已由因特网上的电子社区的用户提交的一组项目标题中选择产品标题。为此,包括利用产品标题模型的机器学习算法的产品标题机器被利用来选择产品标题。可以教导机器学习算法来通过迭代地用多组项目列表来训练产品标题模型来区分所谓的“好”项目标题与“坏”项目标题,所述多组项目列表分别包括被标记为“好”或“坏”的项目标题。此外,产品标题模型可以被唯一地配置成指示产品标题机器从项目列表中提取多个且不同的项目特征和产品特征以进行处理和分析,从而使得能够更有效地选择产品标题。如在本公开内容中所阐述的那样,配置产品标题模型改进了产品标题机器的功能,因为如产品标题模型中限定的对项目特征和产品特征相关且显著的选择减少了用于选择“好”产品标题的计算资源的使用。因此,本公开内容呈现和解决的一个问题是如何配置产品标题模型以使得利用产品标题模型的产品标题机器能够有效地选择用于产品的“好”产品标题,并且其中,选择“好”产品标题是认识到在因特网上交易和通信的电子用户社区中的人类对话的起伏。
在本示例中,系统100可以包括基于网络的市场,该基于网络的市场可以从一组项目标题中选择产品标题,该一组项目标题与分别例示相同的产品但先前没有通过基于网络的市场与产品标题相关联的一组项目相关联。为此,基于网络的市场包括产品标题机器,该产品标题机器在在线模式下执行机器学习算法以从该组项目标题中选择产品标题。根据一些实施方式,机器学习算法在离线模式下利用经训练的产品标题模型。产品标题模型限定由产品标题机器分析的项目特征和产品特征以采用项目标题之一作为产品标题。项目特征可以限定从项目列表的数据提取和在所提取的数据由机器学习算法分析之前对其进行的初始处理。例如,项目特征“标题长度”可以限定从项目列表中提取项目标题以及包括对项目标题中的字符数计数的初始处理。产品特征可以限定从一组项目中的每个项目中提取的数据以及所提取的数据在由机器学习算法处理之前的初始处理。例如,产品特征“平均标题长度”可以限定从该组项目中的每个项目列表中对项目标题的提取以及下述初始处理,所述初始处理包括对所提取的项目标题中的每一个中的字符数计数并且除以该组项目列表中的项目列表数。基于网络的市场可以选择产品标题以便于在产品页面上呈现产品标题,该产品页面包括在基于网络的市场上出售并且例示相同的产品的项目。
现在更详细地描述系统100。系统100包括通过网络103与客户端机器105通信的基于网络的市场102。基于网络的市场102提供用于购买货物和服务的电子市场以及其中销售者和购买者可以彼此通信的电子论坛。为此,购买者和销售者可以操作客户端机器例如客户端机器105以与基于网络的市场102通信并且执行用于转移货物和服务(例如,项目)的交易。基于网络的市场102包括产品标题应用104、产品标题信息109和项目表 112。产品标题应用104可以包括产品标题模块106和产品标题机器108。产品标题模块106可以在没有相关联的产品标题的情况下识别项目表112 中的项目列表114、从项目列表114中提取特征值、处理所提取的特征值、调用产品标题机器108以基于经提取且预处理的特征值来采用产品标题、充实产品标题、生成包含产品标题的产品页面以及显示产品页面。产品标题机器108可以用于根据与一组项目列表对应的该组项目标题来采用产品标题。产品标题信息109包括产品标题模型110和产品标题目录111。产品标题机器108利用产品标题模型110和所提取且预处理的特征值来采用产品标题。产品标题机器108利用在产品标题模型110中存储的学习结果来采用产品标题。产品标题机器108在离线训练模式下操作时存储学习结果。产品标题目录111将产品标识符与产品标题相关联。项目表112存储描述在基于网络的市场102上出售的项目的项目列表114。
基于网络的市场102还被示出为通信地耦接至数据库116和第三方机器118。基于网络的市场102可以利用数据库116来持久地存储产品标题信息109、项目表112和其他数据结构。根据另一实施方式,第三方机器 118可以被基于网络的市场102用作项目列表114的替选源以选择产品标题。此外,根据另一实施方式,第三方机器118可以执行产品标题应用104 以选择产品标题。
产品页面120包括产品标题122、产品描述符124和例示特定产品的项目126。产品标题应用104可以用于与产品标识符(例如,国际标准书号(ISBN))相关联地生成产品标题122。例如,产品页面120包括产品标题122“第三代APPLE IPOD TOUCH”以及描述产品变化的产品描述符“产品变化”、提供买进选项诸如拍卖、购买等的“买进选项”和描述产品可用的最佳交易的“最佳交易”。
图1B示出了根据实施方式的用于选择产品标题的方法130。更详细地描述了用于选择产品标题的方法130。在操作132处,产品标题模块106 可以识别项目表112中的一组项目列表114。产品标题模块106将每个项目列表识别为包括与基于网络的市场102上的产品标题122不相关联的特定产品标识符。在操作134处,产品标题模块106从该组项目列表中提取项目特征值和产品特征值并且预处理所提取的特征值。在操作136处,产品标题机器108利用机器学习算法来分析所提取且预处理的特征值以根据该组项目列表114中的项目标题采用产品标题122。机器学习算法利用先前已经在离线模式下训练的产品标题模型110以使得机器学习算法能够采用“好”产品标题。产品标题模型110限定和加权用于选择产品标题122 的项目特征和产品特征。在操作138处,产品标题模块106可以充实所选择的产品标题122。例如,产品标题模块106可以在产品标题的特定单词中将字母的书写体从小写体改为大写体(例如,“ebay”=“eBay”)以充实产品标题。也可以执行其他充实。在操作140处,产品标题模块106可以生成包括产品标题122的产品页面120。在操作142处,产品标题模块 106可以通过网络传送用于在客户端机器105的显视器上显示的产品页面 120。
图2A示出了根据实施方式的产品标题目录111。产品标题目录111 可以包括产品标题元素200,产品标题元素200被产品标题应用104用于识别产品标题122是否已被采用。
图2B示出了根据实施方式的产品标题元素200。产品标题元素200 可以包括产品标题122和产品标识符202。产品标题122可以包括字母、数字或特殊字符的串以形成产品标题122。例如,产品标题122可以从项目列表114的项目标题中提取,并且可以可选地充实产品标题122以如图 1A所示地显示在产品页面120上。在一些情况下,产品标题122可能未被初始化,从而表示尚未针对相关联产品标识符202选择产品标题122。例如,产品标题122可以包含表示尚未针对相关联产品标识符202选择产品标题122的空值(“0”)。
产品标识符202可以包括产品标识符类型和产品标识符值。产品标识符类型表征产品标识符的特定方案。例如,产品标识符类型可以包括:通用产品代码(UPC)、欧洲物品编号(EAN)、日本物品编号(JAN)、ISBN、制造商部件编号(MPN)等。产品标识符值唯一地标识产品标识符类型的产品。例如,“123456”的产品标识符值可以唯一地标识UPC产品。
图3A示出了根据实施方式的产品标题模型110。产品标题模型110 可以被产品标题机器108用于采用产品标题。根据一些实施方式,产品标题模型110还可以存储在训练模式下获取的学习知识。产品标题模型110 可以包括定义由产品标题机器108分析的特征的多个特征元素300。
图3B示出了根据实施方式的特征元素300。特征元素300可以包括特征标识符302、特征类型信息304、值类型信息306、特征列表信息308、特征权重信息310和特征状态信息312。特征标识符302唯一地标识产品标题模型110中的特征元素300。特征类型信息304表示特征是“项目特征”还是“产品特征”。“项目特征”限定表征特定项目列表114的特征值。产品特征限定与该组项目列表(例如,产品)相关地表征特定项目列表114 的特征值。值类型信息306存储特征元素是否是布尔(Boolean)、类别或连续。布尔表示具有TRUE或FALSE、PASS或FAIL等的值的特征元素 300。类别表示预定值形式的特征元素300。例如,预定特征“颜色”可以与“红色”、“绿色”、“蓝色”等的预定值相关联。连续表示数字形式的特征元素300。例如,特征“平均字符数”可以表示为数字“33”。
特征列表信息308限定从项目列表114中对数据的提取和对所提取的数据的预处理以生成布尔、类别或连续形式的特征值。特征值可以被机器学习算法用于选择产品标题。
下面提供示例特征列表信息308的非穷举列表。表1至表4描述了项目特征的示例以及表5提供了产品特征的示例。
表1描述如下项目特征,其限定从项目列表114中对项目标题114的提取以及对项目标题400的预处理以生成布尔。布尔可以随后被产品标题机器108用于采用产品标题122。
表1-项目特征-标题提取,布尔
如果项目标题400中的所有字符是大写体或小写体,则特征“1”(例如,特征ID“1”)导致PASS。因此,因为示例中的所有字符“g debr g debrekht kodiak family ornament”是小写体,所以针对该示例生成PASS。
如果在项目标题400中未找到数量记号,则特征“2”导致PASS。因此,因为示例“一组3个Sak”包括数量记号(例如,“一组3个”),所以生成FAIL。
如果在项目标题400中未找到(一个或多个)条件记号,则特征“3”导致PASS。因此,因为示例项目标题400“极不稳定克莱德女装尺寸6黑色时尚膝盖高靴新/展示”包括条件记号“新/展示”,所以生成FAIL。
如果在项目标题400中未找到复制的记号,则特征“4”导致PASS。因此,因为示例项目标题400“G.卢米斯本土运营GLX飞杆和斯佩杆 FR1147 4GLX”包括复制的记号“GLX”和“GLX”,所以生成FAIL。
如果在项目标题400中没有找到显示套装的记号,则特征“5”导致 PASS。因此,因为示例项目标题400“具有16-50mm或18-55mm镜头的富士X-A1 X-E1 X-E2 X-M1 X-T1的必备套装”包括显示套装的记号 (“必备套装”),所以生成FAIL。根据实施方式,可以基于记号套装列表来识别记号是否显示套装。例如,如果项目标题400中没有记号与记号套装列表中的记号匹配,则特征“5”导致PASS。
如果在项目标题400中没有找到关键字填充,则特征“6”导致PASS。因此,因为示例项目标题400“梅西弗格森拖拉机3140 360 3645 364s 3655 396的燃料关闭”包括关键字“3140”、“360”、“3645”、“364s”、“3655”和“396”,所以生成FAIL。根据实施方式,可以基于关键字填充列表来识别记号是否显示填充。例如,如果项目标题400中没有记号与关键字填充列表中的记号匹配,则特征“6”导致PASS。
表2描述如下项目特征,其限定从项目列表114中对项目标题114的提取以及对项目标题的预处理以生成布尔。布尔可以随后被产品标题机器 108用于采用产品标题122。
表2-项目特征-标题提取,布尔(续)
如果在标题中未找到运输记号,则特征“7”导致PASS。因为示例项目标题400“10'x10'说唱宅邸与汽车组合嘻哈背景的背景幕免费运输到......”包括运输记号“免费运输”,所以生成FAIL。
如果在项目标题400中没有找到“缺失数据”,则特征“8”导致PASS。根据实施方式,可以基于所需数据列表来定义项目标题400是否显示“缺失数据”。例如,如果项目标题400中的记号与所需数据列表中的记号匹配,则特征“8”导致PASS。在该示例中,因为示例项目标题400“梅洛青铜的泰勒三灯挂件架”不包括与所需品牌数据列表中的至少一个记号匹配的记号,所以结果是FAIL。
如果在标题中没有找到价格,则特征“10”导致PASS。由于示例项目标题400“标准地平线GX1300B日蚀超紧凑型固定架VHF黑色$30折扣”包括记号“$10.00”,因此生成FAIL。
如果在项目标题400中没有找到描述性词语,则特征“11”导致PASS。由于示例项目标题400“最佳哈利贝拉方特-哈利贝拉方特743217894825 (用得非常好的CD)”包括记号“最佳”,因此返回FAIL。由于在项目标题400中找到记号“非常好”,因此也可能生成FAIL。例如,可以基于包括被表征为“描述性”的词语的列表来识别描述性词语。
表3描述如下项目特征,其至少限定从项目列表114中对数据的提取。特征“12”、“13”和“14”限定从项目列表114中提取到的不同类型的数据。此外,项目特征“12”和“13”与预处理不相关联而是被产品标题机器108用作类别的形式的简单提取。特征“14”限定所提取到的数据的进一步预处理以便还生成类别的形式的特征值。每个类别可以随后被产品标题机器108用于采用产品标题122。
表3-项目特征、类别提取-类别
特征“12”导致提取元类别。从项目列表114中的类别信息420的元类别位置中提取元类别。示例元类别“ebay”是从图5所示的类别信息420 (例如,“eBay/电子/汽车电子/汽车音响”)中提取的。
特征“13”导致提取叶类别。从项目列表114中的类别信息420的叶类别位置中提取叶类别。示例叶类别“汽车音响”是从图5所示的类别信息420(例如,“eBay/电子/汽车电子/汽车音响”)中提取的。
特征“14”导致识别成组标识符。特征14限定从项目列表114中对项目标题400的提取以及如下初步处理,该初步处理包括:对项目标题400 中的字符数进行计数,将该字符数分别与分别与由预定值(例如,“A”、“B”、“C”、“D”或“E”)指定的成组相关联的一组字符范围(例如,01 至10个字符)进行比较以识别特定成组,以及识别所匹配的成组。因为标题“Samsung Galaxy Note Edge SM-N915A”具有三十三个字符并且三十三个字符是与“成组“D””相关联的长度,所以“成组“D””被识别为所匹配的成组。
表4描述如下项目特征,其限定从项目列表114中对项目标题400的提取以及预处理以生成数值形式的特征值。数值可以随后被产品标题机器 108用于采用产品标题122。
表4-项目特征-标题提取-数值
特征“15”导致生成标题大小。特征15限定从项目列表114中对项目标题400的提取以及包括对标题中的字符数计数的初步处理。针对示例项目标题400“Samsung GalaxyNote Edge SM-N915A”,标题大小被计数为三十三。
表5描述生成数值形式的连续特征值的产品特征,所述连续特征值描述特定项目列表与包括产品的一组项目列表114的比较。
表5-项目特征-标题-连续
特征“16”生成通过将项目标题400的大小除以与产品相关联的平均大小而计算的比率。特征16限定从包括产品的一组项目列表114中对项目标题400(例如,“SamsungGalaxy Note Edge SM-N915A”、“Samsung Note Edge SM-N915A”、“Samsung Galaxy NoteSM-N915A”)的提取以及下述初步处理,所述初步处理包括:对项目标题400中的每一个中的字符数进行计数,基于字符数计算产品平均标题大小,以及将与特定项目列表114 相关联的项目标题400的大小除以产品标题平均大小。例如,在项目标题 400“Samsung GalaxyNote Edge SM-N915A”中计数三十三个字符,在项目标题400“Samsung Note Edge SM-N915A”中计数二十六个字符,以及在项目标题400“Samsung Galazy Note SM-N915A”中计数二十八个字符。平均产品标题大小被计算为二十九个字符(例如,33+26+28=29)。可以选择第二项目标题400“Samsung Note Edge SM-N915A”作为试验。第二项目标题400具有二十六个字符并且被除以二十九个字符的产品标题平均大小。因此,计算由机器学习算法针对第二项目标题400使用的产品特征值(26/29=0.896)。
特征“17”生成通过将来自项目列表114的价格(例如,“项目价格”) 180除以与产品相关联的平均价格(例如,“产品平均价格”)而计算的比率。特征17限定从一组项目列表114(例如,产品)中的三个项目列表 114中对价格408(例如,$1.00、$2.00、$3.00)的提取以及下述初步处理,所述初步处理包括:基于三个已提取的价格408计算产品平均价格,以及将与特定项目列表114相关联的价格408除以产品标题平均价格。例如,将提供的示例价格的平均产品价格计算($1.00+$2.00+$3.00)/3=$2.00) 为$2.00。可以选择$1.00的第一价格408作为试验。因此,计算由机器学习算法针对价格408$1.00使用的产品特征值($1.00/$2.00=0.50)。
图6示出了生成布尔特征值的产品特征。
表5-产品特征-标题-布尔
特征“18”针对包含第一最频繁记号的项目标题生成PASS。特征18 限定从包括产品的项目列表114中对项目标题400(例如,“狗棕色”、“猫棕色”、“鹦鹉红色”)的提取以及下述初步处理,所述初步处理包括:生成记号频率矩阵,以及响应于识别特定项目标题400作为包括包含最频繁使用的记号的记号而返回PASS。例如,考虑从表6中的示例项目标题400生成的下面的记号/频率矩阵。
表6-记号/频率矩阵
记号 | 频率 |
棕色 | 2 |
红色 | 1 |
狗 | 1 |
猫 | 1 |
鹦鹉 | 1 |
因此,因为“棕色”与最高记号频率相关联,所以由机器学习算法针对项目标题400“狗棕色”和项目标题“猫棕色”使用的产品特征值是PASS,但是因为“鹦鹉”和“红色”都与最高的记号频率不相关联,所以项目标题400“鹦鹉红色”是FAIL。
如果项目标题400包含第二最频繁使用记号,则特征“19”生成PASS。特征19限定与特征18类似的提取和处理,但是响应于第二最频繁使用的记号的识别而返回PASS。因此,因为三个项目标题400中的每一个包含被识别为第二最频繁使用的记号(例如,“红色”、“狗”、“猫”、“鹦鹉”) 的记号,所以机器学习算法针对项目标题400“狗棕色”、项目标题400 “猫棕色”或项目标题400“鹦鹉红色”使用的产品特征值是PASS。
特征权重信息310存储用于计算项目列表114中的项目标题400的项目标题分数的权重。产品标题机器108可以响应于学习结果而增加或减少权重。例如,产品标题机器108可以将权重从“10”增加到“20”以增加对应的特征元素300在计算项目标题分数中的重要性。此外例如,产品标题机器108可以将权重从“30”减少到“10”以减少特征元素300在计算项目标题分数中的重要性。作为另一示例,产品标题机器108可以通过在特征元素300的特征权重信息310中存储“0”来表示特征元素300与选择产品标题122无关。
特征状态信息312表示特征元素300的状态。例如,状态可以表示特征元素300是被添加(例如,新)的、现有的(现有)或被移除(移除) 的。
图4A示出了根据实施方式的项目列表114。项目列表114描述在基于网络的市场102上出售的项目。项目列表114可以由销售项目的销售者来输入。项目列表114可以包括项目标题400、项目体信息401和项目特定信息423。项目标题400、项目体信息401和项目特定信息423可以由产品标题元素200识别以被产品标题机器108用于采用产品标题122。例如,产品标题元素200可以确定从项目标题400、项目体信息401和/或项目特定信息423对数据的特定提取以及可选地预处理以采用产品标题 122。
项目标题400是用于项目的标题。项目体信息对于所有类型的项目是共同的,并且项目体信息包括:项目描述402、结构化信息404、项目的图像406、购买项目的价格408、包括项目的当前最高出价的出价410、表示项目列表114可以在类别的可导航的层次中被找到的一个或更多个类别的类别信息420、以及产品标识符202。项目标题400是项目列表114 的标题,并且可以由产品标题机器108采用以进行可能的充实作为产品标题122。项目描述402可以包括描述项目的字母数字文本。结构化信息404 可以包括一个或更多个属性-值对。例如,可以从销售者接收结构化信息“颜色=蓝色”以识别由项目列表114描述并在基于网络的市场102上出售的项目的颜色。此外,例如,可以以训练标记424(例如,标签)的形式从操作者接收结构化信息404“项目标题=好”或“项目标题=坏”以训练以下机器学习算法:项目列表114中的项目标题400对于项目列表114 中的产品标识符202是“好”或“坏”项目标题400。以类似的方式,其他结构化信息404可以由基于网络的市场102自动生成或者从用户(例如,销售者)接收。先前描述了产品标识符202。项目特定信息423存储针对项目类型唯一的信息。例如,电子设备包括特定于电子设备的项目特定信息423。例如,项目特定信息423可以包括一定量的存储器、类型微处理器等。相比之下,汽车具有包括轮胎、引擎尺寸、加速度测量结果等的特定于汽车的项目特定信息423。
图4B示出了根据实施方式的类别信息420。类别信息420可以包括一个或更多个类别元素422。一个或更多个类别元素可以分别与包括类别层次的路径中的域对应。例如,路径“eBay/电子/汽车电子/汽车音响”包括分别与域“eBay”、“电子”、“汽车电子”和“汽车音响”对应的四个类别元素。
图4C示出了根据实施方式的类别元素422。类别元素422可以包括类别类型标识符426、类别标识符426和类别名称428。类别类型标识符 426可以标识类别元素422在类别层次中的位置。例如,类别元素422“站点类别”表示站点域(例如,eBay),类别元素422“元类别”表示紧临“站点类别”之下的域,类别元素422“子元类别”表示“元类别”与“叶类别”之间的类别,以及类别元素422“叶类别”表示“元类别”下面的类别,并且可能包含项目列表114。类别名称428包括类别的名称(例如,“eBay”)。
图5示出了根据实施方式的类别层次500。类别层次500示出了路径“eBay/电子/汽车电子/汽车音响”。类别“eBay”是站点类别,因为它标识了网站。类别“电子产品”是元类别。类别“汽车电子”是子元类别。类别“汽车音响”是叶类别,因为它可以包括项目列表114。
图6示出了根据实施方式的用于选择产品标题的方法600。方法600 在操作602处从以下开始:产品标题模块106识别一组项目列表114以用于选择产品标题122。例如,产品标题模块106可以扫描产品标题目录111 以识别与产品标题122不相关联的产品标识符202。此外,产品标题模块 106可以扫描项目表112以识别与已识别的产品标识符202匹配的一组项目列表114。仅仅例如,产品标题模块106可以识别具有产品标识符202 的一组500个项目列表114,该产品标识符202被识别为与产品标题122 不相关联。
在操作604处,产品标题模块106从项目列表114中提取特征值,并且可选地,预处理所提取的特征值。特征值包括项目特征值和产品特征值。通过图8所示的方法800进一步描述操作604。
在操作608处,产品标题模块106调用产品标题机器108以采用产品标题122。例如,产品标题模块106可以利用所提取的预处理的项目特征值、所提取的预处理的产品特征值和产品标题模型110来调用产品标题机器108。通过图7A所示的方法700进一步描述操作608。
在操作610处,产品标题模块106充实已选择的产品标题122。充实可以包括将大写体印字或小写体印字应用于产品标题122中的字母。例如,产品标题模块106可以使产品标题122“用于销售的ipod音乐播放器”充实成“用于销售的iPod音乐播放器”。在另一示例中,产品标题模块106 可以使产品标题122“用于销售的IPOD音乐播放器”充实成“用于销售的iPod音乐播放器”。可以使得产品标题模块106能够通过扫描项目表112 中的项目列表114来识别特定记号中的字母的所有可能的书写体并通过选择记号中的每个字母的最频繁的书写体形式来确定记号中的字母的真实书写体。此外,产品标题模块106可以利用国家标识符(例如,美国、德国、法国、意大利等)来识别特定记号中的字母的国家特定书写体。例如,可以基于表示德国域(例如,eBayGermany)的类别元素422“站点类别”来识别国家标识符。此外,例如,可以利用德国的国家标识符将产品标题 122从“Deutsche Bank ag”增强成“Deutsche Bank AG”,其中字母“AG”表示根据德国习惯的合并公司。因此,产品标题模块106可以执行特定于国家的充实。此外,产品标题模块106可以通过添加品牌来增强产品标题 122。例如,产品标题模块106可以将产品标题122“用于销售的iPod音乐播放器”充实成“用于销售的Apple iPod音乐播放器”,其中,品牌名称“Apple”被添加到产品标题122。此外,产品标题模块106可以通过添加模型来增强产品标题122。例如,产品标题模块106可以将产品标题122 “用于销售的Apple ipod音乐播放器”充实成“用于销售的Apple iPod音乐播放器-第七代”,其中,模块“第7代”被添加到产品标题122。
在操作612处,产品标题模块106可以生成包括产品标题122的产品页面120。例如,可以生成图1A上所示的产品页面120。
在操作614处,产品标题模块106可以通过网络传送用于在客户端机器105的显视器上显示的产品页面120。例如,可以传送图1A上所示的产品页面120。
图7A示出了根据实施方式的用于采用产品标题122的方法700。方法700在操作702处从以下开始:产品标题机器108接收项目特征值、产品特征值、一组项目列表114和产品标题模型110。例如,产品标题机器 108可以接收项目特征值和产品特征值、用于生成特征值的一组五百个项目列表114、以及先前训练的产品标题模型110。
在操作704处,产品标题机器108可以选择机器学习算法。例如,产品标题机器108可以基于管理员选择的配置参数来选择机器学习算法。机器学习算法可以包括支持向量机(SVM)分类器、线性编程算法、回归算法、神经网络算法、随机森林算法、决策树算法等。
在操作706处,产品标题机器108利用产品标题模型110来分析所提取的且可选地预处理的项目特征值以及经提取且预处理的产品特征值以生成项目列表114中的每一个的项目标题分数。在本示例中,产品标题机器108可以生成五百个项目列表114中的每一个的项目标题分数。例如,产品标题机器108可以通过根据如图7B所示的方法720评估与该组项目列表114中的项目标题400中的每一个相关联的项目特征值和产品特征值来生成项目标题分数。此外,如图9所示,在方法900中描述产品标题模型110的训练。
返回图7A,在操作708处,产品标题机器108将具有最高项目标题分数的项目标题400识别为产品标题122,并且将产品标题122与产品标识符202相关联地存储在产品标题目录111中。例如,产品标题机器108 可以将第125个项目列表114中的项目标题400“第三代Apple iPod Touch”识别为与最高项目标题分数相关联,并且将项目标题400作为产品标题122与产品标识符202(例如,UPC 123456)相关联地存储在产品标题目录111中。
图7B示出了用于评估特征值的方法720。方法720在操作722处从以下开始:产品标题模块106递增到下一特征元素300。在本示例中,产品标题模块106递增到产品标题模型110中的第一特征元素300。因此,特征元素300被登记为当前的特征元素300。
在操作724处,产品标题模块106递增到该组项目列表114中的下一项目列表114。在本示例中,产品标题模块106递增到该组五百个项目列表114中的用于识别产品标题122的第一项目列表114。因此,第一项目列表114被登记为当前的项目列表114。
在操作726处,产品标题模块106检索先前针对项目列表114生成的特征值。例如,图6中的操作604可以基于特征列表信息308对项目列表 114执行提取和初步处理。在某些情况下,进一步执行预处理以生成项目特征值。在产品特征的情况下,预处理可以基于基于产品的所有项目列表 114而生成的值。回到图7B。
在操作728处,产品标题模块106更新与当前项目列表114的项目标题400相关联的项目标题分数。产品标题机器108可以利用产品标题模型 110中保存的学习结果来更新项目标题分数。例如,产品标题机器108可以以训练产品标题模型110时保存的特征权重信息310的形式利用学习结果。
在决策操作730处,产品标题模块106识别是否存在更多项目列表 114。如果存在更多项目列表114,则产品标题模块106分支到操作724。否则,产品标题模块106分支到决策操作732。
在决策操作732处,产品标题模块106识别是否存在更多特征元素 300。如果存在更多特征元素300,则产品标题模块106分支到操作722。否则,在处理图7A上的操作706处继续。
图8示出了用于提取和处理特征值的方法800。方法800在操作802 处从以下开始:产品标题模块106递增到下一特征元素300。在本示例中,产品标题模块106递增到产品标题模型110中的第一特征元素300。因此,第一特征元素300被登记为当前的特征元素300。
在操作804处,产品标题模块106递增到该组项目列表114中的下一项目列表114。在本示例中,产品标题模块106递增到一组五百个项目列表114(例如,产品)中的用于识别产品标题122的第一项目列表114。因此,第一项目列表114被登记为当前的项目列表114。
在操作806处,产品标题模块106根据所识别的特征元素300从项目列表中提取数据。例如,产品标题模块106可以如前所述基于特征列表信息308从项目列表114中提取数据。
在操作808处,产品标题模块106可以基于所提取的数据执行初步处理。例如,产品标题模块106可以如前所述基于特征列表信息308可选地执行初步处理。
在决策操作810处,产品标题模块106识别是否存在更多项目列表 114。如果存在更多项目列表114,则产品标题模块106分支到操作804。否则,产品标题模块106分支到决策操作811。
在决策操作811处,产品标题模块106识别当前的特征元素300是指向产品特征还是项目特征。例如,产品标题模块106可以基于针对当前特征元素300存储的特征类型信息304来识别当前特征元素300指向产品特征。如果当前的特征元素300指向产品特征,则产品标题模块106分支到操作813。否则,产品标题模块106分支到决策操作812。
在操作813处,产品标题模块106执行初步处理以生成该组五百个项目列表114(例如,产品)中的项目列表114中的每一个的产品特征值。
在决策操作812处,产品标题模块106识别是否存在更多特征元素 300。如果存在更多特征元素300,则产品标题模块106分支到操作802。否则,处理在图6的操作604处或图9的操作906处继续。
项目特征的示例
在方法800中,产品标题模块106可以从项目列表114中提取项目特征值并且预处理所提取的值以生成经提取且预处理的项目特征值。经处理的项目特征值可以包括布尔值、类别值或连续值。
例如,产品标题模块106可以基于项目标题400中存在的“条件”生成项目特征布尔值。继续该示例,在操作806处,产品标题模块106可以从在该组项目列表114(例如,包括产品的五百个项目列表114)中的当前的项目列表114中提取项目标题400。此外,在操作808处,产品标题模块106可以解析当前的项目标题400以识别表达条件的记号(例如,“旧”、“新”、“已使用”等)是否存在于项目标题400中,并且根据所识别的条件(例如,“是条件”或“不是条件”)断定布尔值(“PASS”、“FAIL”)。
产品标题机器108随后评估用于表示在当前的项目标题400中是否存在“条件”(例如,参见图7B所示的方法720)的项目特征布尔值以生成 /更新相关联项目列表114的项目标题分数。
项目特征的示例
在方法800中,产品标题模块106可以从项目列表114中提取产品特征值并且预处理所提取的产品特征值以生成(一个或多个)提取的、预处理的特征值。经处理的产品特征值可以包括布尔、类别或连续产品特征值。
例如,产品标题模块106可以生成下述比率的形式的经处理的产品特征值,该比率测量项目标题400的字符数(例如“标题大小”)与产品的“平均字符数”(例如“产品标题平均大小”)的比较。继续具体示例,在操作806处,产品标题模块106可以从当前的项目列表114中提取项目标题400。此外,在操作808处,产品标题模块106可以解析当前的项目标题400以识别项目标题400中的字符数。此外,在操作813处,产品标题模块106对每个项目标题400(例如,包括产品的五百个项目列表114的项目标题400)的字符数进行求和以生成该组项目列表114(例如,产品) 的总字符数,通过将总字符数除以项目列表114的数目来计算产品的“平均字符数”,以及通过将每个项目列表400中的字符数除以“平均字符数”来计算该组项目列表114中的每个项目标题400的比率。
产品标题机器108随后评估下述比率的形式的产品特征值以生成/更新与项目列表114相关联的项目标题分数,该比率是表示测量项目标题 400的字符数与产品的“平均字符数”的比率(例如,参见图7B所示的方法720)。
图9示出了根据实施方式的用于训练产品标题模型110的方法900。方法900在操作902处从以下开始:产品标题模块106接收一组项目列表 114以用于选择产品标题122和用于训练的产品标题模型110。例如,管理员可以识别一组项目列表114并且用训练标记425(例如,训练标签) 来标记项目列表中的每一个。训练标记425指示特定项目列表114中的项目标题400是“好”还是“坏”。例如,管理员可以将训练标记425“训练=好”存储在项目列表114的结构化信息404中,该项目列表114包括管理员认为其例示了用于命名产品(例如,一组项目列表)的“好”项目标题400的项目标题400。此外例如,管理员可以将训练标记425“训练=坏”存储在项目列表114的结构化信息404中,该项目列表114包括管理员认为其例示了用于命名产品(例如,一组项目列表)的“坏”项目标题400 的项目标题400。
在操作904处,产品标题模块106从项目列表114中提取特征值,并且可选地,预处理所提取的特征值。特征值包括项目特征值和产品特征值。通过根据实施方式的如图8所示的方法800进一步描述操作904。
在操作906处,产品标题模块106调用产品标题机器108以采用产品标题122。例如,产品标题模块106可以利用所提取的预处理的项目特征值、所提取的预处理的产品特征值和产品标题模型110来调用产品标题机器108。通过根据实施方式的图7A所示的方法700进一步描述操作608。
在操作908处,产品标题模块106根据所选择的产品标题122更新产品标题模型110。例如,产品标题模块106可以根据其促进选择“好”或“坏”产品标题122的能力来更新特征元素300的特征权重信息310。如图10所示,通过方法1000进一步描述操作908。方法900可以用不同组的项目列表114(例如,产品)迭代若干次以训练产品标题模型110。
图10示出了根据实施方式的用于更新产品标题模型110的方法1000。方法1000在操作1002处从以下开始:产品标题模块106递增到下一特征元素300。在本示例中,产品标题模块106递增到产品标题模型110中的第一特征元素300。因此,第一特征元素300被登记为当前的特征元素300。
在操作1004处,产品标题模块106更新产品标题模型110。例如,产品标题模块106可以存储特征权重信息310。增加特征权重信息310使得特征元素300有助于生成值较大的项目标题分数。减少特征权重信息310 使得特征元素300有助于生成值较小的项目标题分数。
在操作1006处,产品标题模块106识别产品标题模型110中是否存在更多特征元素300。如果存在更多特征元素300,则产品标题模块106 分支到操作1002。否则,处理在图9上的操作908处继续。
图11示出了根据实施方式的网络架构1100。网络-服务器侧功能的示例形式的联网系统1102经由通信网络1104(例如,因特网、无线网络、蜂窝网络或广域网(WAN))耦接至一个或更多个客户端设备1110和1112。联网系统1102与图1A中的系统100对应,通信网络1104与图1A中的网络103对应,以及客户端设备1110和1112与图6中的客户端机器105对应;因此,除非另有说明,否则相同或相似的参考标记用于表示相同或相似的特征。图11示出了例如经由浏览器(例如,由华盛顿州雷蒙德市的微软公司开发的INTERNET浏览器)操作的web客户端1106 以及在各个客户端设备1110和1112上执行的编程客户端1108。
网络架构1100可以用于执行本文档中描述的任何方法。客户端设备1110和1112可以包括移动电话、台式计算机、膝上型电脑或用户可以用来访问联网系统1102的任何其他通信设备。在一些实施方式中,客户端设备1110可以包括显示模块(未示出)以(例如,以用户界面的形式) 显示信息。在其他实施方式中,客户端设备1110可以包括以下中的一个或更多个:触摸屏、加速度计、相机、麦克风和全球定位系统(GPS)设备。客户端设备1110和1112可以是用户用于执行涉及联网系统1102内的数字货物的交易的设备。在一个实施方式中,联网系统1102是以下基于网络的市场,该基于网络的市场管理数字货物,发布包括在基于网络的市场上可用的产品的项目列表的发布,以及管理对这些市场交易的支付。另外,外部站点1128、1128'可以是经由网络1104耦接至联网系统1102的站点。外部站点可以是包括电子商务系统的任何期望系统。
应用程序接口(API)服务器1114和web服务器1116耦接至一个或更多个应用服务器1118,并且分别向一个或更多个应用服务器1118提供程序和web接口。(一个或多个)应用服务器1118托管发布系统1200和支付系统1122,它们中的每一个可以包括一个或更多个模块、应用或引擎,并且它们中的每一个可以体现为硬件、软件、固件或其任何组合。应用服务器1118进而耦接至便于访问一个或更多个信息存储库或(一个或多个) 数据库1126的一个或更多个数据库服务器1124。在一个实施方式中,数据库1126是存储要向发布系统1200公布的信息(例如,发布或列表)的存储设备。根据示例实施方式,数据库1126还可以存储数字货物信息。
在示例实施方式中,发布系统1200在网络(例如,因特网)上发布内容。这样,发布系统1200向访问联网系统1102的用户提供许多发布和市场功能和服务。结合图12更详细地讨论发布系统1200。在示例实施方式中,根据在线市场环境,讨论发布系统1200。然而,注意,发布系统 1200可以与非市场环境诸如信息(例如,搜索引擎)或社交网络环境相关联。
支付系统1122向用户提供多种支付服务和功能。支付系统1122使得用户能够在他们的账户中累积值(例如,以商业货币例如美元,或者专有货币例如积分、里程或私人实体提供的其他形式的货币),并且然后能够兑换经由发布系统1200或网络1104上的其他地方可用的产品(例如,货物或服务)的经累积的值。支付系统1122还便于通过支付机制(例如,银行账户、PayPalTM或信用卡)进行支付,以便经由任何类型和形式的基于网络的市场购买项目。
虽然图11中示出了发布系统1200和支付系统1122共同形成联网系统1102的一部分,但是应当理解,在替选实施方式中,支付系统1122可以形成独立且不同于联网系统1102的支付服务的一部分。另外,虽然图 11的示例网络架构1100采用客户端-服务器架构,但是本领域技术人员将认识到本公开内容不限于这样的架构。示例网络架构1100可以同样好地在例如分布式或对等(peer-to-peer)架构系统中找到应用。发布系统1200 和支付系统1122还可以实现为在单独的硬件平台下操作的独立系统或独立软件程序,其不一定具有网络功能。
现在参照图12,示出了示出在一个实施方式中在联网系统1102的发布系统1200内提供的多个部件的示例框图。在该实施方式中,发布系统 1200是市场系统,其中可以提供项目(例如,货物或服务)以供销售并且还实现本文描述的用于交互式查询生成和细化的特征。项目可以包括数字货物(例如,货币、许可权)。发布系统1200可以托管在专用或共享服务器机器(未示出)上,这些服务器机器被通信地耦接以能够实现服务器机器之间的通信。多个部件本身(例如,经由适当的接口)被直接或间接地彼此通信地耦接并且耦接至各种数据源,以使得信息能够在部件之间传递或者使得部件能够共享和访问公共数据。此外,如图11所示,部件可以经由一个或更多个数据库服务器1124访问一个或更多个数据库1126。
返回至图12,发布系统1200提供许多发布、列表和价格设定机制,由此购买者可以列出(或发布)与用于销售的货物或服务有关的信息,购买者可以表达兴趣或表示期望以购买这样的项目或服务,并且可以针对与项目或服务有关的交易设定价格。为此,发布系统1200可以包括至少一个发布引擎1202和一个或更多个拍卖引擎1204,该一个或更多个拍卖引擎1204支持拍卖格式列表和价格设定机制(例如,英语、荷兰语、中文、双重、反向拍卖等)。
定价引擎1206支持各种价格列表格式。一种这样的格式是固定价格列表格式(例如,传统的分类广告类型列表或目录列表)。另一种格式包括买断型列表。买断型列表(例如,由加利福尼亚州圣何塞的eBay公司开发的“立即购买”(BIN)技术)可以与拍卖格式列表一起提供并且使得购买者能够以通常高于项目拍卖的起始价格的固定价格购买货物或服务,该货物或服务也通过拍卖出售。
商店引擎1208使得购买者能够对“虚拟”商店内的列表进行分组,该“虚拟”商店可以通过购买者进行品牌化和针对购买者以其他方式进行个性化。这样的虚拟商店还可以提供针对购买者特定和个性化的促销、激励和特征。在一个示例中,销售者可以提供多个项目作为虚拟商店中的“立即购买”项目,提供用于拍卖的多个项目,或者两者的组合。
信誉引擎1210使得交易的用户利用联网系统1102能够确立、建立和维护信誉。这些信誉可以是可用的并且发布给潜在的交易伙伴。根据一个实施方式,因为发布系统1200支持未知实体之间的人至人交易,所以用户另外可能不具有历史或其他参考信息,由此可以评估潜在交易伙伴的可信度和信用度。信誉引擎1210使得用户例如通过由一个或更多个其他交易伙伴提供的反馈能够随时间推移在基于网络的市场102内建立信誉。其他潜在的交易伙伴可以然后参考信誉以评估信用度和可信度。
导航引擎1212可以促进基于网络的市场102的导航。例如,导航引擎1212的浏览模块(未示出)使得用户能够根据在发布系统1200内哪些列表可以被分类来浏览各种类别、目录或库存数据结构。可以提供导航引擎1212内的各种其他导航应用以补充浏览应用。
为了使经由联网系统1102可用的列表尽可能在视觉上有启发性和吸引力,发布系统1200可以包括成像引擎1214,该成像引擎1214使得用户能够上传用于包含在发布中的图像并且能够将图像合并到所查看的列表中。成像引擎1214还可以接收来自用户的图像数据作为搜索查询,并且利用该图像数据来识别由该图像数据描绘或描述的项目。
列表创建引擎1216使得用户(例如,销售者)能够方便地创作项目列表。在一个实施方式中,列表涉及用户(例如,销售者)希望经由发布系统1200进行交易的货物或服务。在其他实施方式中,用户可以创建如下列表,其是广告或其他形式的发布。
列表管理引擎1218使得用户能够管理这样的列表。具体地,在特定用户已经创作或发布大量列表的情况下,这样的列表的管理可能提出挑战。列表管理引擎1218提供许多特征(例如,自动重新列表、库存水平监视器等)以帮助用户管理这样的列表。
列表后管理引擎1220还帮助用户进行通常在列表后发生的许多活动。例如,在完成由一个或更多个拍卖引擎1204促成的交易时,购买者可以希望留下与特定销售者有关的反馈。为此,列表后管理引擎1220提供到信誉引擎1210的接口以使得购买者能够方便地向信誉引擎1210提供与多个销售者有关的反馈。另一列表后动作可以是售出项目的运输,由此列表后管理引擎1220可以帮助打印运输标签、估计运输成本和建议运输承运人。
搜索引擎1222执行搜索联网系统1102中与查询匹配的发布。在示例实施方式中,搜索引擎1222包括搜索模块(未示出),该搜索模块使得能够对经由发布系统1200发布的发布物进行关键字搜索。此外,例如,搜索引擎1222可以执行先前关于搜索引擎1222描述的功能。在另一实施方式中,搜索引擎1222可以将由成像引擎1214接收到的图像作为输入以用于进行搜索。搜索引擎1222获取查询输入并且确定来自联网系统1102的多个匹配(例如,存储在数据库1126中的发布)。注意,搜索引擎1222 的功能可以与导航引擎1212组合。发布系统1200中的搜索引擎1222可以执行先前对于搜索引擎1222描述的功能。
图12中的用户活动检测引擎1224可以在用户会话期间监测用户活动并且检测用户活动水平的变化,如下面更详细地讨论的,该变化可以预测用户即将进行购买。用户活动水平的确切变化量可以不同。一般准则可以是跨多个会话进行监测并且检测随时间推移的任何显著增加(例如,在短时间内翻倍或三倍的活动水平)。在一个实施方式中,当用户活动检测引擎1224检测到这样的情况时,电子商务系统可以进行干预以向用户提供用于显示的内容以努力提高用户进行购买的可能性,并且/或者还激励用户在电子商务系统站点上进行购买而不是转移到竞争对手的站点以寻求更好的购买。换句话说,在购买动作之前的时间内及不同时间处的活动通过如上所述的干预提供基于时间对用户进行个性化营销的机会。下面讨论在该营销个性化中包括时间帧的附加示例。发布系统1200还可以包括如先前所述的产品标题应用104。
尽管已经根据各种单独的模块和引擎来限定发布系统1200的各种部件,但是本领域技术人员将认识到许多项目可以以其他方式组合或组织,并且并非所有模块或引擎都需要根据示例实施方式存在或实现。此外,并非发布系统1200的所有部件都包括在图12中。通常,没有详细示出或讨论与示例性实施方式的功能不直接相关的部件、协议、结构和技术(例如,争议解决引擎、忠诚度促进引擎、个性化引擎)。本文中给出的描述简单提供了各种示例性实施方式以帮助读者理解本文中使用的系统和方法。
数据结构
图13是示出了各种表1250的高级实体关系图,各种表1250可以在图11的数据库1126内维护并且由图11的发布系统1200和支付系统1122 两者使用并且支持。用户表1252可以包含图11和图1A的联网系统1102 (例如,基于网络的市场102)的登记用户中的每一个的记录。用户可以作为基于网络的市场102(例如,图11和图1A)内的销售者、购买者或两者来操作。在一个示例实施方式中,购买者可以是具有累积值(例如,商业或专有货币)的用户,并且因此能够交换用于由基于网络的市场102 出售的项目的累积值。
表1250还可以包括项目表1254,其中针对货物和服务(例如,项目) 维护项目记录(例如,列表),该货物和服务可用于经由基于网络的市场 102被交易或已经交易。此外,项目表1254内的项目记录(例如,列表) 可以链接至用户表1252内的一个或更多个用户记录,以便将销售者和一个或更多个实际或潜在购买者与项目记录(例如,列表)相关联。交易表1256可以包含用于与项目表1254中存在记录的项目有关的每个交易(例如,购买或销售交易或拍卖)的记录。订单表1258可以填充有订单记录,其中每个订单记录与订单相关联。进而,每个订单可以与交易表1256中存在记录的一个或更多个交易相关联。出价表1260内的出价记录可以涉及与由图12的(一个或多个)拍卖引擎1204支持的拍卖格式列表有关的在基于网络的市场102处接收到的出价。在一个示例实施方式中,反馈表 1262可以被图12的一个或更多个信誉引擎1210用于以反馈分数的形式构建和维护与用户有关的信誉信息。历史表1264可以维护用户已经加入的交易的历史。一个或更多个属性表1266可以记录与项目表1254中存在记录的项目有关的属性信息。仅考虑这样的属性的单个示例,属性表1266 可以指示与特定项目相关联的货币属性,其中货币属性标识由销售者指定的相关项目的价格的货币。搜索表1268可以存储由正在寻找特定类型的列表的用户(例如,购买者)输入的搜索信息。表1250可以包括如先前所述的产品标题信息109。
模块、部件和逻辑电路
某些实施方式在本文中被描述为包括逻辑电路或者多个部件、模块或机构。模块可以构成软件模块(例如,机器可读介质上包含的代码)或硬件模块。“硬件模块”是能够执行某些操作的有形单元,并且可以以某种物理方式来配置或布置。在各种示例实施方式中,一个或更多个计算机系统(例如,独立计算机系统、客户端计算机系统或服务器计算机系统)或计算机系统的一个或更多个硬件模块(例如,处理器或处理器组)可以通过软件(例如,应用或应用部分)被配置为进行操作以执行如本文所描述的某些操作的硬件模块。
在一些实施方式中,硬件模块可以机械地、电子地或以其任何合适的组合来实现。例如,硬件模块可以包括永久地配置成执行某些操作的专用电路或逻辑电路。例如,硬件模块可以是专用处理器,诸如现场可编程门阵列(FPGA)或专用集成电路(ASIC)。硬件模块还可以包括通过软件被临时配置成执行某些操作的可编程逻辑电路或电路。例如,硬件模块可以包括由通用处理器或其他可编程处理器执行的软件。一旦通过这样的软件被配置,则硬件模块成为特定的机器(或机器的特定部件),其被唯一地定制成执行所配置的功能并且不再是通用处理器。要理解的是,可以通过成本和时间考虑来推动在专用的永久配置的电路中或在临时配置的电路(例如,由软件进行配置)中机械地实现硬件模块的决策。
因此,短语“硬件模块”应当被理解成包含有形实体,即作为被物理构造、永久配置(例如,硬连线)或临时配置(例如,编程)成以某种方式操作或者执行本文所描述的某些操作的实体。如本文所使用的,“硬件实现的模块”是指硬件模块。考虑其中硬件模块被临时配置(例如,被编程)的实施方式,硬件模块中的每一个无需在任一时刻处均被配置或实例化。例如,在硬件模块包括通过软件配置而成为专用处理器的通用处理器的情况下,通用处理器可以在不同时间处被配置为分别不同的专用处理器 (例如,包括不同的硬件模块)。软件相应地配置一个或更多个特定处理器以例如在一个时刻处构成特定硬件模块并且在不同的时刻处构成不同的硬件模块。
硬件模块可以向其他硬件模块提供信息并且从其他硬件模块接收信息。因此,所描述的硬件模块可以被认为是通信上耦接的。在同时存在多个硬件模块的情况下,可以通过在两个或更多个硬件模块之间或之中的信号传输(例如,通过适当的电路和总线)来实现通信。在其中多个硬件模块在不同时间处被配置或实例化的实施方式中,可以例如通过将信息存储在多个硬件模块已经访问的存储器结构中并且在该存储器结构中检索信息来实现在这样的硬件模块之间的通信。例如,一个硬件模块可以执行操作并且将该操作的输出存储在与其通信地耦接的存储器设备中。另外的硬件模块然后可以在稍后的时间处访问存储器设备以检索和处理所存储的输出。硬件模块还可以发起与输入或输出设备的通信,并且可以对资源进行操作(例如,信息的收集)。
本文中所描述的示例方法的各种操作可以至少部分地由一个或更多个处理器来执行,所述一个或更多个处理器暂时(例如,通过软件)被配置成或永久被配置成执行相关操作。无论是临时配置还是永久配置,这样的处理器可以构成进行操作以执行本文描述的一个或更多个操作或功能的处理器实现的模块。如本文所使用,“处理器实现的模块”是指使用一个或更多个处理器实现的硬件模块。
类似地,本文描述的方法可以是至少部分地由处理器实现的,其中,一个或更多个特定处理器是硬件的示例。例如,方法的操作中的至少一些操作可以由一个或更多个处理器或处理器实现的模块来执行。此外,一个或更多个处理器还可以进行操作以支持“云计算”环境中的有关操作的执行或操作为“软件即服务”(SaaS)。例如,操作中的至少一些操作可以由一组计算机(作为包括处理器的机器的示例)来执行,其中这些操作可经由网络(例如,因特网)并且经由一个或更多个适当的接口(例如,API) 被访问。
某些操作的执行可以被分布在处理器之间,所述处理器不仅驻留在单个机器内,而且也被跨多个机器部署。在一些示例实施方式中,处理器或处理器实现的模块可以位于单个地理位置(例如,在家庭环境、办公室环境或服务器群内)。在其他示例实施方式中,处理器或处理器实现的模块可以跨多个地理定位分布。
机器和软件架构
在一些实施方式中,在机器和相关软件架构的背景下实现本申请中描述的模块、方法、应用等。以下部分描述适于与所公开的实施方式一起使用的(一个或多个)代表性软件架构和机器(例如,硬件)架构。
软件架构与硬件架构结合使用以创建针对特定目的而定制的设备和机器。例如,与特定软件架构耦接的特定硬件架构将创建移动设备,例如移动电话、平板设备等。稍微不同的硬件和软件架构可以产生用于“物联网”的智能设备,而另一种组合产生用于云计算架构内的服务器计算机。此处并未呈现这样的软件和硬件架构的所有组合,因为本领域技术人员可以容易地理解如何在与本文包含的公开内容不同的背景下实现本公开内容的主题。
软件架构
图14是示出可以与本文描述的各种硬件架构结合使用的代表性软件架构2002的框图2000。图14仅是软件架构的非限制性示例,并且应当理解,可以实现许多其他架构以有助于本文描述的功能。软件架构2002可以在诸如图15的机器2100的硬件上执行,机器2100包括处理器2110、存储器/存储装置2130和输入/输出(I/O)部件2150等。代表性硬件层2004被示出并且可以表示例如图15的机器2100。代表性硬件层2004包括具有相关联的可执行指令2008的一个或更多个处理单元2006。可执行指令 2008表示软件架构2002的可执行指令,包括本申请中的方法和模块的实现方式。硬件层2004还包括存储器和/或存储模块2010,存储器和/或存储模块2010也具有可执行指令2008。硬件层2004还可以包括代表硬件层 2004的任何其他硬件的其他硬件2012,例如作为机器2100的部分示出的其他硬件。
在图14的示例架构中,软件架构2002可以被概念化为层的堆栈,其中,每个层提供特定功能。例如,软件架构2002可以包括诸如操作系统 2014、库2016、框架/中间件2018、应用2020和表示层2044的层。在操作上,这些层中的应用2020和/或其他部件可以通过软件堆栈来激发API 调用2024,并且响应于API调用2024来接收被示出为消息2026的响应、返回值等。所示出的层本质上是代表性的,并非所有软件架构都具有所有的层。例如,一些移动或专用操作系统可能不提供框架/中间件层2018,而其他的可以提供这样的层。其他软件架构可以包括另外的层或不同的层。
操作系统2014可以管理硬件资源并且提供公共服务。操作系统2014 可以包括例如内核2028、服务2030和驱动器2032。内核2028可以用作硬件与其他软件层之间的抽象层。例如,内核2028可以负责存储器管理、处理器管理(例如,调度)、部件管理、联网、安全设置等。服务2030可以向其他软件层提供其他公共服务。驱动器2032可以负责控制底层硬件或与底层硬件对接。例如,取决于硬件配置,驱动器2032可以包括显示驱动器、相机驱动器、驱动器、闪速存储器驱动器、串行通信驱动器(例如,通用串行总线(USB)驱动器)、驱动器、音频驱动器、电源管理驱动器等。
库2016可以提供可以通过应用2020和/或其他部件和/或层利用的公共架构。库2016通常提供如下功能,该功能使得其他软件模块能够以相比于与底层操作系统2014功能(例如,内核2028、服务2030和/或驱动器2032)直接对接的方式的更容易的方式来执行任务。库2016可以包括系统2034库(例如,C标准库),系统2034库可以提供诸如存储器分配功能、字符串操作功能、数学功能等的功能。此外,库2016可以包括API 库2036,例如媒体库(例如,用于支持诸如MPEG4、H.264、MP3、AAC、 AMR、JPG、PNG的各种媒体格式的呈现和操作的库)、图形库(例如,可以用于在显示器上呈现图形内容中的2D和3D的OpenGL框架)、数据库库(例如,可以提供各种关系数据库功能的SQLite)、web库(例如,可以提供web浏览功能的WebKit)等。如本文中所述,库2016还可以包括各种其他库2038,以向应用2020和其他软件部件/模块提供许多其他 API。
框架2018(有时也称为中间件)可以提供可以由应用2020和/或其他软件部件/模块利用的更高级的公共基础结构。例如,框架2018可以提供各种图形用户界面(GUI)功能、高级资源管理、高级位置服务等。框架 2018可以提供可以由应用2020和/或其他软件部件/模块利用的广泛的其他API,其中一些可以特定于特定操作系统2014或平台。
应用2020包括内置应用2040和/或第三方应用2042和/或产品标题应用104等。代表性内置应用2040的示例可以包括但不限于联系人应用、浏览器应用、书籍阅读器应用、位置应用、媒体应用、消息发送应用和/ 或游戏应用。第三方应用2042可以包括任何的内置应用2040以及各种其他应用。在特定示例中,第三方应用2042(例如,由不同于特定平台的供应商的实体使用AndroidTM或iOSTM软件开发工具包(SDK)开发的应用)可以是在诸如iOSTM、AndroidTM、的移动操作系统或其他移动操作系统上运行的移动软件。在该示例中,第三方应用2042可以激发由诸如操作系统2014的移动操作系统提供的API调用2024,以有助于本文描述的功能。
应用2020可以利用内置操作系统功能(例如,内核2028、服务2030 和/或驱动器2032)、库(例如,系统库2034、API库2036和其他库2038)、框架/中间件2018来创建用户接口以与系统的用户交互。替选地或另外地,在一些系统中,与用户的交互可以通过诸如表示层2044的表示层来发生。在这些系统中,应用/模块“逻辑电路”可以与和用户交互的应用/模块的方面分开。
一些软件架构利用虚拟机。在图14的示例中,这由虚拟机2048示出。虚拟机2048创建软件环境,在该软件环境中,应用2020/模块可以像在硬件机器(例如,图15的机器2100)上执行一样地执行。虚拟机2048由主机操作系统(图14 中的操作系统2014)托管,并且通常但并非总是具有虚拟机监视器2046,虚拟机监视器2046管理虚拟机2048的操作以及与主机操作系统(即,操作系统2014)的对接。软件架构在虚拟机2048诸如操作系统2050、库2052、框架/中间件2054、应用2056和/或表示层2058 内执行。在虚拟机2048内执行的这些软件架构层可以与先前描述的对应层相同或可以是不同的。
示例机器架构和机器可读介质
图15是示出根据一些示例实施方式的能够从机器可读介质(例如,机器可读存储介质)读取指令2116并执行本文所讨论的任一种或更多种方法的机器2100的部件的框图。具体地,图15以计算机系统的示例形式示出了机器2100的示意图,在该机器2100中可以执行指令2116(例如,软件、程序、应用2020、小程序、app或其他可执行代码),以使机器500 执行本文讨论的任何一种或更多种方法。例如,指令2116可以使机器2100 执行图6至图10的流程图。另外地或替选地,指令2116可以实现图1A 的系统100、图11的架构1100等。指令2116将通用的、未编程的机器2100 变换成特定机器2100,该特定机器2100被编程为以所描述的方式执行所描述和示出的功能。在替选实施方式中,机器2100作为独立设备操作或者可以耦接(例如,联网)到其他机器。在联网部署中,机器2100可以在服务器客户端网络环境中以服务器机器或客户端机器的身份来操作,或者操作为对等(或分布式)网络环境中的对等机器。机器2100可以包括但不限于服务器计算机、客户端计算机、个人计算机(PC)、平板计算机、膝上型计算机、上网本、机顶盒(STB)、个人数字助理(PDA)、娱乐媒体系统、蜂窝电话、智能电话、移动设备、可穿戴设备(例如,智能手表)、智能家居设备(例如,智能家用电器)、其他智能设备、web设备、网络路由器、网络交换机、网络桥接器或者能够顺序地或以其他方式执行指定机器2100要采取的动作的指令2116的任何机器。此外,虽然仅示出了单个机器2100,但是术语“机器”还应当被视为包括单独地或联合地执行指令2116以执行本文所讨论的任一种或更多种方法的机器2100的集合。
机器2100可以包括处理器2110、存储器/存储装置2130和I/O部件 2150,处理器1410、存储器/存储装置2130和I/O部件2150可以被配置成例如经由总线2102相互通信。在示例实施方式中,处理器2110(例如,中央处理单元(CPU)、精简指令集计算(RISC)处理器、复杂指令集计算(CISC)处理器、图形处理单元(GPU)、数字信号处理器(DSP)、 ASIC、射频集成电路(RFIC)、另外的处理器或其任何合适的组合)可以包括例如可以执行指令2116的处理器2112和处理器2114。术语“处理器”旨在包括多核处理器2110,多核处理器2110可以包括可以同时执行指令 2116的两个或更多个独立处理器2112、2114(有时称为“核”)。尽管图15示出了多个处理器2112、2114,但是机器2100可以包括具有单个核的单个处理器2112、具有多个核的单个处理器2112(例如,多核处理器)、具有单个核的多个处理器2112、2114、具有多个核的多个处理器2112、 2114或者其任何组合。
存储器/存储装置2130可以包括诸如主存储器或其他存储器的存储器 2132以及存储单元2136,上述两者都是诸如经由总线2102而可由处理器 2110访问的。存储单元2136和存储器2132存储体现本文描述的方法或功能中的任一个或更多个的指令2116。指令2116还可以在其由机器2100 执行期间完全地或部分地驻留在存储器2132内、存储单元2136内、处理器2110中的至少一个内(例如,在处理器的高速缓冲存储器内)或其任何合适的组合内。因此,存储器2132、存储单元2136和处理器2110的存储器是机器可读介质的示例。
如本文所使用,“机器可读存储介质”意指能够临时或永久地存储指令2116和数据的设备,并且可以包括但不限于随机存取存储器(RAM)、只读存储器(ROM)、缓冲存储器、闪速存储器、光学介质、磁介质、高速缓冲存储器、其他类型的存储装置(例如,可擦除可编程只读存储器 (EEPROM))和/或其任何合适的组合。术语“机器可读存储介质”应当被视为包括能够存储指令2116的单个介质或多个介质(例如,集中式或分布式数据库、或者相关联的高速缓冲存储器和服务器)。术语“机器可读存储介质”还应当被视为包括能够存储用于由机器(例如,机器2100) 执行的指令(例如,指令2116)的任何介质或多个介质的组合,使得指令 2116在由机器2100的一个或更多个处理器(例如,处理器2110)执行时使机器2100执行本文所描述的方法中任何一个或更多个。因此,“机器可读存储介质”是指单个存储装置或设备以及包括多个存储装置或设备的“基于云的”存储系统或存储网络。术语“机器可读介质”包括机器可读存储介质以及传输介质或信号。
I/O部件2150可以包括各种部件以接收输入、提供输出、产生输出、发送信息、交换信息、捕获测量结果等。特定机器2100中包括的特定I/O 部件2150将取决于机器2100的类型。例如,诸如移动电话的便携式机器可能包括触摸输入设备或其他这样的输入机构,而无头服务器机器可能不包括这样的触摸输入设备。要理解的是,I/O部件2150可以包括图15中未示出的许多其他部件。I/O部件2150仅为了简化以下讨论而根据功能被分组,并且该分组决不是限制性的。在各种示例实施方式中,I/O部件2150 可以包括输出部件2152和输入部件2154。输出部件2152可以包括视觉部件(例如,诸如等离子显示板(PDP)、发光二极管(LED)显示器、液晶显示器(LCD)、投影仪或阴极射线管(CRT)的显示器)、声学部件(例如,扬声器)、触觉部件(例如,振动马达、阻力机构)、其他信号发生器等。输入部件2154可以包括字母数字输入部件(例如,键盘、配置成接收字母数字输入的触摸屏、光电键盘或其他字母数字输入部件)、基于指向的输入部件(例如,鼠标、触摸板、轨迹球、操纵杆、运动传感器或其他指向仪器)、触觉输入部件(例如,物理按钮、提供触摸或触摸姿势的位置和/或力的触摸屏、或者其他触觉输入部件)、音频输入部件(例如,麦克风)等。
在其他示例实施方式中,I/O部件2150可以包括广泛的其他部件之中的生物识别部件2156、运动部件2158、环境部件2160或定位部件2162。例如,生物识别部件2156可以包括用于检测表达(例如,手部表达、面部表情、声音表达、身体姿势或眼睛跟踪)、测量生物信号(例如,血压、心率、体温、出汗或脑波)、识别人(例如,声音识别、视网膜识别、面部识别、指纹识别或基于脑电图的识别)等的部件。运动部件2158可以包括加速度传感器部件(例如,加速度计)、重力传感器部件、旋转传感器部件(例如,陀螺仪)等。环境部件2160可以包括例如照明传感器部件(例如,光度计)、温度传感器部件(例如,检测环境温度的一个或更多个温度计)、湿度传感器部件、压力传感器部件(例如,气压计)、声学传感器部件(例如,检测背景噪声的一个或更多个麦克风)、接近度传感器部件(例如,检测附近对象的红外传感器)、气体传感器(例如,用于检测危险气体的浓度以确保安全或用于测量大气中的污染物的气体检测传感器)或可以提供与周围物理环境对应的指示、测量结果或信号的其他部件。定位部件2162可以包括位置传感器部件(例如,GPS接收器部件)、海拔传感器部件(例如,检测气压的高度计或气压计,根据所述气压可以得到海拔)、取向传感器部件(例如,磁力计)等。
可以使用各种技术来实现通信。I/O部件2150可以包括通信部件 2164,通信部件2164可操作以分别经由耦接2182和耦接2172将机器2100 耦接到网络2180或设备2170。例如,通信部件2164可以包括网络接口部件或与网络2180对接的其他合适的设备。在其他示例中,通信部件2164 可以包括有线通信部件、无线通信部件、蜂窝通信部件、近场通信(NFC) 部件、部件(例如,低能量)、部件和经由其他形式提供通信的其他通信部件。设备2170可以是另外的机器或各种外围设备中的任一种(例如,经由USB耦接的外围设备)。
此外,通信部件2164可以检测标识符或包括可操作以检测标识符的部件。例如,通信部件2164可以包括射频标识(RFID)标签读取器部件、 NFC智能标签检测部件、光学读取器部件(例如,用于检测诸如UPC条形码的一维条形码、诸如快速响应(QR)码、Aztec码、数据矩阵、Dataglyph、MaxiCode、PDF417、Ultra Code、UCC RSS-2D条形码的多维条形码和其他光学代码的光学传感器)或声学检测部件(例如,用于识别带标签的音频信号的麦克风)。此外,可以经由通信部件2164得到各种信息,诸如经由因特网协议(IP)地理定位的位置、经由信号三角测量的位置、经由检测可以指示特定位置的NFC信标信号的位置等。
传输介质
在各种示例实施方式中,网络2180的一个或更多个部分可以是自组织网络、内联网、外联网、虚拟专用网络(VPN)、局域网(LAN)、无线 LAN(WLAN)、WAN、无线WAN(WWAN)、城域网(MAN)、因特网、因特网的一部分、公共交换电话网(PSTN)的一部分、普通老式电话服务(POTS)网络、蜂窝电话网络、无线网络、网络、另外的类型的网络或两个或更多个这样的网络的组合。例如,网络2180或网络2180 的一部分可以包括无线或蜂窝网络,并且耦接2182可以是码分多址 (CDMA)连接、全球移动通信系统(GSM)连接或其他类型的蜂窝或无线耦接。在该示例中,耦接2182可以实现各种类型的数据传输技术中的任一种,诸如单载波无线电传输技术(1xRTT)、演进数据优化(EVDO) 技术、通用分组无线服务(GPRS)技术、GSM演进的增强数据率(EDGE) 技术、包括3G的第三代合作伙伴计划(3GPP)、第四代无线(4G)网络、通用移动电信系统(UMTS)、高速分组接入(HSPA)、全球微波接入互操作性(WiMAX)、长期演进(LTE)标准、由各种标准设置组织定义的其他标准、其他远程协议或其他数据传输技术。
可以经由网络接口设备(例如,包括在通信部件2164中的网络接口部件)使用传输介质并且利用许多公知的传输协议中的任一传输协议(例如,超文本传输协议(HTTP))通过网络2180来发送或接收指令2116。类似地,可以使用传输介质经由耦接2172(例如,对等耦接)将指令2116 发送到设备2170或从其接收指令2116。术语“传输介质”应当被视为包括能够存储、编码或携载用于由机器2100执行的指令2116的任何无形介质,并且包括数字或模拟通信信号或有助于这样的软件的通信的其他无形介质。传输介质是机器可读介质的实施方式。
以下所编号的示例是实施方式。
一种系统,包括:
至少一个处理器和能够在计算机可读介质上访问的指令,该指令当被执行时,使得至少一个处理器执行操作,所述操作包括:
识别分别描述在基于网络的市场上出售的项目的第一多个项目列表,所述识别基于包括与所述基于网络的市场上的产品标题匹配且不相关联的产品标识符的每个项目列表,第一多个项目列表包括第一多个项目标题和第一项目列表;
提取和处理特征值,提取和处理包括:
从第一多个项目列表中提取第一多个项目特征值并且处理第一多个项目特征值以生成第二多个项目特征值;
从第一多个项目列表中提取第一多个产品特征值并且处理第一多个产品特征值以生成第二多个产品特征值,所述第二多个产品特征值包括描述第一项目列表与第一多个项目列表之间的比较的第一产品特征值;
根据第一多个项目标题采用产品标题,采用包括:
利用机器学习算法分析第二多个项目特征值和第二多个产品特征值,该机器学习算法利用产品标题模型来生成多个项目标题分数;
识别产品的产品标题,识别包括基于多个项目标题分数从多个项目标题中识别产品标题;
生成包括产品标题的产品用户界面;以及
通过网络传送用于在客户端机器上显示的产品用户界面,该产品用户界面包括产品标题。
2.根据示例1的系统,其中,操作还包括充实产品标题,其中充实包括重新格式化产品标题中的字母。
3.根据示例2的系统,其中,对字母的重新格式化包括将字母格式化为大写体。
4.根据示例3的系统,其中,重新格式化基于标识国家的国家标识符。
5.根据示例1至4中任一项的系统,其中,操作还包括基于第二多个项目来训练产品标题模型。
6.根据示例1至5中任一项的系统,其中,产品标识符是从包括以下的一组产品标识符中选择的:全球贸易项目代码(GTIN)、制造部件编号 (MPN)和通用产品代码(UPC)以及欧洲物品编号(EAN)、日本物品编号(JAN)和国际标准书号(ISBN)。
7.根据示例1至6中任一项的系统,其中,对产品的产品标题的采用包括基于分析生成多个标题分数,该多个标题分数包括分别与第一多个项目标题中包括的项目标题相关联的标题分数。
8.根据示例1至7中任一项的系统,其中,第二多个产品值包括第二产品值,该第二产品值包括描述最频繁使用的记号是否被包括在第一项目标题中的布尔。
9.根据示例1至8中任一项的系统,其中,第一多个项目值包括描述标题大小的范围的第一项目值。
10.一种方法,包括:
识别分别描述在基于网络的市场上出售的项目的第一多个项目列表,识别基于包括与基于网络的市场上的产品标题匹配且不相关联的产品标识符的每个项目列表,第一多个项目列表包括第一多个项目标题和第一项目列表;
提取和处理特征值,提取和处理包括:
从第一多个项目列表中提取第一多个项目特征值并且处理第一多个项目特征值以生成第二多个项目特征值;
从第一多个项目列表中提取第一多个产品特征值并且处理第一多个产品特征值以生成第二多个产品特征值,该第二多个产品特征值包括描述第一项目列表与第一多个项目列表之间的比较的第一产品特征值;
根据第一多个项目标题采用产品标题,采用包括:
利用机器学习算法分析第二多个项目特征值和第二多个产品特征值,该机器学习算法利用产品标题模型来生成多个项目标题分数;
识别产品的产品标题,识别包括基于多个项目标题分数从多个项目标题中识别产品标题;
生成包括产品标题的产品用户界面;以及
通过网络传送用于在客户端机器上显示的产品用户界面,该产品用户界面包括产品标题。
11.根据示例10的方法,还包括充实产品标题,其中,充实包括重新格式化产品标题中的字母。
12.根据示例11的方法,其中,对字母的重新格式化包括将字母格式化为大写体。
13.根据示例12的方法,其中,重新格式化基于标识国家的国家标识符。
14.根据示例10至13中任一项的方法,还包括基于第二多个项目来训练产品标题模型。
15.根据示例10至14中任一项的方法,其中,产品标识符是从包括以下的一组产品标识符中选择的:全球贸易项目代码(GTIN)、制造部件编号(MPN)和通用产品代码(UPC)以及欧洲物品编号(EAN)、日本物品编号(JAN)和国际标准书号(ISBN)。
16.根据示例10至15中任一项的方法,其中,对产品的产品标题的采用包括基于分析生成多个标题分数,多个标题分数包括分别与第一多个项目标题中包括的项目标题相关联的标题分数。
17.根据示例10至16中任一项的方法,其中,第二多个产品值包括第二产品值,该第二产品值包括描述最频繁使用的记号是否被包括在第一项目标题中的布尔。
18.根据示例10至17中任一项的方法,其中,第一多个项目值包括描述标题大小的范围的第一项目值。
19.一种存储有一组指令的机器可读硬件存储设备,所述一组指令当由机器的处理器执行时,使得机器执行操作,所述操作包括:
识别分别描述在基于网络的市场上出售的项目的第一多个项目列表,识别基于包括与基于网络的市场上的产品标题匹配且不相关联的产品标识符的每个项目列表,第一多个项目列表包括第一多个项目标题和第一项目列表;
提取和处理特征值,提取和处理包括:
从第一多个项目列表中提取所述第一多个项目特征值并且处理第一多个项目特征值以生成第二多个项目特征值;
从第一多个项目列表中提取第一多个产品特征值并且处理第一多个产品特征值以生成第二多个产品特征值,该第二多个产品特征值包括描述第一项目列表与第一多个项目列表之间的比较的第一产品特征值;
根据第一多个项目标题采用产品标题,采用包括:
利用机器学习算法分析第二多个项目特征值和第二多个产品特征值,该机器学习算法利用产品标题模型来生成多个项目标题分数;
识别产品的产品标题,识别包括基于多个项目标题分数从多个项目标题中识别产品标题;
生成包括产品标题的产品用户界面;以及
通过网络传送用于在客户端机器上显示的产品用户界面,该产品用户界面包括产品标题。
21.一种携载机器可读指令的机器可读介质,该机器可读指令当由机器的处理器执行时,使机器执行示例10至18中任一项的方法。
语言
遍及本说明书,多个实例可以实现被描述为单个实例的部件、操作或结构。虽然一种或更多种方法的个体操作被示出和描述为分立的操作,但是一个或更多个的个体操作可以同时执行,并且不要求以所示的顺序执行操作。在示例配置中作为分立部件呈现的结构和功能可以实现为组合的结构或部件。类似地,作为单个部件呈现的结构和功能可以被实现为分立的部件。这些和其他变型、修改、添加以及改进落入本文中的主题的范围内。
尽管已经参考具体示例实施方式描述了本发明主题的概述,但是在不脱离本公开内容的实施方式的更宽泛的范围的情况下,可以对这些实施方式进行各种修改和改变。本发明主题的这样的实施方式在本文中可以单独地或共同地通过术语“发明”来提及,仅是出于方便,而不意在在实际上公开了不止一个公开内容或发明构思的情况下将本申请的范围自主地限制于任何单个公开内容或发明构思。
足够详细地描述了本文所示的示例实施方式,以使本领域技术人员能够实践所公开的教导。可以使用并从中得到其他示例实施方式,使得可以在不脱离本公开内容的范围的情况下进行结构和逻辑替换和改变。因此,具体实施方式不以限制性意义被采用,并且各种示例实施方式的范围仅通过所附权利要求以及这样的权利要求所赋予的等同方案的全部范围来限定。
如本文所使用的,术语“或”可以以包含性或排他性的含义来解释。此外,可以为在本文中描述为单个实例的资源、操作或结构提供多个实例。另外,各种资源、操作、模块、引擎和数据存储装置之间的边界在某种程度上是任意的,并且在特定说明性配置的背景下示出了特定操作。其他功能分配被设想并且可以落入本公开内容的各种示例实施方式的范围内。通常,在示例配置中作为单独资源呈现的结构和功能可以实现为组合的结构或资源。类似地,作为单个资源呈现的结构和功能可以实现为单独的资源。这些和其他变型、修改、添加和改进落入如由所附权利要求表示的本公开内容的示例实施方式的范围内。因此,说明书和附图被认为是说明性的而不是限制性意义的。
Claims (20)
1.一种用于选择产品标题的系统,包括:
至少一个处理器和能够在计算机可读介质上访问的指令,所述指令当被执行时,使得所述至少一个处理器执行操作,所述操作包括:
识别分别描述在基于网络的市场上出售的项目的第一多个项目列表,所述识别基于包括与所述基于网络的市场上的产品标题匹配且不相关联的产品标识符的每个项目列表,所述第一多个项目列表包括第一多个项目标题和第一项目列表;
提取和处理特征值,所述提取和处理包括:
从所述第一多个项目列表中提取第一多个项目特征值并且处理所述第一多个项目特征值以生成第二多个项目特征值;
从所述第一多个项目列表中提取第一多个产品特征值并且处理所述第一多个产品特征值以生成第二多个产品特征值,所述第二多个产品特征值包括描述所述第一项目列表与所述第一多个项目列表之间的比较的第一产品特征值;
根据所述第一多个项目标题采用产品标题,所述采用包括:
利用机器学习算法分析所述第二多个项目特征值和所述第二多个产品特征值,所述机器学习算法利用产品标题模型来生成多个项目标题分数;
识别所述产品的产品标题,所述识别包括基于所述多个项目标题分数从所述多个项目标题中识别所述产品标题;
生成包括所述产品标题的产品用户界面;以及
通过网络传送用于在客户端机器上显示的所述产品用户界面,所述产品用户界面包括所述产品标题。
2.根据权利要求1所述的系统,其中,所述操作还包括充实所述产品标题,其中,所述充实包括重新格式化所述产品标题中的字母。
3.根据权利要求2所述的系统,其中,对所述字母的所述重新格式化包括将所述字母格式化为大写体。
4.根据权利要求3所述的系统,其中,所述重新格式化基于标识国家的国家标识符。
5.根据权利要求1所述的系统,其中,所述操作还包括基于第二多个项目来训练所述产品标题模型。
6.根据权利要求1所述的系统,其中,所述产品标识符是从包括以下的一组产品标识符中选择的:全球贸易项目代码(GTIN)、制造部件编号(MPN)和通用产品代码(UPC)以及欧洲物品编号(EAN)、日本物品编号(JAN)和国际标准书号(ISBN)。
7.根据权利要求1所述的系统,其中,对所述产品的产品标题的所述采用包括基于所述分析生成多个标题分数,所述多个标题分数包括分别与所述第一多个项目标题中包括的所述项目标题相关联的标题分数。
8.根据权利要求1所述的系统,其中,所述第二多个产品值包括第二产品值,所述第二产品值包括描述最频繁使用的记号是否被包括在第一项目标题中的布尔。
9.根据权利要求1所述的系统,其中,所述第一多个项目值包括描述标题大小的范围的第一项目值。
10.一种用于选择产品标题的方法,包括:
识别分别描述在基于网络的市场上出售的项目的第一多个项目列表,所述识别基于包括与所述基于网络的市场上的产品标题匹配且不相关联的产品标识符的每个项目列表,所述第一多个项目列表包括第一多个项目标题和第一项目列表;
提取和处理特征值,所述提取和处理包括:
从所述第一多个项目列表中提取第一多个项目特征值并且处理所述第一多个项目特征值以生成第二多个项目特征值;
从所述第一多个项目列表中提取第一多个产品特征值并且处理所述第一多个产品特征值以生成第二多个产品特征值,所述第二多个产品特征值包括描述所述第一项目列表与所述第一多个项目列表之间的比较的第一产品特征值;
根据所述第一多个项目标题采用产品标题,所述采用包括:
利用机器学习算法分析所述第二多个项目特征值和所述第二多个产品特征值,所述机器学习算法利用产品标题模型来生成多个项目标题分数;
识别所述产品的产品标题,所述识别包括基于所述多个项目标题分数从所述多个项目标题中识别所述产品标题;
生成包括所述产品标题的产品用户界面;以及
通过网络传送用于在客户端机器上显示的所述产品用户界面,所述产品用户界面包括所述产品标题。
11.根据权利要求10所述的方法,还包括充实所述产品标题,其中,所述充实包括重新格式化所述产品标题中的字母。
12.根据权利要求11所述的方法,其中,对所述字母的所述重新格式化包括将所述字母格式化为大写体。
13.根据权利要求12所述的方法,其中,所述重新格式化基于标识国家的国家标识符。
14.根据权利要求10所述的方法,还包括基于第二多个项目来训练所述产品标题模型。
15.根据权利要求10所述的方法,其中,所述产品标识符从包括以下的一组产品标识符中选择的:全球贸易项目代码(GTIN)、制造部件编号(MPN)和通用产品代码(UPC)以及欧洲物品编号(EAN)、日本物品编号(JAN)和国际标准书号(ISBN)。
16.根据权利要求10所述的方法,其中,对所述产品的产品标题的所述采用包括基于所述分析生成多个标题分数,所述多个标题分数包括分别与所述第一多个项目标题中包括的所述项目标题相关联的标题分数。
17.根据权利要求10所述的方法,其中,所述第二多个产品值包括第二产品值,所述第二产品值包括描述最频繁使用的记号是否被包括在第一项目标题中的布尔。
18.根据权利要求10所述的方法,其中,所述第一多个项目值包括描述标题大小的范围的第一项目值。
19.一种存储有一组指令的机器可读硬件存储设备,所述一组指令当由机器的处理器执行时,使得所述机器执行操作,所述操作包括:
识别分别描述在基于网络的市场上出售的项目的第一多个项目列表,所述识别基于包括与所述基于网络的市场上的产品标题匹配且不相关联的产品标识符的每个项目列表,所述第一多个项目列表包括第一多个项目标题和第一项目列表;
提取和处理特征值,所述提取和处理包括:
从所述第一多个项目列表中提取第一多个项目特征值并且处理所述第一多个项目特征值以生成第二多个项目特征值;
从所述第一多个项目列表中提取第一多个产品特征值并且处理所述第一多个产品特征值以生成第二多个产品特征值,所述第二多个产品特征值包括描述所述第一项目列表与所述第一多个项目列表之间的比较的第一产品特征值;
根据所述第一多个项目标题采用产品标题,所述采用包括:
利用机器学习算法分析所述第二多个项目特征值和所述第二多个产品特征值,所述机器学习算法利用产品标题模型来生成多个项目标题分数;
识别所述产品的产品标题,所述识别包括基于所述多个项目标题分数从所述多个项目标题中识别所述产品标题;
生成包括所述产品标题的产品用户界面;以及
通过网络传送用于在客户端机器上显示的所述产品用户界面,所述产品用户界面包括所述产品标题。
20.一种携载机器可读指令的机器可读介质,所述机器可读指令当由所述机器的处理器执行时,使所述机器执行权利要求10至18中任一项所述的方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/290,648 | 2016-10-11 | ||
US15/290,648 US11580589B2 (en) | 2016-10-11 | 2016-10-11 | System, method, and medium to select a product title |
PCT/US2017/056143 WO2018071545A1 (en) | 2016-10-11 | 2017-10-11 | Selecting a product title |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110023982A CN110023982A (zh) | 2019-07-16 |
CN110023982B true CN110023982B (zh) | 2022-02-25 |
Family
ID=61828962
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780062475.5A Active CN110023982B (zh) | 2016-10-11 | 2017-10-11 | 用于选择产品标题的系统、方法、存储设备及介质 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11580589B2 (zh) |
JP (1) | JP6802370B2 (zh) |
KR (2) | KR20210099168A (zh) |
CN (1) | CN110023982B (zh) |
WO (1) | WO2018071545A1 (zh) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11580589B2 (en) | 2016-10-11 | 2023-02-14 | Ebay Inc. | System, method, and medium to select a product title |
US10841257B1 (en) * | 2016-10-25 | 2020-11-17 | Twitter, Inc. | Determining engagement scores for sub-categories in a digital domain by a computing system |
US10860803B2 (en) * | 2017-05-07 | 2020-12-08 | 8X8, Inc. | System for semantic determination of job titles |
US11307880B2 (en) | 2018-04-20 | 2022-04-19 | Meta Platforms, Inc. | Assisting users with personalized and contextual communication content |
US11715042B1 (en) | 2018-04-20 | 2023-08-01 | Meta Platforms Technologies, Llc | Interpretability of deep reinforcement learning models in assistant systems |
US11676220B2 (en) | 2018-04-20 | 2023-06-13 | Meta Platforms, Inc. | Processing multimodal user input for assistant systems |
US11010179B2 (en) | 2018-04-20 | 2021-05-18 | Facebook, Inc. | Aggregating semantic information for improved understanding of users |
US11886473B2 (en) | 2018-04-20 | 2024-01-30 | Meta Platforms, Inc. | Intent identification for agent matching by assistant systems |
CN110580335B (zh) * | 2018-06-07 | 2023-05-26 | 阿里巴巴集团控股有限公司 | 用户意图的确定方法及装置 |
US11568466B2 (en) * | 2018-12-19 | 2023-01-31 | Yahoo Ad Tech Llc | Systems and methods for recommendation generation |
US11176324B2 (en) * | 2019-09-26 | 2021-11-16 | Sap Se | Creating line item information from free-form tabular data |
US20210142376A1 (en) * | 2019-11-07 | 2021-05-13 | Ebay Inc. | Compatible model determination for efficient listing creation |
US11568425B2 (en) * | 2020-02-24 | 2023-01-31 | Coupang Corp. | Computerized systems and methods for detecting product title inaccuracies |
CN111460801B (zh) * | 2020-03-30 | 2023-08-18 | 北京百度网讯科技有限公司 | 标题生成方法、装置及电子设备 |
US20210390267A1 (en) * | 2020-06-12 | 2021-12-16 | Ebay Inc. | Smart item title rewriter |
CN111915262B (zh) * | 2020-08-14 | 2024-03-12 | 杭州网易再顾科技有限公司 | 任务处理方法、装置、电子设备及计算机可读存储介质 |
US11164232B1 (en) * | 2021-01-15 | 2021-11-02 | Coupang Corp. | Systems and methods for intelligent extraction of attributes from product titles |
US11200612B1 (en) * | 2021-02-12 | 2021-12-14 | Coupang Corp. | Systems and methods for intelligent extraction of quantities from product titles |
CN114065750A (zh) * | 2021-11-15 | 2022-02-18 | 广州华多网络科技有限公司 | 商品信息匹配、发布方法及其装置、设备、介质、产品 |
CN116521906B (zh) * | 2023-04-28 | 2023-10-24 | 广州商研网络科技有限公司 | 元描述生成方法及其装置、设备、介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090058722A (ko) * | 2007-12-05 | 2009-06-10 | 주민성 | 사용자가 제작한 상품 평가 정보 제공 시스템 및 방법 |
CN102549603A (zh) * | 2009-08-24 | 2012-07-04 | 谷歌公司 | 基于相关性的图像选择 |
CN105740380A (zh) * | 2016-01-27 | 2016-07-06 | 北京邮电大学 | 数据融合方法及系统 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7082426B2 (en) * | 1993-06-18 | 2006-07-25 | Cnet Networks, Inc. | Content aggregation method and apparatus for an on-line product catalog |
JP2000148741A (ja) | 1998-11-18 | 2000-05-30 | Omron Corp | 文書データ作成装置、文書データ作成方法、文書データ作成プログラムを記録した記録媒体、文書環境設定プログラムを記録した記録媒体および環境設定情報を記録した記録媒体 |
TW515971B (en) | 1999-02-10 | 2003-01-01 | Ibm | Network-based product information server |
US20070100666A1 (en) * | 2002-08-22 | 2007-05-03 | Stivoric John M | Devices and systems for contextual and physiological-based detection, monitoring, reporting, entertainment, and control of other devices |
US8504567B2 (en) | 2010-08-23 | 2013-08-06 | Yahoo! Inc. | Automatically constructing titles |
CN102737057B (zh) | 2011-04-14 | 2015-04-01 | 阿里巴巴集团控股有限公司 | 一种商品类目信息的确定方法及装置 |
US8700494B2 (en) * | 2011-09-06 | 2014-04-15 | Google Inc. | Identifying product variants |
US9348811B2 (en) | 2012-04-20 | 2016-05-24 | Sap Se | Obtaining data from electronic documents |
CN103577989B (zh) | 2012-07-30 | 2017-11-14 | 阿里巴巴集团控股有限公司 | 一种基于产品识别的信息分类方法及信息分类系统 |
US10528907B2 (en) | 2012-12-19 | 2020-01-07 | Oath Inc. | Automated categorization of products in a merchant catalog |
JP2014146136A (ja) | 2013-01-28 | 2014-08-14 | Nippon Telegr & Teleph Corp <Ntt> | アイテム情報検索装置、モデル作成装置、アイテム情報検索方法、モデル作成方法、及びプログラム |
US9613371B2 (en) | 2014-09-02 | 2017-04-04 | Wal-Mart Stores, Inc. | Dynamic taxonomy generation with demand-based product groups |
US10217147B2 (en) | 2014-09-12 | 2019-02-26 | Ebay Inc. | Mapping products between different taxonomies |
JP5963328B2 (ja) * | 2014-10-30 | 2016-08-03 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 生成装置、生成方法、およびプログラム |
WO2016194062A1 (ja) | 2015-05-29 | 2016-12-08 | 楽天株式会社 | 商品特定装置、商品特定方法及び商品特定プログラム |
US10614500B2 (en) * | 2015-08-13 | 2020-04-07 | BloomReach, Inc. | Identifying search friendly web pages |
US11580589B2 (en) | 2016-10-11 | 2023-02-14 | Ebay Inc. | System, method, and medium to select a product title |
-
2016
- 2016-10-11 US US15/290,648 patent/US11580589B2/en active Active
-
2017
- 2017-10-11 KR KR1020217024036A patent/KR20210099168A/ko not_active IP Right Cessation
- 2017-10-11 JP JP2019517846A patent/JP6802370B2/ja not_active Expired - Fee Related
- 2017-10-11 CN CN201780062475.5A patent/CN110023982B/zh active Active
- 2017-10-11 KR KR1020197013388A patent/KR102285263B1/ko active IP Right Grant
- 2017-10-11 WO PCT/US2017/056143 patent/WO2018071545A1/en active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090058722A (ko) * | 2007-12-05 | 2009-06-10 | 주민성 | 사용자가 제작한 상품 평가 정보 제공 시스템 및 방법 |
CN102549603A (zh) * | 2009-08-24 | 2012-07-04 | 谷歌公司 | 基于相关性的图像选择 |
CN105740380A (zh) * | 2016-01-27 | 2016-07-06 | 北京邮电大学 | 数据融合方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
WO2018071545A1 (en) | 2018-04-19 |
KR102285263B1 (ko) | 2021-08-04 |
JP2019533246A (ja) | 2019-11-14 |
US11580589B2 (en) | 2023-02-14 |
JP6802370B2 (ja) | 2020-12-16 |
US20180101893A1 (en) | 2018-04-12 |
CN110023982A (zh) | 2019-07-16 |
KR20210099168A (ko) | 2021-08-11 |
KR20190067214A (ko) | 2019-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110023982B (zh) | 用于选择产品标题的系统、方法、存储设备及介质 | |
CN108701118B (zh) | 语义类别分类 | |
KR102310114B1 (ko) | 자동완성 검색 결과에 대한 시간적 요구를 식별하는 기법 | |
US10936632B2 (en) | Enhanced search query suggestions | |
US11687991B2 (en) | Structured item organizing mechanism in e-commerce | |
US20200020000A1 (en) | Generating product descriptions from user reviews | |
US20210264507A1 (en) | Interactive product review interface | |
KR102460293B1 (ko) | 거래 피드백의 처리 | |
CN112823369B (zh) | 使用机器学习生成个性化条幅图像 | |
US20170364967A1 (en) | Product feedback evaluation and sorting | |
CN109416697A (zh) | 使用结果反馈的搜索系统 | |
CN110785755B (zh) | 用于内容生成的上下文识别 | |
CN112825180A (zh) | 经验证的视频评论 | |
US11887134B2 (en) | Product performance with location on page analysis | |
CN112785365A (zh) | 用于高效列表创建的兼容型号确定 | |
US12141841B2 (en) | Generating accompanying text creative | |
US20220351251A1 (en) | Generating accompanying text creative |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |