CN110427574A - 路线相似度确定方法、装置、设备和介质 - Google Patents
路线相似度确定方法、装置、设备和介质 Download PDFInfo
- Publication number
- CN110427574A CN110427574A CN201910712478.XA CN201910712478A CN110427574A CN 110427574 A CN110427574 A CN 110427574A CN 201910712478 A CN201910712478 A CN 201910712478A CN 110427574 A CN110427574 A CN 110427574A
- Authority
- CN
- China
- Prior art keywords
- route
- target
- similarity
- determining
- click
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 239000013598 vector Substances 0.000 claims abstract description 108
- 238000004364 calculation method Methods 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000005065 mining Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Navigation (AREA)
Abstract
本发明实施例公开了一种路线相似度确定方法、装置、设备和介质,涉及路线规划技术领域。该方法包括:从目标时段的历史点击路线中确定目标路线对,并从所述历史点击路线的点击用户中确定至少一个目标用户;根据所述至少一个目标用户的路线点击数量,确定所述目标路线对第一路线的第一特征向量和第二路线的第二特征向量;计算所述第一特征向量和所述第二特征向量之间的相似度,并将该相似度作为所述第一路线与所述第二路线之间的相似度。本发明实施例提供一种路线相似度确定方法、装置、设备和介质,实现了用户已点击路线与用户未点击路线之间相似度的确定,进而基于相似度从未点击路线中挖掘用户的潜在感兴趣路线。
Description
技术领域
本发明实施例涉及路线规划技术领域,尤其涉及一种路线相似度确定方法、装置、设备和介质。
背景技术
货运平台每日为数百万司机在数万条路线上匹配数百万货源。然而由于司机起始地及目的地的差异巨大,有很大一部分司机所感兴趣路线上可以匹配的货源较少,并且司机不清楚自己潜在感兴趣的其他路线。因此,需要为司机确定该类路线,从而帮助司机发现更多可以匹配的货物。
现有实现方案为根据地理位置推荐该路线起终点周边城市的路线。
上述方案存在如下缺点:
1、数目限制,由于一个城市周围城市数目有限,因此确定的潜在感兴趣路线的数量也有限。
2、基于地理位置无法反应城市本身供需情况,如一些城市货物很少,或关注该城市司机很少,无法区别对待,导致无法根据真实供需情况匹配司机货物。
3、近程路线、中程路线和远程路线对于相似路线的概念仅仅与起终点周围的城市相关,因此不足以满足远程司机对距离更远的城市中货物的需求。
发明内容
本发明实施例提供一种路线相似度确定方法、装置、设备和介质,以确定用户已点击路线与未点击路线之间的相似度,进而基于相似度从未点击路线中确定用户的潜在感兴趣路线,其中该潜在感兴趣路线的数目不受起终点周围城市数目的限制,在该潜在感兴趣路线上可以匹配到的货物更多,且该潜在感兴趣路线包括距离起终点较远城市的路线。
第一方面,本发明实施例提供了一种路线相似度确定方法,该方法包括:
从目标时段的历史点击路线中确定目标路线对,并从所述历史点击路线的点击用户中确定至少一个目标用户;
根据所述至少一个目标用户在目标时段内对所述目标路线对中第一路线的点击数量,确定所述第一路线的第一特征向量;
根据所述至少一个目标用户在目标时段内对所述目标路线对中第二路线的点击数量,确定所述第二路线的第二特征向量;
计算所述第一特征向量和所述第二特征向量之间的相似度,并将该相似度作为所述第一路线与所述第二路线之间的相似度。
第二方面,本发明实施例还提供了一种路线相似度确定装置,该装置包括:
路线对确定模块,用于从目标时段的历史点击路线中确定目标路线对,并从所述历史点击路线的点击用户中确定至少一个目标用户;
第一向量确定模块,用于根据所述至少一个目标用户在目标时段内对所述目标路线对中第一路线的点击数量,确定所述第一路线的第一特征向量;
第二向量确定模块,用于根据所述至少一个目标用户在目标时段内对所述目标路线对中第二路线的点击数量,确定所述第二路线的第二特征向量;
相似度计算模块,用于计算所述第一特征向量和所述第二特征向量之间的相似度,并将该相似度作为所述第一路线与所述第二路线之间的相似度。
第三方面,本发明实施例还提供了一种电子设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一项所述的路线相似度确定方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一项所述的路线相似度确定方法。
本发明实施例通过从所述历史点击路线的点击用户中确定至少一个目标用户;根据所述至少一个目标用户在目标时段内对所述目标路线对中第一路线的点击数量,确定所述第一路线的第一特征向量;根据所述至少一个目标用户在目标时段内对所述目标路线对中第二路线的点击数量,确定所述第二路线的第二特征向量;计算所述第一特征向量和所述第二特征向量之间的相似度,并将该相似度作为所述第一路线与所述第二路线之间的相似度,从而实现路线之间相似度的确定,进而根据确定的相似度挖掘用户的潜在感兴趣路线。
因为本发明实施例不依赖路线起终点周边城市,所以不受周围城市数目的影响,并且可以包括距离起终点较远城市的路线。
因为目标用户对路线的点击数量反映有路线途径城市的供需量,所以基于本发明实施例相似度确定的潜在感兴趣路线能够匹配更多地货物。
此外,通过目标用户对路线的点击数量确定路线的特征向量,根据两路线的特征向量之间的相似度确定两路线之间的相似度,从而实现将路线的点击数量与路线的相似度确定相关联。因为通常点击路线次数多的用户的点击数据的利用价值,并不高于点击路线次数少的用户的点击数据的利用价值,所以通过上述路线的点击数量与路线的相似度确定的关联,可以降低点击路线次数多的用户的点击数据对路线的相似度确定的影响,进而提高相似度确定的准确率。
附图说明
图1为本发明实施例一提供的一种路线相似度确定方法的流程图;
图2是本发明实施例二提供的一种路线相似度确定方法的流程图;
图3是本发明实施例三提供的一种路线相似度确定方法的流程图;
图4是本发明实施例四提供的一种路线相似度确定装置的结构示意图;
图5为本发明实施例五提供的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种路线相似度确定方法的流程图。本实施例可适用于对两路线进行相似度确定的情况。典型地,本实施例可适用于对目标用户感兴趣路线和其他路线进行相似度确定,进而从其他路线中挖掘目标用户的潜在感兴趣路线的情况。该方法可以由一种路线相似度确定装置来执行,该装置可以由软件和/或硬件的方式实现。参见图1,本实施例提供的路线相似度确定方法包括:
S110、从目标时段的历史点击路线中确定目标路线对,并从所述历史点击路线的点击用户中确定至少一个目标用户。
其中,目标时段是历史时间的一个时间段,具体可以根据实际需要设定。
可选地,目标时段可以是历史时间中的一个月,也可以是历史时间中的一天。
历史点击路线是指在目标时段内用户点击的路线。
目标路线对是指待相似度确定的两条路线。
目标用户是为后续相似度计算提供计算数据的用户。
具体地,从目标时段的历史点击路线中确定目标路线对,包括:
从目标时段的不同历史点击路线中确定两条不同的历史点击路线,作为目标路线对。
典型地,所述从目标时段的历史点击路线中确定目标路线对,包括:
获取目标时段的历史点击路线、所述历史点击路线的点击时间和点击用户;
根据所述历史点击路线的点击时间,按照设定时间间隔对同一点击用户的历史点击路线进行分组,生成至少一个候选路线组,并为所述至少一个候选路线组分别设置不同的候选用户标识;
从任一所述候选路线组的历史点击路线中,确定所述目标路线对中的第一路线和第二路线。
具体地,从任一所述候选路线组的历史点击路线中,确定所述目标路线对中的第一路线和第二路线,包括:
从任一候选路线组的历史点击路线中选择两个不同的历史点击路线,作为所述目标路线对中的第一路线和第二路线。
典型地,所述从任一所述候选路线组的历史点击路线中,确定所述目标路线对中的第一路线和第二路线,包括:
删除每个所述路线组中的重复路线;
对每个经过去重的路线组中的历史点击路线进行两两组合,生成候选路线对;
确定所述目标路线对中的第一路线;
依据所述目标路线对中的第一路线,从所述候选路线对中查找与所述第一路线具有关联关系的所述第二路线。
可选地,从所述历史点击路线的点击用户中确定至少一个目标用户,包括:
将所述历史点击路线的全部点击用户均作为目标用户;或者,
将所述历史点击路线中的部分点击用户作为目标用户;或者,
将所述历史单击路线中点击第一路线的用户和点击第二路线的用户,作为目标用户。
S120、根据所述至少一个目标用户在目标时段内对所述目标路线对中第一路线的点击数量,确定所述第一路线的第一特征向量。
其中,第一特征向量是描述第一路线特征的向量。
具体地,根据所述至少一个目标用户在目标时段内对所述目标路线对中第一路线的点击数量,确定所述第一路线的第一特征向量,包括:
将所述至少一个目标用户在目标时段内对所述目标路线对中第一路线的点击数量,作为所述第一路线的第一特征向量。
S130、根据所述至少一个目标用户在目标时段内对所述目标路线对中第二路线的点击数量,确定所述第二路线的第二特征向量。
其中,第二特征向量是描述第二路线特征的向量。
具体地,根据所述至少一个目标用户在目标时段内对所述目标路线对中第二路线的点击数量,确定所述第二路线的第二特征向量,包括:
将所述至少一个目标用户在目标时段内对所述目标路线对中第二路线的点击数量,作为所述第二路线的第二特征向量。
S140、计算所述第一特征向量和所述第二特征向量之间的相似度,并将该相似度作为所述第一路线与所述第二路线之间的相似度。
具体地,可以依据现有的任意向量之间相似的计算方法,计算所述第一特征向量和所述第二特征向量之间的相似度,本实施例对此并不进行限制。
本发明实施例对S120和S130的执行步骤不做限定,可选的,S130可以先于S120执行。
本发明实施例的技术方案,通过从所述历史点击路线的点击用户中确定至少一个目标用户;根据所述至少一个目标用户在目标时段内对所述目标路线对中第一路线的点击数量,确定所述第一路线的第一特征向量;根据所述至少一个目标用户在目标时段内对所述目标路线对中第二路线的点击数量,确定所述第二路线的第二特征向量;计算所述第一特征向量和所述第二特征向量之间的相似度,并将该相似度作为所述第一路线与所述第二路线之间的相似度,从而确定路线之间的相似度,进而根据确定的相似度挖掘用户的潜在感兴趣路线。
因为本发明实施例不依赖路线起终点周边城市,所以不受周围城市数目的影响,并且可以包括距离起终点较远城市的路线。
因为目标用户对路线的点击数量反映有路线途径城市的供需量,所以基于本发明实施例相似度确定的潜在感兴趣路线能够匹配更多地货物。
此外,通过目标用户对路线的点击数量确定路线的特征向量,根据两路线的特征向量之间的相似度确定两路线之间的相似度,从而实现将路线的点击数量与路线的相似度确定相关联。因为通常点击路线次数多的用户的点击数据的利用价值,并不高于点击路线次数少的用户的点击数据的利用价值,所以通过上述路线的点击数量与路线的相似度确定的关联,可以降低点击路线次数多的用户的点击数据对路线的相似度确定的影响,进而提高相似度确定的准确率。
实施例二
图2是本发明实施例二提供的一种路线相似度确定方法的流程图。本实施例是在上述实施例的基础上提出的一种可选方案。参见图2,本实施例提供的路线相似度确定方法包括:
S210、从目标时段的历史点击路线中确定目标路线对,并从所述历史点击路线的点击用户中确定至少一个目标用户。
S220、对所述至少一个目标用户进行排序。
本实施例对目标用户的排列顺序不做限定,具体可以根据实际需要确定。
具体地,可以按照设定排列顺序,对所述至少一个目标用户进行排序。
S230、根据每个所述目标用户的排列顺序和该目标用户点击所述第一路线的数量,确定所述第一特征向量。
具体地,所述根据每个所述目标用户的排列顺序和该目标用户点击所述第一路线的数量,确定所述第一特征向量,包括:
根据每个所述目标用户点击所述第一路线的数量,确定该目标用户对所述第一路线的点击权重;
按照每个所述目标用户的排列顺序,对该目标用户的点击权重进行排序,生成特征矩阵;
将所述特征矩阵作为所述第一特征向量。
可选地,根据每个所述目标用户点击所述第一路线的数量,确定该目标用户对所述第一路线的点击权重,包括:
将所述目标用户点击所述第一路线的数量,作为所述目标用户对所述第一路线的点击权重;或
根据所述目标用户点击所述第一路线的数量,确定该目标用户对所述第一路线是否感兴趣;
根据确定的目标用户对所述第一路线的感兴趣情况,确定所述目标用户对所述第一路线的点击权重。
例如,若目标用户对所述第一路线感兴趣,则确定该目标用户对所述第一路线的点击权重为1,否则确定该目标用户对所述第一路线的点击权重为0。
S240、根据每个所述目标用户的排列顺序和该目标用户点击所述第二路线的数量,确定所述第二特征向量。
其中,S240具体的计算过程与S230相同,本实施例对此不再赘述。
S250、计算所述第一特征向量和所述第二特征向量之间的相似度,并将该相似度作为所述第一路线与所述第二路线之间的相似度。
本发明实施例的技术方案,通过对所述至少一个目标用户进行排序;根据每个所述目标用户的排列顺序和该目标用户点击路线的数量,确定路线的特征向量,从而实现对路线的特征向量的确定。
因为目标用户对路线的点击数量,可以准确反应路线的点击特征,所以根据该点击数量确定的特征向量,可以提高对路线的描述准确率。
为降低点击路线次数多的用户的点击数据对路线的相似度确定的影响,所述目标用户对所述第一路线的点击权重与所述目标用户点击所述第一路线的数量负相关。
实施例三
图3是本发明实施例三提供的一种路线相似度确定方法的流程图。本实施例是在上述实施例的基础上,以目标时段为一个月,所有司机一个月内通过货运平台应用点击货物所在发货路线(市级)数据为数据来源为例,提出的一种可选方案。参见图3,本实施例提供的路线相似度确定方法包括:
获取一个月内的历史点击路线数据作为原始数据。
根据所述历史点击路线的点击时间,按照设定时间间隔对原始数据中同一点击用户的历史点击路线序列进行分组,生成至少一个候选路线组,并对每个候选路线组中的路线进行去重。
对经过去重的每个候选路线组中的路线进行两两组合,生成候选路线对。
计算每个用户针对每个路线的点击权重,具体地用户的点击权重=1/g(n),其中n为该用户点击该路线的数量,g可取简单递增函数。
对点击过每条路线的每个用户的点击权重进行组合,生成该条路线的特征向量。
计算每条路线的特征向量的几何距离,也即该特征向量的模。
确定目标路线对中的第一路线,并根据所述第一路线和所述候选路线对,确定目标路线对中的第二路线。
计算第一路线的特征向量与第二路线的特征向量的向量积,记为Sim1。
计算第一路线的特征向量的几何距离与第二路线的特征向量的几何距离的乘积,记为Sim2。
依照如下公式,计算目标路线对中第一路线和第二路线之间的相似度:
Sim=Sim1/Sim2
其中,Sim表示目标路线对中第一路线和第二路线之间的相似度。
通过上述方法实现对目标时段内历史点击路线中每两条路线之间相似度的确定。
具体地,上述方法的计算原理如下:
参见表1,假设对两条路线感兴趣的所有用户构成矩阵,1代表感兴趣,0代表不感兴趣。
表1
那么,第一路线的特征向量为(0,1,0,1,0),第二路线的特征向量为(1,1,0,1,0)。
使用路线的特征向量夹角表示两条路线的相似度,具体计算公式如下:
进一步,因为通常点击数量很大的用户并不能反应路线之间的关联,反而点击数量较少的用户点击的几条路线真正反应路线相关性,所以采用函数f(x)取代上个矩阵中的0与1,f(x)通常可以取为1/g(n),从而使得更大点击量的用户得到更小的系数,其中n为该用户点击该路线的数量,g可取简单递增函数。因此参见表2,矩阵可变为如下:
表2
那么,第一路线的特征向量为(0,1/30,0,1/100,0),第二路线的特征向量为(1/150,1/30,0,1/100,0)。
表2中所示的两路线的相似度可以依据如下公式确定:
本发明实施例的技术方案,通过将路线当作高维向量空间中的向量,将司机兴趣作为高维向量空间中的坐标轴,将向量在坐标轴上的长度与司机活跃程度相关联,确定多数司机共同偏好的路线。
实施例四
图4是本发明实施例四提供的一种路线相似度确定装置的结构示意图。参见图4,本实施例提供的路线相似度确定装置包括:路线对确定模块10、第一向量确定模块20、第二向量确定模块30和相似度计算模块40。
其中,路线对确定模块10,用于从目标时段的历史点击路线中确定目标路线对,并从所述历史点击路线的点击用户中确定至少一个目标用户;
第一向量确定模块20,用于根据所述至少一个目标用户在目标时段内对所述目标路线对中第一路线的点击数量,确定所述第一路线的第一特征向量;
第二向量确定模块30,用于根据所述至少一个目标用户在目标时段内对所述目标路线对中第二路线的点击数量,确定所述第二路线的第二特征向量;
相似度计算模块40,用于计算所述第一特征向量和所述第二特征向量之间的相似度,并将该相似度作为所述第一路线与所述第二路线之间的相似度。
本发明实施例通过从所述历史点击路线的点击用户中确定至少一个目标用户;根据所述至少一个目标用户在目标时段内对所述目标路线对中第一路线的点击数量,确定所述第一路线的第一特征向量;根据所述至少一个目标用户在目标时段内对所述目标路线对中第二路线的点击数量,确定所述第二路线的第二特征向量;计算所述第一特征向量和所述第二特征向量之间的相似度,并将该相似度作为所述第一路线与所述第二路线之间的相似度,从而实现路线之间相似度的确定,进而根据确定的相似度挖掘用户的潜在感兴趣路线。
因为本发明实施例不依赖路线起终点周边城市,所以不受周围城市数目的影响,并且可以包括距离起终点较远城市的路线。
因为目标用户对路线的点击数量反映有路线途径城市的供需量,所以基于本发明实施例相似度确定的潜在感兴趣路线能够匹配更多地货物。
此外,通过目标用户对路线的点击数量确定路线的特征向量,根据两路线的特征向量之间的相似度确定两路线之间的相似度,从而实现将路线的点击数量与路线的相似度确定相关联。因为通常点击路线次数多的用户的点击数据的利用价值,并不高于点击路线次数少的用户的点击数据的利用价值,所以通过上述路线的点击数量与路线的相似度确定的关联,可以降低点击路线次数多的用户的点击数据对路线的相似度确定的影响,进而提高相似度确定的准确率。进一步地,所述第一向量确定模块,包括:用户排序单元和第一向量确定单元。
其中,用户排序单元,用于对所述至少一个目标用户进行排序;
第一向量确定单元,用于根据每个所述目标用户的排列顺序和该目标用户点击所述第一路线的数量,确定所述第一特征向量。
进一步地,所述目标用户对所述第一路线的点击权重与所述目标用户点击所述第一路线的数量负相关。
进一步地,所述路线对确定模块,包括:路线获取单元、路线分组单元和目标路线对确定单元。
其中,路线获取单元,用于获取目标时段的历史点击路线、所述历史点击路线的点击时间和点击用户;
路线分组单元,用于根据所述历史点击路线的点击时间,按照设定时间间隔对同一点击用户的历史点击路线进行分组,生成至少一个候选路线组,并为所述至少一个候选路线组分别设置不同的候选用户标识;
目标路线对确定单元,用于从任一所述候选路线组的历史点击路线中,确定所述目标路线对中的第一路线和第二路线。
本发明实施例所提供的路线相似度确定装置可执行本发明任意实施例所提供的路线相似度确定方法,具备执行方法相应的功能模块和有益效果。
实施例五
图5为本发明实施例5提供的一种设备的结构示意图,如图5所示,该设备包括处理器70、存储器71、输入装置72和输出装置73;设备中处理器70的数量可以是一个或多个,图5中以一个处理器70为例;设备中的处理器70、存储器71、输入装置72和输出装置73可以通过总线或其他方式连接,图5中以通过总线连接为例。
存储器71作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的路线相似度确定方法对应的程序指令/模块(例如,路线相似度确定装置中的路线对确定模块10、第一向量确定模块20、第二向量确定模块30和相似度计算模块40)。处理器70通过运行存储在存储器71中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的路线相似度确定方法。
存储器71可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器71可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器71可进一步包括相对于处理器70远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置72可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置73可包括显示屏等显示设备。
实施例六
本发明实施例六还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种路线相似度确定方法,该方法包括:
从目标时段的历史点击路线中确定目标路线对,并从所述历史点击路线的点击用户中确定至少一个目标用户;
根据所述至少一个目标用户在目标时段内对所述目标路线对中第一路线的点击数量,确定所述第一路线的第一特征向量;
根据所述至少一个目标用户在目标时段内对所述目标路线对中第二路线的点击数量,确定所述第二路线的第二特征向量;
计算所述第一特征向量和所述第二特征向量之间的相似度,并将该相似度作为所述第一路线与所述第二路线之间的相似度。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的路线相似度确定方法中的相关操作.
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述路线相似度确定装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种路线相似度确定方法,其特征在于,包括:
从目标时段的历史点击路线中确定目标路线对,并从所述历史点击路线的点击用户中确定至少一个目标用户;
根据所述至少一个目标用户在目标时段内对所述目标路线对中第一路线的点击数量,确定所述第一路线的第一特征向量;
根据所述至少一个目标用户在目标时段内对所述目标路线对中第二路线的点击数量,确定所述第二路线的第二特征向量;
计算所述第一特征向量和所述第二特征向量之间的相似度,并将该相似度作为所述第一路线与所述第二路线之间的相似度。
2.根据权利要求1所述的方法,其特征在于,所述根据所述至少一个目标用户在目标时段内对所述目标路线对中第一路线的点击数量,确定所述第一路线的第一特征向量,包括:
对所述至少一个目标用户进行排序;
根据每个所述目标用户的排列顺序和该目标用户点击所述第一路线的数量,确定所述第一特征向量。
3.根据权利要求2所述的方法,其特征在于,所述根据每个所述目标用户的排列顺序和该目标用户点击所述第一路线的数量,确定所述第一特征向量,包括:
根据每个所述目标用户点击所述第一路线的数量,确定该目标用户对所述第一路线的点击权重;
按照每个所述目标用户的排列顺序,对该目标用户的点击权重进行排序,生成特征矩阵;
将所述特征矩阵作为所述第一特征向量。
4.根据权利要求3所述的方法,其特征在于,所述目标用户对所述第一路线的点击权重与所述目标用户点击所述第一路线的数量负相关。
5.根据权利要求1所述的方法,其特征在于,所述从目标时段的历史点击路线中确定目标路线对,包括:
获取目标时段的历史点击路线、所述历史点击路线的点击时间和点击用户;
根据所述历史点击路线的点击时间,按照设定时间间隔对同一点击用户的历史点击路线进行分组,生成至少一个候选路线组,并为所述至少一个候选路线组分别设置不同的候选用户标识;
从任一所述候选路线组的历史点击路线中,确定所述目标路线对中的第一路线和第二路线。
6.一种路线相似度确定装置,其特征在于,包括:
路线对确定模块,用于从目标时段的历史点击路线中确定目标路线对,并从所述历史点击路线的点击用户中确定至少一个目标用户;
第一向量确定模块,用于根据所述至少一个目标用户在目标时段内对所述目标路线对中第一路线的点击数量,确定所述第一路线的第一特征向量;
第二向量确定模块,用于根据所述至少一个目标用户在目标时段内对所述目标路线对中第二路线的点击数量,确定所述第二路线的第二特征向量;
相似度计算模块,用于计算所述第一特征向量和所述第二特征向量之间的相似度,并将该相似度作为所述第一路线与所述第二路线之间的相似度。
7.根据权利要求6所述的装置,其特征在于,所述第一向量确定模块,包括:
用户排序单元,用于对所述至少一个目标用户进行排序;
第一向量确定单元,用于根据每个所述目标用户的排列顺序和该目标用户点击所述第一路线的数量,确定所述第一特征向量。
8.根据权利要求7所述的装置,其特征在于,所述第一向量确定单元具体用于:
根据每个所述目标用户点击所述第一路线的数量,确定该目标用户对所述第一路线的点击权重;
按照每个所述目标用户的排列顺序,对该目标用户的点击权重进行排序,生成特征矩阵;
将所述特征矩阵作为所述第一特征向量。
9.一种电子设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一项所述的路线相似度确定方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的路线相似度确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910712478.XA CN110427574B (zh) | 2019-08-02 | 2019-08-02 | 路线相似度确定方法、装置、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910712478.XA CN110427574B (zh) | 2019-08-02 | 2019-08-02 | 路线相似度确定方法、装置、设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110427574A true CN110427574A (zh) | 2019-11-08 |
CN110427574B CN110427574B (zh) | 2022-10-14 |
Family
ID=68412358
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910712478.XA Active CN110427574B (zh) | 2019-08-02 | 2019-08-02 | 路线相似度确定方法、装置、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110427574B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111126909A (zh) * | 2019-12-20 | 2020-05-08 | 贵阳货车帮科技有限公司 | 货源路线的数据处理方法、装置、设备及存储介质 |
CN113762667A (zh) * | 2020-08-13 | 2021-12-07 | 北京京东振世信息技术有限公司 | 一种车辆调度方法和装置 |
CN114218288A (zh) * | 2021-11-09 | 2022-03-22 | 北京中交兴路车联网科技有限公司 | 一种行车路线推荐方法、装置、存储介质及终端 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017041541A1 (zh) * | 2015-09-08 | 2017-03-16 | 北京邮电大学 | 推送推荐信息的方法、服务器及存储介质 |
CN108806241A (zh) * | 2017-04-27 | 2018-11-13 | 高德软件有限公司 | 一种常用驾车路线的确定方法及装置 |
CN109241403A (zh) * | 2018-08-03 | 2019-01-18 | 腾讯科技(深圳)有限公司 | 项目推荐方法、装置、机器设备和计算机可读存储介质 |
CN109299327A (zh) * | 2018-11-16 | 2019-02-01 | 广州市百果园信息技术有限公司 | 视频推荐方法、装置、设备及存储介质 |
CN109658033A (zh) * | 2018-12-26 | 2019-04-19 | 江苏满运软件科技有限公司 | 货源路线相似度计算方法、系统、设备及存储介质 |
CN109668570A (zh) * | 2018-12-21 | 2019-04-23 | 斑马网络技术有限公司 | 行驶路线推荐方法、装置、系统以及存储介质 |
-
2019
- 2019-08-02 CN CN201910712478.XA patent/CN110427574B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017041541A1 (zh) * | 2015-09-08 | 2017-03-16 | 北京邮电大学 | 推送推荐信息的方法、服务器及存储介质 |
CN108806241A (zh) * | 2017-04-27 | 2018-11-13 | 高德软件有限公司 | 一种常用驾车路线的确定方法及装置 |
CN109241403A (zh) * | 2018-08-03 | 2019-01-18 | 腾讯科技(深圳)有限公司 | 项目推荐方法、装置、机器设备和计算机可读存储介质 |
CN109299327A (zh) * | 2018-11-16 | 2019-02-01 | 广州市百果园信息技术有限公司 | 视频推荐方法、装置、设备及存储介质 |
CN109668570A (zh) * | 2018-12-21 | 2019-04-23 | 斑马网络技术有限公司 | 行驶路线推荐方法、装置、系统以及存储介质 |
CN109658033A (zh) * | 2018-12-26 | 2019-04-19 | 江苏满运软件科技有限公司 | 货源路线相似度计算方法、系统、设备及存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111126909A (zh) * | 2019-12-20 | 2020-05-08 | 贵阳货车帮科技有限公司 | 货源路线的数据处理方法、装置、设备及存储介质 |
CN111126909B (zh) * | 2019-12-20 | 2023-08-08 | 贵阳货车帮科技有限公司 | 货源路线的数据处理方法、装置、设备及存储介质 |
CN113762667A (zh) * | 2020-08-13 | 2021-12-07 | 北京京东振世信息技术有限公司 | 一种车辆调度方法和装置 |
CN114218288A (zh) * | 2021-11-09 | 2022-03-22 | 北京中交兴路车联网科技有限公司 | 一种行车路线推荐方法、装置、存储介质及终端 |
Also Published As
Publication number | Publication date |
---|---|
CN110427574B (zh) | 2022-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108804641B (zh) | 一种文本相似度的计算方法、装置、设备和存储介质 | |
CN109086394B (zh) | 搜索排序方法、装置、计算机设备和存储介质 | |
CN109241415B (zh) | 项目推荐方法、装置、计算机设备及存储介质 | |
CN105335409B (zh) | 一种目标用户的确定方法、设备和网络服务器 | |
US20210035126A1 (en) | Data processing method, system and computer device based on electronic payment behaviors | |
CN110888866B (zh) | 数据扩充方法、装置、数据处理设备及存储介质 | |
CN110427574B (zh) | 路线相似度确定方法、装置、设备和介质 | |
CN111639253B (zh) | 一种数据判重方法、装置、设备及存储介质 | |
CN105205188A (zh) | 采购物料供应商的推荐方法及推荐装置 | |
CN107491537A (zh) | Poi数据挖掘、信息检索方法、装置、设备及介质 | |
CN112102031A (zh) | 一种推荐方法、推荐装置及终端设备 | |
CN111814056A (zh) | 基于信息处理的供应商推荐方法及相关设备 | |
CN110827101A (zh) | 一种店铺推荐的方法和装置 | |
CN108536695B (zh) | 一种地理位置信息点的聚合方法以及装置 | |
CN109241360B (zh) | 组合字符串的匹配方法及装置和电子设备 | |
WO2018205391A1 (zh) | 信息检索准确性评估方法、系统、装置及计算机可读存储介质 | |
CN113407849A (zh) | 一种粗排序的方法及装置 | |
CN112767032A (zh) | 一种信息处理方法、装置、电子设备及存储介质 | |
CN111897894A (zh) | Poi检索热度确定方法、装置、设备及存储介质 | |
CN110443493B (zh) | 路线相似度确定方法、装置、设备和介质 | |
CN116383340A (zh) | 信息搜索方法、装置、电子设备和存储介质 | |
CN115758271A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN115114532A (zh) | 一种基于用户行为的数据搜索方法、装置及设备 | |
CN110929207A (zh) | 数据处理方法、装置和计算机可读存储介质 | |
CN113065071B (zh) | 一种产品信息推荐方法及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |