Nothing Special   »   [go: up one dir, main page]

KR102601545B1 - 지리 위치점 정렬 방법, 정렬 모델 트레이닝 방법 및 대응하는 장치 - Google Patents

지리 위치점 정렬 방법, 정렬 모델 트레이닝 방법 및 대응하는 장치 Download PDF

Info

Publication number
KR102601545B1
KR102601545B1 KR1020210061794A KR20210061794A KR102601545B1 KR 102601545 B1 KR102601545 B1 KR 102601545B1 KR 1020210061794 A KR1020210061794 A KR 1020210061794A KR 20210061794 A KR20210061794 A KR 20210061794A KR 102601545 B1 KR102601545 B1 KR 102601545B1
Authority
KR
South Korea
Prior art keywords
user
geographic location
data
model
preference
Prior art date
Application number
KR1020210061794A
Other languages
English (en)
Other versions
KR20210141393A (ko
Inventor
미아오 판
지저우 황
위판 호우
Original Assignee
바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 filed Critical 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
Publication of KR20210141393A publication Critical patent/KR20210141393A/ko
Application granted granted Critical
Publication of KR102601545B1 publication Critical patent/KR102601545B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/909Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Library & Information Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 지리 위치점 정렬 방법, 정렬 모델 트레이닝 방법 및 대응하는 장치를 개시하였는 바, 빅 데이터 기술 분야에 관한 것이다. 구체적으로 실현 방안은 사용자로부터 수직 유형의 지리 위치점 검색 요청을 수신하는 것; 상기 수직 유형의 후보 지리 위치점 데이터를 상기 사용자의 선호도 모델에 입력하여 상기 사용자의 각각의 후보 지리 위치점에 대한 선호도 점수를 얻는 것; 상기 사용자의 각각의 후보 지리 위치점에 대한 선호도 점수를 각각의 후보 지리 위치점의 정렬 특징 중 하나로 설정하여 정렬 모델에 입력하여 각각의 후보 지리 위치점의 정렬 점수를 얻는 것; 및 상기 각각의 후보 위치점의 정렬 점수에 기반하여 상기 사용자에 피드백하는 검색 결과를 결정하는 것을 포함한다. 본 발명은 사용자가 수직 유형의 지리 위치점을 검색할 때, 사용자의 선호도 요소를 정렬에 통합함으로써, 검색 결과가 사용자 개성화 수요를 충족시키도록 한다.

Description

지리 위치점 정렬 방법, 정렬 모델 트레이닝 방법 및 대응하는 장치 {GEOGRAPHIC POSITION POINT RANKING METHOD, RANKING MODEL TRAINING METHOD AND CORRESPONDING DEVICE}
본 발명은 컴퓨터 애플리케이션 기술 분야에 관한 것인 바, 특히 빅 데이터 기술에 관한 것이다.
사용자가 지도 형 애플리케이션을 사용하는 과정에서, 종종 호텔을 검색하려고 하지만, 명확한 목표가 없으면, 검색 창 내에 예를 들면 “호텔”, “여관”, “게스트 하우스”와 같은 POI(Point Of Interest, 관심 점) 유형에 관한 키 포인트 단어를 입력하여 검색하거나, 또는 “주변 찾기” 인터페이스에서 “호텔” 버튼을 클릭하여 부근의 모든 호텔 유형의 POI를 검색한다. 지도 형 애플리케이션은 후보의 호텔 유형 POI를 정렬한 후, 정렬 결과에 기반하여 호텔 유형 POI를 사용자에 추천한다.
그러나, 종래 기술에서의 후보의 호텔 유형 POI를 정렬할 때, 지리 위치, 호텔 평가, 별점, 가격, 인기 상황 등 호텔 특징을 기반으로 하는 경우가 많지만, 모든 사용자에 대해 동일한 지리 위치에 기반하여 얻은 정렬 결과가 모두 동일하므로, 사용자의 개성화 수요를 충족시키지 못한다.
이를 감안하여, 본 발명은 이하의 기술적 방안을 제공하여, 사용자의 개성화 검색 수요를 충족시킨다.
제1 측면에 있어서, 본 발명은 지리 위치점 정렬 방법을 제공하는 바, 당해 방법은,
사용자로부터 수직 유형의 지리 위치점 검색 요청을 수신하는 것;
상기 수직 유형의 후보 지리 위치점 데이터를 상기 사용자의 선호도 모델에 입력하여 상기 사용자의 각각의 후보 지리 위치점에 대한 선호도 점수를 얻는 것;
상기 사용자의 각각의 후보 지리 위치점에 대한 선호도 점수를 각각의 후보 지리 위치점의 정렬 특징 중 하나로 설정하여 정렬 모델에 입력하여 각각의 후보 지리 위치점의 정렬 점수를 얻는 것; 및
상기 각각의 후보 위치점의 정렬 점수에 기반하여 상기 사용자에 피드백하는 검색 결과를 결정하는 것을 포함한다.
제2 측면에 있어서, 본 발명은 정렬 모델 트레이닝 방법을 제공하는 바, 당해 방법은,
지도 형 애플리케이션 데이터 중에서 제1 트레이닝 데이터를 취득하는 것 - 상기 제1 트레이닝 데이터는 사용자가 과거 방문한 적이 있는 수직 유형의 지리 위치점 데이터를 포함하고, 상기 방문은 검색, 클릭 또는 현장 방문을 포함함 -;
상기 제1 트레이닝 데이터를 이용하여 상기 사용자의 선호도 모델을 트레이닝하는 것;
상기 사용자의 선호도 모델을 이용하여 상기 사용자의 제2 트레이닝 데이터 중의 상기 수직 유형의 각각의 지리 위치점에 대한 선호도 점수를 취득하는 것; 및
상기 제2 트레이닝 데이터를 이용하여 정렬 모델을 트레이닝하는 것 - 상기 사용자의 제2 트레이닝 데이터 중의 각각의 지리 위치점에 대한 선호도 점수를 상기 정렬 모델을 트레이닝하기 위한 정렬 특징 중 하나로 설정함 -을 포함한다.
제3 측면에 있어서, 본 발명은 지리 위치점 정렬 장치를 더 제공하는 바, 당해 장치는,
사용자로부터 수직 유형의 지리 위치점 검색 요청을 수신하기 위한 요청 수신 유닛;
상기 수직 유형의 후보 지리 위치점 데이터를 상기 사용자의 선호도 모델에 입력하여 상기 사용자의 각각의 후보 지리 위치점에 대한 선호도 점수를 얻기 위한 선호도 결정 유닛;
상기 사용자의 각각의 후보 지리 위치점에 대한 선호도 점수를 각각의 후보 지리 위치점의 정렬 특징 중 하나로 설정하여 정렬 모델에 입력하여 각각의 후보 지리 위치점의 정렬 점수를 얻기 위한 정렬 처리 유닛; 및
상기 각각의 후보 위치점의 정렬 점수에 기반하여 상기 사용자에 피드백하는 검색 결과를 결정하기 위한 결과 결정 유닛을 구비한다.
제4 측면에 있어서, 본 발명은 정렬 모델 트레이닝 장치를 더 제공하는 바, 당해 장치는,
지도 형 애플리케이션 데이터 중에서 제1 트레이닝 데이터를 취득하기 위한 제1 데이터 취득 유닛 - 상기 제1 트레이닝 데이터는 사용자가 과거 방문한 적이 있는 수직 유형의 지리 위치점 데이터를 포함하고, 상기 방문은 검색, 클릭 또는 현장 방문을 포함함 -;
상기 제1 트레이닝 데이터를 이용하여 상기 사용자의 선호도 모델을 트레이닝하기 위한 제1 모델 트레이닝 유닛;
상기 사용자의 선호도 모델을 이용하여 상기 사용자의 제2 트레이닝 데이터 중의 상기 수직 유형의 각각의 지리 위치점에 대한 선호도 점수를 취득하기 위한 선호도 점수 결정 유닛; 및
상기 제2 트레이닝 데이터를 이용하여 정렬 모델을 트레이닝하기 위한 제2 모델 트레이닝 유닛 - 상기 사용자의 제2 트레이닝 데이터 중의 각각의 지리 위치점에 대한 선호도 점수를 상기 정렬 모델을 트레이닝하기 위한 정렬 특징 중 하나로 설정함 -을 구비한다.
제5 측면에 있어서, 본 발명은 전자 기기를 더 제공하는 바, 당해 전자 기기는,
적어도 하나의 프로세서; 및
상기 적어도 하나의 프로세서와 통신 연결된 메모리를 구비하며,
상기 메모리에는 상기 적어도 하나의 프로세서에 의해 수행 가능한 명령이 기록되어 있으며, 상기 명령이 상기 적어도 하나의 프로세서에 의해 수행되어 상기 적어도 하나의 프로세서로 하여금 상기의 임의의 한 항에 기재된 방법을 실행하도록 한다.
제6 측면에 있어서, 본 발명은 컴퓨터 명령이 기록되어 있는 비 일시적 컴퓨터 판독 가능 기록 매체를 더 제공하는 바,
상기 컴퓨터 명령은 상기 컴퓨터로 하여금 상기의 임의의 한 항에 기재된 방법을 실행하도록 한다.
이상의 기술적 방안으로부터 알 수 있듯이, 본 발명은 사용자가 수직 유형의 지리 위치점을 검색할 때, 사용자의 선호도 요소를 정렬에 통합함으로써, 검색 결과가 사용자 개성화 수요를 충족시키도록 하며, 사용자가 검색 결과 중에서 자신의 선호도와 일치한 지리 위치점을 빠르게 찾을 수 있으므로, 검색 결과 중에서 들추거나 클릭하는 횟수를 줄여 사용자의 시간을 절약하고, 사용자가 지도 형 애플리케이션을 사용할 때의 검색 경험을 향상시킬 수 있다.
상기 선택적인 방식이 가지는 기타 효과는 아래에서 구체적인 실시예를 참조하여 설명하기로 한다.
도면은 본 방안을 더 잘 이해하도록 하기 위한 것이며, 본 발명에 대한 한정을 이루지 않는다.
도 1은 본 발명 실시예를 적용할 수 있는 예시적인 시스템 아키텍처를 나타낸다.
도 2는 본 발명의 실시예 1에 의해 제공되는 지리 위치점 정렬 방법의 플로우 차트이다.
도 3은 본 발명의 실시예 2에 의해 제공되는 정렬 모델 트레이닝 방법의 플로우 차트이다.
도 4는 본 발명의 실시예 3에 의해 제공되는 지리 위치점 정렬 장치의 구조도이다.
도 5는 본 발명의 실시예 4에 의해 제공되는 정렬 모델 트레이닝 장치의 구조도이다.
도 6은 본 발명의 실시예를 실현하기 위한 전자 기기의 블럭도이다.
이하, 도면을 참조하여 본 발명의 시범적인 실시예를 설명하는 바, 본 발명에 대한 이해를 돕기 위해 여기에는 본 발명 실시예의 다양한 세부 사항이 포함되며, 이러한 세부 사항을 단지 시범적인 것으로 간주해야 할 것이다. 따라서, 당업자는 본 발명의 범위 및 정신을 벗어나지 않는 전제 하에서, 여기서 설명되는 실시예에 대해 다양한 변경 및 수정을 수행할 수 있음을 인식해야 한다. 마찬가지로, 명확성 및 간결성을 위하여 이하의 설명에서는 잘 알려진 기능 및 구조의 설명을 생략하였다.
도 1은 본 발명 실시예를 적용할 수 있는 예시적인 시스템 아키텍처를 나타낸다. 도 1에 나타낸 바와 같이, 당해 시스템 아키텍처는 단말 장치(101) 및 (102), 네트워크(103) 및 서버(104)를 포함할 수 있다. 네트워크(103)는 단말 장치(101), (102) 및 서버(104) 사이에 통신 링크의 매체를 제공한다. 네트워크(103)는 다양한 연결 유형을 포함할 수 있는 바, 예를 들면 유선 통신 링크, 무선 통신 링크 또는 광섬유 케이블 등을 포함할 수 있다.
사용자는 단말 장치(101) 및 (102)를 사용하여 네트워크(103)를 통해 서버(104)와 인터랙션할 수 있다. 단말 장치(101) 및 (102) 상에는 다양한 애플리케이션이 설치될 수 있는 바, 예를 들면 지도 형 애플리케이션, 음성 인터랙션 유형의 애플리케이션, 웹 브라우저 애플리케이션, 통신 유형의 애플리케이션 등이 설치될 수 있다.
단말 장치(101) 및 (102)는, 지도 형 애플리케이션을 지원하고 표시할 수 있는 다양한 전자 기기일 수 있으며, 스마트 폰, 태블릿 컴퓨터, 스마트 웨어러블 장치 등을 포함하나 이에 한정되지 않는다. 본 발명에 의해 제공되는 장치는 상기 서버(104)에 설치되어 실행될 수 있다. 상기 장치는 복수의 소프트웨어 또는 소프트웨어 모듈(예를 들면 분산 서비스를 제공함)로 구현되거나, 단일 소프트웨어 또는 소프트웨어 모듈로 구현될 수 있으며, 여기서 구체적으로 한정하지 않는다.
예를 들면, 지리 위치점 정렬 장치는 상기 서버(104)에 설치되어 실행되며, 서버(104)은 단말 장치(101) 또는 (102)로부터 수직 유형의 지리 위치점 검색 요청을 수신하며, 당해 검색 요청은 사용자 관련 정보 및 수직 유형 정보를 포함한다. 지리 위치점 정렬 장치는 본 발명 실시예에 의해 제공되는 방식을 이용하여 지리 위치점의 정렬을 실행하고, 정렬 결과에 기반하여 사용자에 피드백하는 검색 결과를 결정할 수 있다. 또한 검색 결과를 단말 장치(101) 또는 (102)에 피드백할 수 있다. 서버(104) 측에 지도 형 애플리케이션 데이터가 유지되어 있으며, 당해 지도 형 애플리케이션 데이터는 서버(104)의 로컬에 기록되어 있거나, 기타 서버에 기록되어 있을 수 있으며, 서버(104)에 의해 호출될 수 있다.
또한 예를 들면, 정렬 모델 트레이닝 장치는 상기 서버(104)에 설치되어 운행되며, 서버(104)는 지도 형 애플리케이션 데이터를 이용하여 정렬 모델을 트레이닝할 수 있다.
서버(104)는 단일 서버이거나, 복수의 서버로 구성된 서버 그룹일 수 있다. 도 1의 단말 장치, 네트워크 및 서버의 수는 단지 예시적인 것임을 이해해야 한다. 구현 요구에 따라 임의의 수의 단말 장치, 네트워크 및 서버가 존재할 수 있다.
종래 기술에서는 호텔 유형 POI의 정렬 특징이 충분하지 않으며, 사용자 개성화 요소가 반영되지 않았다. 채택된 특징은 단지 호텔 POI 자신의 특성에만 의존할 뿐, 사용자와 관계가 없으므로, 서로 다른 사용자가 동일한 지점에서 실행한 호텔 POI의 검색 결과가 완전히 동일하게 되며, 사용자 선호도 상의 차이를 반영하지 못한다. 예를 들어 설명하면, 어느 사용자의 수입이 상대적으로 높고, 소비 수준도 상대적으로 높으며, 사용 지도 형 애플리케이션에서 호텔 유형 POI의 검색을 실행할 때, 가격이 상대적으로 높고 조건이 상대적으로 높으며 인근 숙박이 가능한 호텔을 더 선호한다. 종래 기술을 통해 당해 사용자에 검색 결과를 피드백할 때, 이러한 선호도 정보를 고려하지 않고, 당해 사용자를 기타 보통 사용자처럼 취급하기에, 검색 결과에서 앞에 정렬된 호텔은 가성비 및 인기가 모두 높을 수 있으나, 당해 사용자의 높은 소비, 고품질, 인근 숙박의 선호도와 일치하지 않으므로, 사용자 경험이 상대적으로 나쁘다.
본 발명의 핵심 사상은, 사용자의 수직 유형의 지리 위치점에 대한 선호도를 정렬 특징 중 하나로 설정하여, 정렬 모델의 정렬에 통합함으로써, 정렬 결과가 사용자의 개성화 수요를 반영하도록 한다. 이하, 실시예와 결합하여 본 발명에 의해 제공되는 방법 및 장치를 상세히 설명한다.
본 발명에 언급된 지리 위치점은 지도 형 애플리케이션 중의 지리 위치점을 의미하는바, 당해 지리 위치점은 사용자의 의해 검색 및 조회될 수 있으며, 사용자에 표시할 수 있다. 이러한 지리 위치점은 위도와 경도, 명칭, 행정 주소, 유형 등 기본 속성이 있다. 여기서 지리 위치점은 POI(Point Of Interest, 관심 점), AOI(Area of Interest, 관심 면), ROI(Regin of Interest, 관심 영역) 등을 포함할 수 있으나 이에 한정되지 않는다. 후속의 실시예에서 모두 POI를 예로 들어 설명한다.
또한 본 발명에 언급된 “수직 유형”은 어느 특정 분야, 특정 수요 또는 특정 산업의 유형을 의미한다. 본 발명에 의해 제공되는 방법에 있어서, 다양한 수직 유형에 적용되며, 특히 소비 유형의 지리 위치점 애플리케이션에 더 적합하다. 예를 들면 호텔 유형, 케이터링 유형, 극장 및 영화관 유형, 상점 및 슈퍼마켓 유형 등일 수 있다. 후속의 실시예에서 모두 호텔 유형을 예로 들어 설명한다.
실시예 1
도 2는 본 발명의 실시예 1에 의해 제공되는 지리 위치점 정렬 방법의 플로우 차트이며, 본 실시예에 있어서, 호텔 유형 POI를 정렬하는 예를 들며, 도 2에 나타낸 바와 같이, 당해 방법은 이하의 단계를 포함할 수 있다.
201에 있어서, 사용자로부터 호텔 유형 POI의 검색 요청을 수신한다.
사용자는 지도 형 애플리케이션의 검색 창 내에 “호텔”, “여관”, “게스트 하우스” 등 수직 유형 정보를 나타내는 키 포인트 단어를 입력하여 호텔 유형 POI의 검색 요청을 트리거할 수 있다. 사용자는 “주변 찾기” 기능 인터페이스에서 “호텔” 레이블 또는 버튼 등을 클릭하여 호텔 유형 POI의 검색 요청을 트리거할 수도 있다. 물론 이 두 경우 이외에, 또한 기타 방식을 통해 호텔 유형 POI의 검색 요청을 트리거할 수 있는바, 본 발명은 이에 대해 한정하지 않는다.
당해 검색 요청은 어느 구체적인 수직 유형의 POI정보를 검색하기 위한 것일뿐, 어느 구체적인 POI를 검색하지 않는바, 하나의 상대적으로 일반화된 검색 수요로 간주할 수 있다는 점을 설명할 필요가 있다.
202에 있어서, 호텔 유형 후보 POI 중 적어도 일부 유형의 특징 데이터에 대해 전처리를 실행하여, 당해 적어도 일부 유형의 특징 데이터의 지역적 차이를 제거한다.
우선 호텔 유형 후보 POI를 결정하는바, 지도 데이터 베이스 중의 모든 호텔 유형 POI를 모두 후보 POI로 설정할 수 있다. 그러나, 계산량을 줄이기 위하여, 바람직하게는, 지도 데이터 베이스 중의 호텔 유형 POI에 대해 이하의 적어도 하나의 필터링 처리를 수행한 후, 나머지 호텔 유형 POI을 후보 지리 위치로 설정할 수 있다.
사용자가 위치한 현재 지점에 기반하여 현재 지점과의 거리가 소정의 거리 임계 값을 초과한 지리 위치를 필터링한다. 즉 사용자와의 거리가 너무 멀리 떨어진 지리 위치를 필터링한다.
사용자의 검색 히스토리(query history)에 기반하여 사용자의 검색 히스토리와의 관련도가 소정의 관련도 임계 값보다 낮은 호텔 유형 POI를 필터링한다. 예를 들면 사용자가 지금까지 검색한 적이 없는 호텔 유형 POI을 직접 필터링한다.
일부 수직 유형의 경우, 서로 다른 지점의 POI는 일부 특징 상에서 명백한 지역적 차이를 나타낸다. 호텔 유형 POI는 이에 대한 표현이 상대적으로 선명하다, 예를 들면 북경의 호텔 가격은 전국의 대부분 도시보다 상대적으로 높은바, 이로 인해 사용자의 과거 방문 데이터 중에서 사용자 선호도를 추출하는데 일정한 어려움이 있으며, 특히 사용자가 복수의 지역을 방문할 때 어려움이 있다. 예를 들어 설명하면, 사용자 1이 북경시 오도구에서 가격이 300위안인 호텔 유형 POI를 클릭하고, 사용자 2가 어느 경제 수준이 상대적으로 낮은 소도시에서 마찬가지로 가격이 300위안인 호텔 유형 POI를 클릭하였을 경우, 당연히 사용자 2의 선호하는 호텔 가격이 상대적으로 높은바, 이는 서로 다른 도시의 가격 수준이 다르기 때문이다. 가격 이외에, 예를 들면 댓글 수, 인기도와 같은 기타 특징도 마찬가지로 유사한 지역적 차이가 있다. 이러한 차이를 제거하기 위하여, 본 단계에서는 호텔 유형 후보 POI 중의 지역에 민감한 유형의 특징에 대해 데이터 전처리를 실행한다. 예를 들면 상기의 호텔 유형 POI의 경우, 가격 특징 데이터, 댓글 특징 데이터, 인기도 특징 데이터 등에 대해 전처리를 실행할 수 있다.
본 발명의 실시예에 있어서, 호텔 유형 후보 POI의 데이터는 후보 POI의 다양한 특징 데이터를 포함할 수 있으며, 이러한 특징 데이터는 일반적으로 호텔 유형 POI의 속성과 관련된다. 예를 들면, 가격, 댓글, 위치, 별점, 인기도 등을 포함할 수 있다.
구체적으로, 전처리를 실행할 때, 호텔 유형 후보 POI 데이터 중의 적어도 일부 유형의 특징 데이터에 대해 Box-cox 변환을 실행함으로써, 정상성을 강화한 후, 정규화 처리를 실행한다.
Box-cox 변환은 Box와 cox가 제안한 일반화된 전력 변환 방법인바, Box-cox 변환의 주요 특징점은 데이터 자체에 의해 추정되는 매개 변수를 도입하여, 사용하는 데이터 변환 형식을 결정하는 것이며, Box-cox 변환은 데이터의 정상성, 대칭성 및 분산 동등성을 크게 향상시킬 수 있다.
지역 A의 POI의 특징 F 상의 값의 분포 표현이 S(A, F) 이라고 가정하면, S(A, F) 중의 각각의 값 x에 대해, x ∈ S(A, F), λ(A, F)를 매개 변수로 하는 Box-cox 변환을 실행하면, 변환 후의 표현은 아래와 같다.
이어서 정규화를 실행하며, 정규화 후의 표현은 아래와 같다.
여기서, 은 각각 변환 후의 값 집합 의 평균값 및 표준 편차를 표현한다. λ(A, F)는 지역 A의 호텔 유형 POI의 당해 특징 F 상의 모든 값 S(A, F)을 사전에 통계하여 얻은 것이다. 예를 들면 최대 우도 추정 법(maximum likelihood estimation)을 통해 λ(A, F)를 계산하여 λ(A, F)의 변환 후의 분포가 정상 분포를 따르게 한다. 또한 도 사전에 계산하여 얻을 수 있으며, 이러한 매개 변수를 저장하여 변환을 실행할 때 직접 사용할 수 있다.
정규화를 거친 후의 는 표준 정상 분포 을 대략적으로 따른다. 이렇게 하여, 서로 다른 지역의 특징의 값은 상기 변환을 거친 후 더는 상대적으로 강한 지역적 차이성을 갖지 않는다.
203에 있어서, 각각의 후보 POI 데이터를 당해 사용자의 선호도 모델에 입력하여 당해 사용자의 각각의 후보 POI에 대한 선호도 점수를 얻는다.
본 발명의 실시예에 있어서, 사전에 각각의 사용자에 대해 각각 선호도 모델을 트레이닝한다. 사용자의 선호도 모델은 POI를 입력할 수 있는 상황 하에서 사용자의 당해 POI에 대한 선호도 점수를 출력할 수 있다. 검색 요청을 시작한 사용자의 식별자가 k인 경우, 당해 사용자 k에 대한 선호도 모델을 이용하여, 사용자 k의 각각의 후보 POI에 대한 선호도 점수를 얻을 수 있다.
바람직한 일 실시 방식에 있어서, 사용자의 선호도 모델은 이상점 검출 모델을 이용하여 이상점 검출 모델의 후보 POI에 대한 이상점 점수에 기반하여 사용자의 후보 POI에 대한 선호도 점수를 얻되, 이상점 점수는 선호도 점수와 음의 상관 관계를 갖는다.
사용자의 선호도 모델의 트레이닝 과정은 실시예 2에서 상세히 설명하기로 한다.
204에 있어서, 당해 사용자의 각각의 후보 POI에 대한 선호도 점수를 각각의 후보 POI의 정렬 특징 중 하나로 설정하여 정렬 모델에 입력하여 각각의 후보 POI의 정렬 점수를 얻는다.
본 단계에 있어서, 사용자의 후보 POI에 대한 선호도 점수를 당해 POI의 하나의 부가적 특징으로 설정하여, 정렬 모델이 이용하는 당해 후보 POI의 기타 특징과 함께 정렬 모델에 입력하며, 정렬 모델이 당해 후보 POI의 정렬 점수를 얻는다.
본 발명에 있어서, 정렬 모델의 메커니즘 자체를 변경하지 않고, 단지 정렬할 때 고려하는 특징을 추가하는바, 사용자 개성화 요소 즉 사용자 선호도를 더 고려한다. 사용자의 후보 POI에 대한 선호도 이외에, 정렬 모델이 채택하는 정렬 특징은 예를 들면 POI의 가격, 댓글, 별점, 인기도, 위치 등 기타 특징 데이터를 더 포함할 수 있다. 정렬 모델의 트레이닝 과정은 실시예 2에서 상세히 설명한다.
205에 있어서, 각각의 후보 POI의 정렬 점수에 기반하여 사용자에 피드백하는 검색 결과를 결정한다.
본 단계에 있어서, 각각의 후보 POI의 정렬 점수의 높은 순서에서 낮은 순서로 검색 결과를 사용자에 피드백할 수 있다. 예를 들면 검색 결과의 첫 페이지에 정렬 점수의 상위 M개의 후보 POI를 피드백하며, 사용자가 다음 페이지를 클릭하거나 페이지를 풀다운하면, 계속하여 M+1번째부터 2M번째까지의 후보 POI를 피드백하며, 이 후에도 마찬가지이다. 여기서 M는 소정의 양의 정수이거나, 또는 페이지에 표시 가능한 후보 POI의 수량에 따라 결정될 수 있다.
실시예 2
도 3은 본 발명의 실시예 2에 의해 제공되는 정렬 모델 트레이닝 방법의 플로우 차트이며, 도 3에 나타낸 바와 같이, 당해 방법은 이하의 단계를 포함할 수 있다.
301에 있어서, 지도 형 애플리케이션 데이터 중에서 제1 트레이닝 데이터를 취득한다.
여기서, 제1 트레이닝 데이터는 사용자가 과거 방문한 적이 있는 호텔 유형 POI 데이터를 포함할 수 있는바, 예를 들면 사용자가 검색한 적이 있는 호텔 유형 POI 데이터, 사용자가 클릭한 적이 있는 호텔 유형 POI 데이터, 사용자가 현장 방문한 POI 데이터 등을 포함할 수 있다.
여기서 사용자가 검색한 적이 있는 호텔 유형 POI 데이터는 사용자가 지도 형 애플리케이션의 검색 창에 입력한 적이 있는 구체적인 호텔 유형 POI의 데이터일 수 있다.
사용자가 클릭한 적이 있는 호텔 유형 POI 데이터는 사용자가 검색 결과 중에서 클릭한 적이 있는 호텔 유형 POI의 데이터일 수 있는바, 사용자가 지도 인터페이스에서 클릭한 적이 있는 호텔 유형 POI의 데이터, 사용자가 추천 정보를 조회하는 과정에서 클릭한 적이 있는 호텔 유형 POI의 데이터 등일 수 있다.
사용자가 현장 방문한 POI 데이터는, 사용자가 위치 결정 기능을 통해 호텔 유형 POI에 머물렀거나 체크한 것, 지도 형 애플리케이션의 호텔 기능을 이용하여 호텔을 예약한 것, 또는 지도 형 애플리케이션의 결제 기능을 통해 결제한 것 등일 수 있으며, 이들은 모두 사용자가 당해 호텔 유형 POI를 실제 방문한 것이다.
상기 호텔 유형 POI 데이터는 호텔 유형 POI의 다양한 특징 데이터를 포함할 수 있는바, 이러한 특징 데이터는 일반적으로 호텔 유형 POI의 속성과 관련된다. 예를 들면, 가격, 댓글, 위치, 별점, 인기도 등을 포함할 수 있다.
302에 있어서, 사용자가 과거 방문한 적이 있는 호텔 유형 POI 데이터 중 적어도 일부 유형의 특징 데이터에 대해 전처리를 실행하여, 당해 적어도 일부 유형의 특징 데이터의 지역적 차이를 제거한다.
구체적으로, 사용자가 과거 방문한 적이 있는 호텔 유형 POI 데이터 중 적어도 일부 유형의 특징 데이터에 대해 Box-cox 변환을 실행한 후 정규화 처리를 실행할 수 있다. Box-cox 변환 방식 및 정규화 방식은 실시예 1 중의 단계 202의 관련 기재를 참고할 수 있다.
전처리를 실행한 적어도 일부 유형의 특징 데이터는 지역에 민감한 유형의 특징 데이터를 가리키는바, 예를 들면 호텔 유형 POI의 경우, 가격 특징 데이터, 댓글 특징 데이터, 인기도 특징 데이터 등 전처리를 실행할 수 있다.
여기서 Box-cox 변환을 실행할 때 사용하는 매개 변수 , 는 사전에 각각의 지역의 호텔 유형 POI에 대해 상기 적어도 일부 유형의 특징 상의 데이터 분포를 통계하여 얻는다. 예를 들면, 지역에 따라 호텔 유형 POI을 구분하여, 서로 다른 지역의 호텔 유형 POI의 특징 데이터의 분포를 각각 통계한 후, 최대 우도 추정 법(maximum likelihood estimation)을 통해 를 계산하여 변환 후의 분포가 정상 분포를 따르도록 하며, 또한 도 사전에 계산하여 얻을 수 있다.
303에 있어서, 제1 트레이닝 데이터를 이용하여 사용자의 선호도 모델을 트레이닝한다.
제1 트레이닝 데이터는 실제 상 호텔 유형 POI를 당해 데이터를 생성하는 사용자에 따라 구분하여, 각각의 사용자에 대해 모두 당해 사용자가 과거 방문한 적이 있는 호텔 유형 POI를 사용하여 트레이닝한 선호도 모델이다. 예를 들면, L명의 사용자가 있을 경우, L 개의 사용자의 선호도 모델을 구축하다.
사용자의 선호도 모델을 트레이닝할 때 신경망을 이용할 수 있다. 그러나, 사용자 수가 너무 많기에, 신경망과 같은 복잡한 구조를 사용하면 매우 많은 계산 및 저장 오버 헤드가 발생하게 된다. 따라서, 본 발명의 실시예는 바람직한 일 실시 방안을 채용한다. 즉 사용자의 선호도 모델은 이상점 검출 모델을 통해 사용자가 방문한 적이 있는 호텔 유형 POI를 이용하여 이상점 검출 모델을 트레이닝할 수 있다. 즉 이상점 검출 모델은 사용자가 과거 방문한 적이 있는 호텔 유형 POI중에서 그 분포를 피팅한다. 이어서, 하나의 새로운 호텔 유형 POI에 대해, 이상점에 속하는지 정상점에 속하는지를 판단할 수 있으며, 이상점이면 이상점에 속하는 점수를 제공할 수 있다. 물론, 이상점 점수를 균일하게 채용하여 이상점과 정상점을 구분할 수 있다.
이어서, 이상점 검출 모델의 호텔 유형 POI에 대한 이상점 점수에 기반하여 사용자의 수직 유형의 지리 위치점에 대한 선호도 점수를 얻는다. 이상점 점수는 선호도 점수와 음의 상관 관계를 갖는다. 즉 이상점 검출 모델의 호텔 유형 POI에 대한 이상점 점수가 높을수록, 당해 호텔 유형 POI가 이상점에 속하는 가능성이 더 높으며, 사용자 선호도와의 거리가 더 멀어짐을 의미한다.
본 발명에 있어서, 이상점 검출 모델의 유형에 대해 한정하지 않는바, 종래의 임의의 이상점 검출 모델을 이용하여 실현할 수 있다.
304에 있어서, 사용자의 선호도 모델을 이용하여 당해 사용자의 제2 트레이닝 데이터 중의 각각의 호텔 유형 POI에 대한 선호도 점수를 취득한다.
본 발명의 실시예에 있어서, 이용하는 제2 트레이닝 데이터는 종래 기술에서 정렬 모델을 트레이닝하는 트레이닝 데이터를 그대로 사용할 수 있다. 즉 지도 형 애플리케이션 데이터 중의 대량의 사용자 과거 데이터 중에서 POI 쌍을 추출하는바, 이러한 POI 쌍은 그 중의 하나의 POI의 정렬이 다른 하나의 POI보다 우수하다는 것을 반영할 수 있다. 예를 들면, 제2 트레이닝 데이터는 호텔 유형의 동일한 검색 대화에서 사용자가 클릭한 POI와 클릭하지 않은 POI로 구성된 POI 쌍을 포함할 수 있다. 예를 들면, 사용자가 일 회의 호텔 유형 검색에 대응하는 검색 결과 중에서 호텔 유형 POI1를 클릭하였다면, POI1을 양성 샘플로 설정하고, 기타 클릭되지 않은 호텔 유형 POI 중에서 예를 들면 POI2를 선택하여 음성 샘플로 설정할 수 있는바, 그러면 "POI1-POI2”가 하나의 트레이닝 샘플 쌍을 구성하게 된다.
본 단계에 있어서, 상기 POI 쌍 중의 각각의 POI에 대해 각각 사용자의 선호도 모델을 이용하여 사용자의 각각의 POI에 대한 선호도 점수를 취득하게 된다.
305에 있어서, 제2 트레이닝 데이터를 이용하여 정렬 모델을 트레이닝하되, 사용자의 제2 트레이닝 데이터 중의 각각의 POI에 대한 선호도 점수를 정렬 모델을 트레이닝하기 위한 정렬 특징 중 하나로 설정한다.
제2 트레이닝 데이터를 이용하여 정렬 모델을 트레이닝할 때에, 각각의 트레이닝 샘플의 POI 쌍 중의 각각의 POI 데이터에 대해 각각 특징 데이터를 추출할 수 있으며, 이러한 특징 데이터는 종래 기술에서 사용하는 특징 데이터를 그대로 사용할 수 있는바, 예를 들면 POI의 가격, 댓글, 별점, 인기도, 위치 등을 포함할 수 있다. 이러한 특징 데이터를 단계 304에서 얻은 사용자의 트레이닝 샘플 중 POI에 대한 선호도 점수와 함께 정렬 특징으로 설정하여 정렬 모델(LTR, Learning to Rank)에 입력하며, 정렬 모델이 각각의 POI의 정렬 점수를 얻는다. 정렬 모델을 트레이닝할 때, 채용하는 트레이닝 목표는 동일한 트레이닝 샘플 중 양성 샘플 POI의 정렬 점수와 음성 샘플 POI의 정렬 점수 사이의 차이 값을 최대화하는 것일 수 있다.
이로부터 알 수 있듯이, 본 발명에 있어서, 정렬 모델의 메커니즘 자체를 변경하지 않고, 단지 정렬할 때 고려하는 특징을 추가하는바, 사용자 개성화 요소 즉 사용자 선호도를 더 고려한다.
상기 과정을 거쳐 트레이닝을 실행한 후, 사용자의 선호도 모델 및 정렬 모델은 공동으로 실시예 1에 기재된 각각의 호텔 유형 후보 POI에 대한 정렬을 실행할 수 있다.
이상은 본 발명에 의해 제공되는 방법에 대한 상세한 설명이며, 이하, 실시예와 결합하여 본 발명에 의해 제공되는 장치를 상세히 설명한다.
실시예 3
도 4는 본 발명의 실시예 3에 의해 제공되는 지리 위치점 정렬 장치의 구조도이며, 도 4에 나타낸 바와 같이, 당해 장치는 요청 수신 유닛(01), 선호도 결정 유닛(02), 정렬 처리 유닛(03) 및 결과 결정 유닛(04)을 구비할 수 있고, 전처리 유닛(05)을 더 구비할 수 있다. 여기서 각각의 구성 유닛의 주요 기능은 아래와 같다.
요청 수신 유닛(01)은 사용자로부터 수직 유형의 지리 위치점 검색 요청을 수신한다.
사용자는 지도 형 애플리케이션의 검색 창 내에 수직 유형 정보를 나타내는 키 포인트 단어를 입력함으로써 수직 유형의 지리 위치점의 검색 요청을 트리거할 수 있다. 사용자는 “주변 찾기” 기능 인터페이스에서 수직 유형 레이블 또는 버튼 등을 클릭함으로써 수직 유형의 지리 위치점의 검색 요청을 트리거할 수도 있다. 물론 이 두 경우 이외에, 기타 방식을 통해 트리거할 수 있는바, 본 발명은 이에 대해 한정하지 않는다.
선호도 결정 유닛(02)은 상기 수직 유형의 후보 지리 위치점 데이터를 사용자의 선호도 모델에 입력하여 사용자의 각각의 후보 지리 위치점에 대한 선호도 점수를 얻는다.
여기서 후보 지리 위치점을 결정할 때, 지도 데이터 베이스 중의 모든 상기 수직 유형의 지리 위치점을 모두 후보 POI로 설정할 수 있다. 그러나, 계산량을 줄이기 위하여, 바람직하게는, 지도 데이터 베이스 중의 상기 수직 유형의 지리 위치점에 대해 이하의 적어도 하나의 필터링 처리를 수행한 후, 나머지 지리 위치점을 후보 지리 위치로 설정할 수 있다.
사용자가 위치한 현재 지점에 기반하여 현재 지점과의 거리가 소정의 거리 임계 값을 초과한 지리 위치점을 필터링한다. 즉 사용자와의 거리가 너무 멀리 떨어진 지리 위치점을 필터링한다.
사용자의 검색 히스토리에 기반하여 사용자의 검색 히스토리와의 관련도가 소정의 관련도 임계 값보나 낮은 지리 위치점을 필터링한다. 예를 들면 사용자가 지금까지 검색한 적이 없는 지리 위치점을 직접 필터링한다.
바람직하게는, 사용자의 선호도 모델은 이상점 검출 모델을 이용하여 이상점 검출 모델의 후보 지리 위치점에 대한 이상점 점수에 기반하여 사용자 후보 지리 위치점에 대한 선호도 점수를 얻을 수 있되, 이상점 점수는 선호도 점수와 음의 상관 관계를 갖는다.
정렬 처리 유닛(03)은, 사용자의 각각의 후보 지리 위치점에 대한 선호도 점수를 각각의 후보 지리 위치점의 정렬 특징 중 하나로 설정하여 정렬 모델에 입력하여 각각의 후보 지리 위치점의 정렬 점수를 얻는다.
본 발명에 있어서, 정렬 모델의 메커니즘 자체를 변경하지 않고, 단지 정렬할 때 고려하는 특징을 추가하는바, 사용자 개성화 요소 즉 사용자 선호도를 더 고려한다. 사용자 후보 지리 위치점에 대한 선호도 이외에, 정렬 모델이 채택하는 정렬 특징은 예를 들면 지리 위치점의 가격, 댓글, 별점, 인기도, 위치 등 기타 특징 데이터를 더 포함할 수 있다.
결과 결정 유닛(04)은 각각의 후보 위치점의 정렬 점수에 기반하여 사용자에 피드백하는 검색 결과를 결정한다.
전처리 유닛(05)은 수직 유형의 후보 지리 위치점 데이터 중 적어도 일부 유형의 특징 데이터에 대해 전처리를 실행한 후 선호도 결정 유닛(02)에 제공함으로써, 적어도 일부 유형의 특징 데이터의 지역적 차이를 제거하도록 한다.
구체적으로, 전처리 유닛(05)은 수직 유형의 후보 지리 위치점 데이터 중 적어도 일부 유형의 특징 데이터에 대해 Box-cox 변환을 실행한 후 정규화 처리를 실행하되, Box-cox 변환을 실행할 때 사용하는 매개 변수는 사전에 각각의 지역의 지리 위치점에 대해 적어도 일부 유형의 특징 상의 데이터 분포를 통계하여 얻은 것이다.
실시예 4
도 5는 본 발명의 실시예 4에 의해 제공되는 정렬 모델 트레이닝 장치의 구조도이다. 도 5에 나타낸 바와 같이, 당해 장치는 제1 데이터 취득 유닛(11), 제1 모델 트레이닝 유닛(12), 선호도 점수 결정 유닛(13) 및 제2 모델 트레이닝 유닛(14)을 구비할 수 있으며, 전처리 유닛(15)을 더 구비할 수 있다. 여기서 각각의 구성 유닛의 주요 기능은 아래와 같다.
제1 데이터 취득 유닛(11)은 지도 형 애플리케이션 데이터 중에서 제1 트레이닝 데이터를 취득하되, 제1 트레이닝 데이터는 사용자가 과거 방문한 적이 있는 수직 유형의 지리 위치점 데이터를 포함하고, 방문은 검색, 클릭 또는 현장 방문을 포함한다.
상기 수직 유형의 지리 위치점 데이터는 수직 유형의 지리 위치점의 다양한 특징 데이터를 포함할 수 있고, 이러한 특징 데이터는 일반적으로 수직 유형의 지리 위치점 데이터의 속성에 관련된다. 예를 들면, 가격, 댓글, 위치, 별점, 인기도 등을 포함할 수 있다.
제1 모델 트레이닝 유닛(12)은 제1 트레이닝 데이터를 이용하여 사용자의 선호도 모델을 트레이닝한다.
사용자의 선호도 모델을 트레이닝할 때 신경망을 이용할 수 있다. 그러나, 사용자 수가 너무 많기에, 신경망과 같은 복잡한 구조를 사용하면 매우 많은 계산 및 저장 오버 헤드가 발생하게 된다. 따라서, 바람직하게는, 제1 모델 트레이닝 유닛(12)은 이상점 검출 모델을 이용하여 사용자의 선호도 모델을 트레이닝하며, 이상점 검출 모델의 수직 유형의 지리 위치점에 대한 이상점 점수에 기반하여 사용자 수직 유형의 지리 위치점에 대한 선호도 점수를 얻되, 여기서 이상점 점수는 선호도 점수와 음의 상관 관계를 갖는다.
선호도 점수 결정 유닛(13)은 사용자의 선호도 모델을 이용하여 사용자의 제2 트레이닝 데이터 중 수직 유형의 각각의 지리 위치점에 대한 선호도 점수를 취득한다.
본 발명에 있어서, 제2 데이터 취득 유닛(종래 기술에서의 유닛이며, 도면에 나타내지 않았음)에 의해 제2 트레이닝 데이터가 취득된다. 본 발명의 실시예에 있어서, 이용하는 제2 트레이닝 데이터는 종래 기술에서 정렬 모델을 트레이닝하는 트레이닝 데이터를 그대로 사용할 수 있다. 즉 지도 형 애플리케이션 데이터 중의 대량의 사용자 과거 데이터 중에서 지리 위치점 쌍을 추출할 수 있으며, 이러한 지리 위치점 쌍은 그 중의 하나의 지리 위치점의 정렬이 다른 하나의 지리 위치점보다 우수하다는 것을 반영할 수 있다. 예를 들면, 제2 트레이닝 데이터는 어느 수직 유형의 동일한 검색 대화에서의 사용자가 클릭한 지리 위치점과 클릭하지 않은 지리 위치점으로 구성된 지리 위치점 쌍을 포함할 수 있다. 예를 들면, 사용자가 일 회의 호텔 유형 검색에 대응하는 검색 결과 중에서 호텔 유형 POI1를 클릭하였다면, POI1을 양성 샘플로 설정하고, 기타 클릭되지 않은 호텔 유형 POI 중에서 예를 들면 POI2를 선택하여 음성 샘플로 설정할 수 있는바, 그러면 "POI1-POI2”가 하나의 트레이닝 샘플 쌍을 구성하게 된다.
제2 모델 트레이닝 유닛(14)은 제2 트레이닝 데이터를 이용하여 정렬 모델을 트레이닝하되, 사용자의 제2 트레이닝 데이터 중의 각각의 지리 위치점에 대한 선호도 점수를 정렬 모델을 트레이닝하기 위한 정렬 특징 중 하나로 설정한다.
제2 트레이닝 데이터를 이용하여 정렬 모델을 트레이닝할 때에, 각각의 트레이닝 샘플의 지리 위치점 쌍 중의 각각의 지리 위치점 데이터에 대해 각각 특징 데이터를 추출할 수 있으며, 이러한 특징 데이터는 종래 기술에서 사용하는 특징 데이터를 그대로 사용할 수 있는바, 예를 들면 지리 위치점의 가격, 댓글, 별점, 인기도, 위치 등을 포함한다. 이러한 특징 데이터를 선호도 점수 결정 유닛(13)이 얻은 사용자의 트레이닝 샘플 중의 지리 위치점에 대한 선호도 점수와 함께 정렬 특징으로 설정하여 정렬 모델(LTR, Learning to Rank)에 입력하며, 정렬 모델이 각각의 지리 위치점의 정렬 점수를 얻는다. 정렬 모델을 트레이닝할 때, 그 트레이닝 목표는 동일한 트레이닝 샘플 중의 양성 샘플 지리 위치점의 정렬 점수와 음성 샘플 지리 위치점의 정렬 점수 사이의 차이 값을 최대화하는 것일 수 있다.
전처리 유닛(15)은 사용자가 과거 방문한 적이 있는 수직 유형의 지리 위치 데이터 중 적어도 일부 유형의 특징 데이터에 대해 전처리를 실행한 후 제1 모델 트레이닝 유닛(12)에 제공함으로써, 적어도 일부 유형의 특징 데이터의 지역적 차이를 제거하도록 한다.
구체적으로, 전처리 유닛(15)은 사용자가 과거 방문한 적이 있는 수직 유형의 후보 지리 위치점 데이터 중 적어도 일부 유형의 특징 데이터에 대해 Box-cox 변환을 실행한 후 정규화 처리를 실행하되, Box-cox 변환을 실행할 때 사용하는 매개 변수는 사전에 각각의 지역의 지리 위치점에 대해 적어도 일부 유형의 특징 상의 데이터 분포를 통계하여 얻은 것이다.
상기의 실시예로부터 알 수 있듯이, 본 발명의 실시예에 의해 제공되는 기술적 방안은 이하의 이점을 갖는다.
1) 사용자가 호텔 유형, 케이터링 유형, 극장 및 영화관 유형, 상점 및 슈퍼마켓 유형과 같은 수직 유형의 지리 위치점을 검색할 때에, 사용자의 선호도 요소를 정렬에 통합함으로써, 사용자가 검색 결과 중에서 자신의 선호도와 일치한 호텔을 빠르게 찾을 수 있도록 하며, 검색 결과 중에서 들추거나 클릭하는 횟수를 줄여 사용자의 시간을 절약하고, 사용자가 지도 형 애플리케이션을 사용할 때의 검색 경험을 향상시킬 수 있다.
2) 본 발명은 종래 정렬 모델 정렬 메커니즘을 가능한 한 유지하는 기초 상에서 정렬 프레임 워크를 최적화함으로써, 종래 정렬 프레임 워크의 안정성 및 효율성을 보장하였다.
본 발명의 실시예에 따르면, 본 발명은 전자 기기 및 판독 가능 기록 매체를 더 제공한다.
도 6은 본 발명에 따른 실시예의 전자 기기의 블럭도이다. 전자 기기는 예를 들면 랩톱 컴퓨터, 데스크톱 컴퓨터, 워크 스테이션, 개인 디지털 보조기, 서버, 블레이드 서버, 대형 컴퓨터 및 기타 적합한 컴퓨터와 같은 다양한 형태의 디지털 컴퓨터를 나타낸다. 전자 기기는 또한 예를 들면 개인 디지털 처리기, 셀폰, 스마트 전화, 웨어러블 기기 및 기타 유사한 계산 장치와 같은 다양한 형태의 모바일 장치를 나타낼 수 있다. 본 명세서에 나타낸 구성 요소, 이들의 연결과 관계 및 이들의 기능은 단지 예일뿐이며, 본 명세서에서 설명하거나 및/또는 요구하는 본 발명의 실현을 한정하려는 것이 아니다.
도 6에 나타낸 바와 같이, 당해 전자 기기는 하나 또는 복수의 프로세서(601), 메모리(602) 및 각각의 구성 요소를 연결하기 위한 인터페이스를 구비하며, 당해 인터페이스는 고속 인터페이스 및 저속 인터페이스를 포함한다. 각각의 구성 요소는 서로 다른 버스를 통해 상호 연결되며, 공통 마더 보드에 설치되거나 또는 수요에 따라 기타 방식으로 설치된다. 프로세서 전자 기기 내에서 수행되는 명령에 대해 처리를 실행할 수 있으며, 메모리 내에 기록되어 외부 입력/출력 장치 (예를 들면 인터페이스에 연결된 디스플레이 기기) 상에 GUI의 그래픽 정보를 표시하기 위한 명령을 포함한다. 기타 실시 방식에 있어서, 필요할 경우, 복수의 프로세서 및/또는 복수의 버스와 복수의 메모리를 함께 사용할 수 있다. 마찬가지로, 복수의 전자 기기를 연결할 수 있으며, 각각의 기기는 부분적인 필요한 조작 (예를 들면, 서버 어레이, 일 그룹의 블레이드 서버, 또는 다중 프로세서 시스템)을 제공한다. 도 6에서는 하나의 프로세서(601)의 예를 들었다.
메모리(602)는 본 발명에 의해 제공되는 비 일시적 컴퓨터 판독 가능 기록 매체이다. 여기서, 상기 메모리에는 적어도 하나의 프로세서에 의해 수행 가능한 명령이 기록되어 있으며, 상기 적어도 하나의 프로세서로 하여금 본 발명에 의해 제공되는 지리 위치점 정렬 방법, 정렬 모델 트레이닝 방법을 수행하도록 한다. 본 발명의 비 일시적 컴퓨터 판독 가능 기록 매체는 컴퓨터 명령을 기록하며, 당해 컴퓨터 명령은 컴퓨터로 하여금 본 발명에 의해 제공되는 지리 위치점 정렬 방법, 정렬 모델 트레이닝 방법을 수행하도록 한다.
메모리(602)는 일종의 비 일시적 컴퓨터 판독 가능 기록 매체로서, 비 일시적 소프트웨어 프로그램을 기록하는데 사용될 수 있는 바, 예를 들면 비 일시적 컴퓨터 수행 가능 프로그램 및 모듈, 본 발명 실시예 중의 지리 위치점 정렬 방법, 정렬 모델 트레이닝 방법 대응하는 프로그램 명령/모듈을 기록하는데 사용될 수 있다. 프로세서(601)는 메모리(602) 내에 기록된 비 일시적 소프트웨어 프로그램, 명령 및 모듈을 운행함으로써, 서버의 다양한 기능 응용 및 데이터 처리를 수행하는 바, 즉 상술한 방법 실시예 중의 지리 위치점 정렬 방법, 정렬 모델 트레이닝 방법을 실현한다.
메모리(602)는 프로그램 기록 영역 및 데이터 기록 영역을 포함할 수 있으며, 여기서, 프로그램 기록 영역은 운영 체제 및 적어도 하나의 기능에 필요한 응용 프로그램을 기록할 수 있고, 데이터 기록 영역은 전자 기기의 사용을 통해 생성된 데이터 등을 기록할 수 있다. 또한, 메모리(602)는 고속 랜덤 액세스 메모리를 포함할 수 있고, 비 일시적 메모리를 더 포함할 수 있는 바, 예를 들면 적어도 하나의 자기 디스크 저장 장치, 플래시 장치, 또는 기타 비 일시적 고체 저장 장치를 포함할 수 있다. 일부 실시예에 있어서, 메모리(602)는 선택적으로 프로세서(601)에 대해 원격 설치한 메모리를 포함할 수 있으며, 이러한 원격 메모리는 네트워크를 통해 전자 기기에 연결될 수 있다. 상술한 네트워크의 실예는 인터넷, 기업 인트라 넷, 근거리 통신망, 이동 통신 네트워크 및 이들의 조합을 포함하나 이에 한정되지 않는다.
전자 기기는 입력 장치(603) 및 출력 장치(604)를 더 포함할 수 있다. 프로세서(601), 메모리(602), 입력 장치(603) 및 출력 장치(604)는 버스 또는 기타 방식을 통해 연결될 수 있으며, 도 6에서는 버스를 통해 연결하는 예를 들었다.
입력 장치(603)는 입력된 디지털 또는 문자 정보를 수신하고, 또한 전자 기기의 사용자 설정 및 기능 제어에 관한 키 신호 입력을 생성할 수 있다. 예를 들면 터치 스크린, 키패드, 마우스, 트랙 패드, 터치 패드, 포인팅 스틱, 하나 또는 복수의 마우스 버튼, 트랙볼, 조이스틱 등 입력 장치를 포함할 수 있다. 출력 장치(604)은 디스플레이 기기, 보조 조명 장치(예를 들면 LED) 및 촉각 피드백 장치(예를 들면 진동 모터) 등을 포함할 수 있다. 당해 디스플레이 기기는 액정 디스플레이(LCD), 발광 다이오드(LED) 디스플레이 및 등 플라즈마 디스플레이를 포함할 수 있으나 이에 한정되지 않는다. 일부 실시 방식에 있어서, 디스플레이 기기는 터치 스크린일 수 있다.
여기서 설명하는 시스템 및 기술의 다양한 실시 방식은 디지털 전자 회로 시스템, 집적 회로 시스템, 전용 ASIC(전용 집적 회로), 컴퓨터 하드웨어, 펌웨어, 소프트웨어 및/또는 이들의 조합에서 실현될 수 있다. 이러한 다양한 실시예는 하나 또는 복수의 컴퓨터 프로그램에서 실시되고, 당해 하나 또는 복수의 컴퓨터 프로그램은 적어도 하나의 프로그램 가능 프로세서를 포함하는 프로그램 가능 시스템 상에서 수행 및/또는 해석될 수 있으며, 당해 프로그램 가능 프로세서는 전용 또는 일반 프로그램 가능 프로세서일 수 있고, 기록 시스템, 적어도 하나의 입력 장치 및 적어도 하나의 출력 장치로부터 데이터 및 명령을 수신할 수 있으며, 또한 데이터 및 명령을 당해 기록 시스템, 당해 적어도 하나의 입력 장치 및 당해 적어도 하나의 출력 장치에 전송할 수 있다.
이러한 계산 프로그램(소프트웨어, 소프트웨어 응용 또는 코드로도 불림)은 프로그램 가능 프로세서의 기계 명령을 포함하며, 또한 고급 과정 및/또는 객체 지향 프로그래밍 언어 및/또는 어셈블리/기계 언어를 이용하여 이러한 계산 프로그램을 실시할 수 있다. 본 명세서에서 사용되는 “기계 판독 가능 매체” 및 “컴퓨터 판독 가능 매체”와 같은 용어는, 기계 명령 및/또는 데이터를 프로그램 가능 프로세서의 임의의 컴퓨터 프로그램 제품, 기기 및/또는 장치 (예를 들면, 자기 디스크, 광 디스크, 메모리, 프로그램 가능 논리 장치(PLD))에 제공하기 위한 것을 의미하며, 기계 판독 가능 신호로서의 기계 명령을 수신하는 기계 판독 가능 매체를 포함한다. “기계 판독 가능 신호”와 같은 용어는 기계 명령 및/또는 데이터를 프로그램 가능 프로세서에 제공하기 위한 임의의 신호를 의미한다.
유저와의 대화를 제공하기 위하여, 컴퓨터 상에서 여기서 설명하는 시스템 및 기술을 실시할 수 있으며, 당해 컴퓨터는 유저에게 정보를 표시하기 위한 디스플레이 장치 (예를 들면 CRT(음극선관) 또는 LCD(액정 디스플레이) 모니터) 및 키보드와 포인팅 장치 (예를 들면, 마우스 또는 트랙볼)를 구비할 수 있으며, 유저는 당해 키보드 및 당해 포인팅 장치를 통해 입력을 컴퓨터에 제공할 수 있다. 기타 유형의 장치는 또한 유저와의 대화를 제공하는데 사용될 수 있다. 예를 들면, 유저에 제공하는 피드백은 임의의 형태의 감각 피드백 (예를 들면, 시각적 피드백, 청각적 피드백, 또는 촉각 피드백)일 수 있으며, 또한 임의의 형태(음향 입력, 음성 입력 또는 촉각 입력을 포함함)를 통해 유저로부터의 입력을 수신할 수 있다.
여기서 설명하는 시스템 및 기술을 백엔드 구성 요소를 포함하는 계산 시스템 (예를 들면 데이터 서버), 또는 미들웨어 구성 요소를 포함하는 계산 시스템 (예를 들면 응용 서버), 또는 프런트엔드 구성 요소를 포함하는 계산 시스템 (예를 들면 그래픽 유저 인터페이스 또는 웹 브라우저를 구비하는 유저 컴퓨터인 바, 유저는 당해 그래픽 유저 인터페이스 또는 당해 웹 브라우저를 통해 여기서 설명하는 시스템 및 기술의 실시 방식과 대화함), 또는 이러한 백엔드 구성 요소, 미들웨어 구성 요소, 또는 프런트엔드 구성 요소의 임의의 조합을 포함하는 계산 시스템에서 실시할 수 있다. 임의의 형태 또는 매체의 디지털 데이터 통신 (예를 들면, 통신 네트워크)을 통해 시스템의 구성 요소를 상호 연결할 수 있다. 통신 네트워크의 예는 근거리 통신망(LAN), 광역 통신망(WAN) 및 인터넷을 포함한다.
컴퓨터 시스템은 클라이언트 및 서버를 포함할 수 있다. 클라이언트와 서버는 일반적으로 서로 멀리 떨어져 있고, 또한 일반적으로 통신 네트워크를 통해 대화를 실행한다. 해당되는 컴퓨터 상에서 운행되고, 또한 클라이언트 - 서버 관계를 갖는 컴퓨터 프로그램을 통해 클라이언트와 서버의 관계를 발생시킬 수 있다.
상술한 구체적인 실시 방식은 본 발명의 보호 범위를 한정하지 않는다. 당업자는 설계 요건 및 기타 요인에 따라 다양한 수정, 조합, 서브 조합 및 대체를 실행할 수 있음을 이해해야 한다. 본 발명의 정신 및 원칙 내에서 이루어진 임의의 수정 동등한 대체 및 개선 등은 모두 본 발명의 보호 범위 내에 포함되어야 한다.

Claims (21)

  1. 지리 위치점 정렬 장치에 의해 수행되는 지리 위치점 정렬 방법(geographic position point ranking method)에 있어서,
    사용자로부터 수직 유형의 지리 위치점 검색 요청을 수신하는 단계;
    상기 수직 유형의 후보 지리 위치점 데이터를 상기 사용자의 선호도 모델에 입력하여 상기 사용자의 각각의 후보 지리 위치점에 대한 선호도 점수를 얻는 단계;
    상기 사용자의 각각의 후보 지리 위치점에 대한 선호도 점수를 각각의 후보 지리 위치점의 정렬 특징 중 하나로 설정하여 정렬 모델에 입력하여 각각의 후보 지리 위치점의 정렬 점수를 얻는 단계; 및
    상기 각각의 후보 위치점의 정렬 점수에 기반하여 상기 사용자에 피드백하는 검색 결과를 결정하는 단계
    를 포함하고,
    상기 사용자의 선호도 모델은 이상점 검출 모델(abnormal point detecting model)을 이용하여 상기 이상점 검출 모델의 후보 지리 위치점에 대한 이상점 점수에 기반하여 상기 사용자의 후보 지리 위치점에 대한 선호도 점수를 얻되,
    상기 이상점 점수는 상기 선호도 점수와 음의 상관 관계를 가지는 것을 특징으로 하는,
    지리 위치점 정렬 방법.
  2. 제1항에 있어서,
    상기 수직 유형의 후보 지리 위치점 데이터를 상기 사용자의 선호도 모델에 입력하는 단계의 전에,
    상기 수직 유형의 후보 지리 위치점 데이터 중 적어도 일부 유형의 특징 데이터에 대해 전처리를 실행하여, 상기 적어도 일부 유형의 특징 데이터의 지역적 차이를 제거하는 단계
    를 더 포함하는 것을 특징으로 하는,
    지리 위치점 정렬 방법.
  3. 제2항에 있어서,
    상기 전처리는,
    상기 수직 유형의 후보 지리 위치점 데이터 중 적어도 일부 유형의 특징 데이터에 대해 Box-cox 변환을 실행한 후 정규화 처리를 실행하는 것을 포함하되,
    상기 Box-cox 변환을 실행할 때 사용하는 매개 변수는 사전에 각각의 지역의 지리 위치점의 상기 적어도 일부 유형의 특징 상의 데이터 분포를 통계하여 얻은 것을 특징으로 하는,
    지리 위치점 정렬 방법.
  4. 제1항에 있어서,
    상기 수직 유형은 호텔 유형, 케이터링(catering) 유형, 상점 및 슈퍼마켓 유형 또는 극장 및 영화관 유형을 포함하는 것을 특징으로 하는,
    지리 위치점 정렬 방법.
  5. 정렬 모델 트레이닝 장치에 의해 수행되는 정렬 모델 트레이닝 방법(ranking model training method)에 있어서,
    지도 형 애플리케이션 데이터 중에서 제1 트레이닝 데이터를 취득하는 단계 - 상기 제1 트레이닝 데이터는 사용자가 과거 방문한 적이 있는 수직 유형의 지리 위치점 데이터를 포함하고, 상기 방문은 검색, 클릭 또는 현장 방문을 포함함 -;
    상기 제1 트레이닝 데이터를 이용하여 상기 사용자의 선호도 모델을 트레이닝하는 단계;
    상기 사용자의 선호도 모델을 이용하여 제2 트레이닝 데이터 중의 상기 수직 유형의 각각의 지리 위치점에 대한 상기 사용자의 선호도 점수를 취득하는 단계; 및
    상기 제2 트레이닝 데이터를 이용하여 정렬 모델을 트레이닝하는 단계 - 상기 제2 트레이닝 데이터 중의 각각의 지리 위치점에 대한 상기 사용자의 선호도 점수를 상기 정렬 모델을 트레이닝하기 위한 정렬 특징 중 하나로 설정함 -
    를 포함하고,
    상기 사용자의 선호도 모델은 이상점 검출 모델(abnormal point detecting model)을 이용하여 상기 이상점 검출 모델의 수직 유형의 지리 위치점에 대한 이상점 점수에 기반하여 상기 사용자의 수직 유형의 지리 위치점에 대한 선호도 점수를 얻되,
    상기 이상점 점수는 상기 선호도 점수와 음의 상관 관계를 가지는 것을 특징으로 하는,
    정렬 모델 트레이닝 방법.
  6. 제5항에 있어서,
    상기 제1 트레이닝 데이터를 이용하여 상기 사용자의 선호도 모델을 트레이닝하는 단계의 전에,
    상기 사용자가 과거 방문한 적이 있는 수직 유형의 지리 위치 데이터 중 적어도 일부 유형의 특징 데이터에 대해 전처리를 실행하여, 상기 적어도 일부 유형의 특징 데이터의 지역적 차이를 제거하는 단계
    를 더 포함하는 것을 특징으로 하는,
    정렬 모델 트레이닝 방법.
  7. 제6항에 있어서,
    상기 전처리는,
    상기 사용자가 과거 방문한 적이 있는 수직 유형의 후보 지리 위치점 데이터 중 적어도 일부 유형의 특징 데이터에 대해 Box-cox 변환을 실행한 후 정규화 처리를 실행하는 것을 포함하되,
    상기 Box-cox 변환을 실행할 때 사용하는 매개 변수는 사전에 각각의 지역의 지리 위치점의 상기 적어도 일부 유형의 특징 상의 데이터 분포를 통계하여 얻은 것을 특징으로 하는,
    정렬 모델 트레이닝 방법.
  8. 제5항에 있어서,
    상기 제2 트레이닝 데이터는 상기 수직 유형에 대한 동일한 검색 대화 중에서 사용자가 클릭한 지리 위치점과 클릭하지 않은 지리 위치점으로 구성된 지리 위치점 쌍을 포함하는 것을 특징으로 하는,
    정렬 모델 트레이닝 방법.
  9. 지리 위치점 정렬 장치(geographic position point ranking device)에 있어서,
    사용자로부터 수직 유형의 지리 위치점 검색 요청을 수신하기 위한 요청 수신 유닛;
    상기 수직 유형의 후보 지리 위치점 데이터를 상기 사용자의 선호도 모델에 입력하여 상기 사용자의 각각의 후보 지리 위치점에 대한 선호도 점수를 얻기 위한 선호도 결정 유닛;
    상기 사용자의 각각의 후보 지리 위치점에 대한 선호도 점수를 각각의 후보 지리 위치점의 정렬 특징 중 하나로 설정하여 정렬 모델에 입력하여 각각의 후보 지리 위치점의 정렬 점수를 얻기 위한 정렬 처리 유닛; 및
    상기 각각의 후보 위치점의 정렬 점수에 기반하여 상기 사용자에 피드백하는 검색 결과를 결정하기 위한 결과 결정 유닛
    을 구비하고,
    상기 사용자의 선호도 모델은 이상점 검출 모델을 이용하여 상기 이상점 검출 모델의 후보 지리 위치점에 대한 이상점 점수에 기반하여 상기 사용자의 후보 지리 위치점에 대한 선호도 점수를 얻되,
    상기 이상점 점수는 상기 선호도 점수와 음의 상관 관계를 가지는 것을 특징으로 하는
    지리 위치점 정렬 장치.
  10. 제9항에 있어서,
    상기 수직 유형의 후보 지리 위치점 데이터 중 적어도 일부 유형의 특징 데이터에 대해 전처리를 실행한 후 상기 선호도 결정 유닛에 제공함으로써, 상기 적어도 일부 유형의 특징 데이터의 지역적 차이를 제거하도록 하기 위한 전처리 유닛
    을 더 구비하는 것을 특징으로 하는,
    지리 위치점 정렬 장치.
  11. 제10항에 있어서,
    상기 전처리 유닛은 구체적으로,
    상기 수직 유형의 후보 지리 위치점 데이터 중 적어도 일부 유형의 특징 데이터에 대해 Box-cox 변환을 실행한 후 정규화 처리를 실행하되,
    상기 Box-cox 변환을 실행할 때 사용하는 매개 변수는 사전에 각각의 지역의 지리 위치점의 상기 적어도 일부 유형의 특징 상의 데이터 분포를 통계하여 얻은 것을 특징으로 하는,
    지리 위치점 정렬 장치.
  12. 정렬 모델 트레이닝 장치(ranking model training device)에 있어서,
    지도 형 애플리케이션 데이터 중에서 제1 트레이닝 데이터를 취득하기 위한 제1 데이터 취득 유닛 - 상기 제1 트레이닝 데이터는 사용자가 과거 방문한 적이 있는 수직 유형의 지리 위치점 데이터를 포함하고, 상기 방문은 검색, 클릭 또는 현장 방문을 포함함 -;
    상기 제1 트레이닝 데이터를 이용하여 상기 사용자의 선호도 모델을 트레이닝하기 위한 제1 모델 트레이닝 유닛;
    상기 사용자의 선호도 모델을 이용하여 상기 사용자의 제2 트레이닝 데이터 중의 상기 수직 유형의 각각의 지리 위치점에 대한 선호도 점수를 취득하기 위한 선호도 점수 결정 유닛; 및
    상기 제2 트레이닝 데이터를 이용하여 정렬 모델을 트레이닝하기 위한 제2 모델 트레이닝 유닛 - 상기 사용자의 제2 트레이닝 데이터 중의 각각의 지리 위치점에 대한 선호도 점수를 상기 정렬 모델을 트레이닝하기 위한 정렬 특징 중 하나로 설정함 -
    을 구비하고,
    상기 제1 모델 트레이닝 유닛은 이상점 검출 모델을 이용하여 상기 사용자의 선호도 모델을 트레이닝하고, 상기 이상점 검출 모델의 수직 유형의 지리 위치점에 대한 이상점 점수에 기반하여 상기 사용자의 수직 유형의 지리 위치점에 대한 선호도 점수를 얻되,
    상기 이상점 점수는 상기 선호도 점수와 음의 상관 관계를 가지는 것을 특징으로 하는,
    정렬 모델 트레이닝 장치.
  13. 제12항에 있어서,
    상기 사용자가 과거 방문한 적이 있는 수직 유형의 지리 위치 데이터 중 적어도 일부 유형의 특징 데이터에 대해 전처리를 실행한 후 상기 제1 모델 트레이닝 유닛에 제공함으로써, 상기 적어도 일부 유형의 특징 데이터의 지역적 차이를 제거하도록 하기 위한 전처리 유닛
    을 더 구비하는 것을 특징으로 하는,
    정렬 모델 트레이닝 장치.
  14. 제13항에 있어서,
    상기 전처리 유닛은,
    상기 사용자가 과거 방문한 적이 있는 수직 유형의 후보 지리 위치점 데이터 중 적어도 일부 유형의 특징 데이터에 대해 Box-cox 변환을 실행한 후 정규화 처리를 실행하되,
    상기 Box-cox 변환을 실행할 때 사용하는 매개 변수는 사전에 각각의 지역의 지리 위치점의 상기 적어도 일부 유형의 특징 상의 데이터 분포를 통계하여 얻은 것을 특징으로 하는,
    정렬 모델 트레이닝 장치.
  15. 전자 기기에 있어서,
    적어도 하나의 프로세서; 및
    상기 적어도 하나의 프로세서와 통신 연결된 메모리를 구비하며,
    상기 메모리에는 상기 적어도 하나의 프로세서에 의해 수행 가능한 명령이 기록되어 있으며, 상기 명령이 상기 적어도 하나의 프로세서에 의해 수행되어 상기 적어도 하나의 프로세서로 하여금 제1항 내지 제8항 중 어느 한 항에 기재된 방법을 수행하도록 하는 것을 특징으로 하는,
    전자 기기.
  16. 컴퓨터 명령이 기록되어 있는 비 일시적 컴퓨터 판독 가능 기록 매체에 있어서,
    상기 컴퓨터 명령은 상기 컴퓨터로 하여금 제1항 내지 제8항 중 어느 한 항에 기재된 방법을 수행하도록 하는 것을 특징으로 하는,
    기록 매체.
  17. 비 일시적 컴퓨터 판독 가능 기록 매체에 기록되어 있는 컴퓨터 프로그램에 있어서,
    상기 컴퓨터 프로그램은 상기 컴퓨터로 하여금 제1항 내지 제8항 중 어느 한 항에 기재된 방법을 수행하도록 하는 것을 특징으로 하는,
    컴퓨터 프로그램.
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
KR1020210061794A 2020-05-15 2021-05-13 지리 위치점 정렬 방법, 정렬 모델 트레이닝 방법 및 대응하는 장치 KR102601545B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010414943.4A CN111737382A (zh) 2020-05-15 2020-05-15 地理位置点的排序方法、训练排序模型的方法及对应装置
CN202010414943.4 2020-05-15

Publications (2)

Publication Number Publication Date
KR20210141393A KR20210141393A (ko) 2021-11-23
KR102601545B1 true KR102601545B1 (ko) 2023-11-10

Family

ID=72647375

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210061794A KR102601545B1 (ko) 2020-05-15 2021-05-13 지리 위치점 정렬 방법, 정렬 모델 트레이닝 방법 및 대응하는 장치

Country Status (5)

Country Link
US (1) US11556601B2 (ko)
EP (1) EP3910491A1 (ko)
JP (1) JP7206514B2 (ko)
KR (1) KR102601545B1 (ko)
CN (1) CN111737382A (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110851738B (zh) * 2019-10-28 2021-03-19 百度在线网络技术(北京)有限公司 获取poi状态信息的方法、装置、设备和计算机存储介质
CN114491318B (zh) * 2021-12-16 2023-09-01 北京百度网讯科技有限公司 目标信息的确定方法、装置、设备以及存储介质
CN117314701B (zh) * 2023-11-27 2024-03-08 江西联创精密机电有限公司 一种模拟训练席位配置方法、系统、存储介质及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106919641A (zh) * 2017-01-12 2017-07-04 北京三快在线科技有限公司 一种兴趣点搜索方法及装置、电子设备
US20180143998A1 (en) 2016-11-21 2018-05-24 Google Inc. Electronic map interfaces

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2659698C (en) * 2008-03-21 2020-06-16 Dressbot Inc. System and method for collaborative shopping, business and entertainment
US9194716B1 (en) * 2010-06-18 2015-11-24 Google Inc. Point of interest category ranking
JP2012053863A (ja) 2010-08-06 2012-03-15 Nippon Telegr & Teleph Corp <Ntt> 情報推薦処理装置とそのプログラム
CN102594905B (zh) * 2012-03-07 2014-07-16 南京邮电大学 一种基于场景的社交网络位置兴趣点推荐方法
US9916362B2 (en) * 2013-11-20 2018-03-13 Toyota Jidosha Kabushiki Kaisha Content recommendation based on efficacy models
US10235470B2 (en) 2013-12-06 2019-03-19 Here Global B.V. User retrieval enhancement
CN103954277B (zh) * 2014-04-30 2017-05-03 百度在线网络技术(北京)有限公司 检测兴趣点位置的方法及装置
US9565292B2 (en) * 2014-05-28 2017-02-07 Here Global B.V. Method and apparatus for performing an optimized location based search
CN104135716A (zh) * 2014-06-17 2014-11-05 百度在线网络技术(北京)有限公司 一种兴趣点信息的推送方法及系统
US10503764B2 (en) 2015-06-01 2019-12-10 Oath Inc. Location-awareness search assistance system and method
US10528533B2 (en) * 2017-02-09 2020-01-07 Adobe Inc. Anomaly detection at coarser granularity of data
US10713318B2 (en) 2017-05-03 2020-07-14 Uber Technologies, Inc. Optimizing listing efficiency and efficacy for a delivery coordination system
CN108345702A (zh) * 2018-04-10 2018-07-31 北京百度网讯科技有限公司 实体推荐方法和装置
CN108628833B (zh) * 2018-05-11 2021-01-22 北京三快在线科技有限公司 原创内容摘要确定方法及装置,原创内容推荐方法及装置
AU2019398468A1 (en) * 2018-12-13 2021-07-15 DataRobot, Inc. Methods for detecting and interpreting data anomalies, and related systems and devices
US11861462B2 (en) * 2019-05-02 2024-01-02 Nicholas John Teague Preparing structured data sets for machine learning
CN110348895A (zh) * 2019-06-29 2019-10-18 北京淇瑀信息科技有限公司 一种基于用户标签的个性化推荐方法、装置和电子设备
CN111026957B (zh) * 2019-11-21 2023-05-05 北京网聘咨询有限公司 基于多维相似度的推荐系统及其方法
WO2021221563A1 (en) * 2020-04-30 2021-11-04 Grabtaxi Holdings Pte. Ltd. Method for predicting the destination location of a vehicle

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180143998A1 (en) 2016-11-21 2018-05-24 Google Inc. Electronic map interfaces
CN106919641A (zh) * 2017-01-12 2017-07-04 北京三快在线科技有限公司 一种兴趣点搜索方法及装置、电子设备

Also Published As

Publication number Publication date
CN111737382A (zh) 2020-10-02
JP2021179990A (ja) 2021-11-18
EP3910491A1 (en) 2021-11-17
KR20210141393A (ko) 2021-11-23
US20210357468A1 (en) 2021-11-18
US11556601B2 (en) 2023-01-17
JP7206514B2 (ja) 2023-01-18

Similar Documents

Publication Publication Date Title
US20210209109A1 (en) Method, apparatus, device, and storage medium for intention recommendation
US20210216561A1 (en) Information search method and apparatus, device and storage medium
KR102601545B1 (ko) 지리 위치점 정렬 방법, 정렬 모델 트레이닝 방법 및 대응하는 장치
US20240330389A1 (en) Uniform resource identifier encoding
CN107589855B (zh) 一种根据地理位置推荐候选词的方法和装置
US11703333B2 (en) Method and apparatus for determining route, device and computer storage medium
CN110472163B (zh) 地图搜索结果的展现确定方法、装置、电子设备和介质
CN114549874A (zh) 多目标图文匹配模型的训练方法、图文检索方法及装置
CN111666461B (zh) 检索地理位置的方法、装置、设备和计算机存储介质
CN111666292B (zh) 用于检索地理位置的相似度模型建立方法和装置
CN111241427B (zh) 查询自动补全的方法、装置、设备和计算机存储介质
US20220172310A1 (en) House-renting recommendation method, electronic device and storage medium
CN111666417B (zh) 生成同义词的方法、装置、电子设备以及可读存储介质
CN104123321B (zh) 一种确定推荐图片的方法及装置
US20210042374A1 (en) Dynamically augmenting query to search for content not previously known to the user
CN113094604B (zh) 搜索结果排序方法、搜索方法及装置
CN103425767A (zh) 一种提示数据的确定方法和系统
CN112100480B (zh) 搜索方法、装置、设备及存储介质
CN113449212A (zh) 针对搜索结果的质量评估、优化方法和装置、设备
CN112861023A (zh) 地图信息处理方法、装置、设备、存储介质及程序产品
CN112799520A (zh) 检索处理方法、装置及设备
CA2920825C (en) Uniform resource identifier encoding
CN117278508B (zh) 5g消息聊天机器人的推荐方法、装置以及电子设备
CN116204698A (zh) 一种信息推荐方法、装置、电子设备及存储介质
CN115238183A (zh) 时间信息确定方法、装置、存储介质、电子设备及产品

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant