KR100957080B1 - 문서 구조에 기초한 검색 결과의 표시 - Google Patents
문서 구조에 기초한 검색 결과의 표시 Download PDFInfo
- Publication number
- KR100957080B1 KR100957080B1 KR1020077009771A KR20077009771A KR100957080B1 KR 100957080 B1 KR100957080 B1 KR 100957080B1 KR 1020077009771 A KR1020077009771 A KR 1020077009771A KR 20077009771 A KR20077009771 A KR 20077009771A KR 100957080 B1 KR100957080 B1 KR 100957080B1
- Authority
- KR
- South Korea
- Prior art keywords
- document
- search
- node
- structural elements
- search term
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/143—Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
본 발명의 다른 태양에 따른 컴퓨터로 판독가능한 메모리 디바이스로서, 컴퓨터로 실행가능한 명령어들을 포함하고, 복수의 구조적 요소를 포함하는, 검색어와 관련된 문서를 결정하기 위한 명령어, 상기 문서에서의 상기 검색어의 출현을 결정하기 위한 명령어, 상기 검색어의 출현의 물리적 근접도에 기초하여 상기 검색어의 출현을 클러스터로 분류하기 위한 명령어, 각각의 클러스터를 포함하는 상기 구조적 요소 중 하나를 결정하기 위한 명령어, 및 상기 결정된 구조적 요소 중 하나 이상에 관한 정보를 표시하기 위한 명령어를 포함할 수 있다.
Claims (42)
- 검색의 결과인 문서를 표시하는 방법으로서,복수의 구조적 요소(structural element)를 포함하는, 검색어(search term)와 관련된 문서를 식별하는 단계;상기 문서에서 상기 검색어가 출현하는 페이지를 결정하는 단계;상기 문서에서의, 상기 검색어가 출현하는 페이지들을, 상기 검색어가 출현하는 페이지들간의 물리적 근접도(phisical proximity)에 기초하여, 적어도 하나의 클러스터로 분류하는 단계;하나 이상의 상기 클러스터를 포함하는 상기 구조적 요소 중 하나를 식별하는 단계; 및상기 식별된 구조적 요소 중 하나와 연관된 정보를 표시하는 단계를 포함하는, 검색의 결과인 문서를 표시하는 방법.
- 제1항에 있어서,상기 문서를 식별하는 단계는, 상기 검색어와 관련된 문서를 식별하기 위해 문서의 코퍼스(corpus)를 검색하는 단계를 포함하는, 검색의 결과인 문서를 표시하는 방법.
- 제1항에 있어서,상기 문서는 책, 웹사이트, 신문, 기사(article), 또는 특허문헌(patent) 중 하나를 포함하는, 검색의 결과인 문서를 표시하는 방법.
- 제1항에 있어서,상기 문서에서 상기 검색어가 출현하는 페이지를 결정하는 단계는, 상기 문서의 구조적 요소별로 상기 문서에서 상기 검색어가 출현하는 페이지를 식별하기 위해 상기 문서의 컨텐츠를 검색하는 단계를 포함하는, 검색의 결과인 문서를 표시하는 방법.
- 제4항에 있어서,상기 구조적 요소 중 하나를 식별하는 단계는, 각각의 클러스터를 포함하는 상기 구조적 요소 중 가장 작은 것을 결정하는 단계를 포함하는, 검색의 결과인 문서를 표시하는 방법.
- 제1항에 있어서,상기 구조적 요소 중 하나를 식별하는 단계는, 각각의 클러스터를 포함하는 상기 구조적 요소 중 가장 작은 것을 결정하는 단계를 포함하는, 검색의 결과인 문서를 표시하는 방법.
- 제6항에 있어서,상기 정보를 표시하는 단계는, 상기 구조적 요소 중 가장 작은 것과 연관된 정보에 기초하여 검색 결과를 생성하는 단계를 포함하는, 검색의 결과인 문서를 표시하는 방법.
- 제1항에 있어서,상기 검색어가 출현하는 두 개의 페이지가, 클러스터화되기 위한 물리적 근접도로서 어느 정도 근접해야 하는지를 지정하는 임계값을 제공하는 단계를 더 포함하고,상기 검색어가 출현하는 페이지들을 클러스터로 분류하는 것은 상기 임계값에 기초하여 수행되는, 검색의 결과인 문서를 표시하는 방법.
- 제8항에 있어서,상기 임계값은 상기 문서의 페이지 수에 비례하는, 검색의 결과인 문서를 표시하는 방법.
- 제1항에 있어서,상기 클러스터로 분류하는 단계는, 하나의 구조적 요소 내에 있는 클러스터를 복수의 구조적 요소에 걸쳐 있는 클러스터보다 우위(favor)에 두는, 검색의 결과인 문서를 표시하는 방법.
- 제1항에 있어서,상기 문서는 책이고,상기 구조적 요소는 상기 책, 상기 책의 챕터(chaper)의 세트, 및 상기 책의 페이지의 세트를 포함하는, 검색의 결과인 문서를 표시하는 방법.
- 제1항에 있어서,상기 구조적 요소는 상기 문서, 상기 문서의 파트(part)의 세트, 및 상기 문서의 페이지의 세트를 포함하고,상기 식별된 구조적 요소 중 하나에 연관된 정보는, 상기 문서가 식별된 구조적 요소 중 하나인 경우에 상기 문서의 표제 페이지(title page)인, 검색의 결과인 문서를 표시하는 방법.
- 제1항에 있어서,상기 구조적 요소는 상기 문서, 상기 문서의 파트의 세트, 및 상기 문서의 페이지의 세트를 포함하고,상기 식별된 구조적 요소 중 하나에 연관된 정보는, 상기 파트가 상기 식별된 구조적 요소 중 하나인 경우에 상기 파트의 첫 페이지인, 검색의 결과인 문서를 표시하는 방법.
- 제1항에 있어서,상기 구조적 요소는 상기 문서, 상기 문서의 파트의 세트, 및 상기 문서의 페이지의 세트를 포함하고,상기 식별된 구조적 요소 중 하나에 연관된 정보는, 상기 페이지가 상기 식별된 구조적 요소 중 하나인 경우에 상기 문서의 상기 페이지인, 검색의 결과인 문서를 표시하는 방법.
- 제1항에 있어서,상기 식별된 구조적 요소 중 하나에 연관된 정보는, 상기 검색어가 출현하는 페이지를 포함하는 상기 문서의 일부를 포함하는, 검색의 결과인 문서를 표시하는 방법.
- 제1항에 있어서,상기 식별된 구조적 요소 중 하나에 연관된 정보는, 상기 검색어가 출현하는 페이지를 포함하지 않는 상기 문서의 일부를 포함하는, 검색의 결과인 문서를 표시하는 방법.
- 제1항에 있어서,상기 식별된 구조적 요소 중 하나에 연관된 정보를 표시하는 단계는, 상기 식별된 구조적 요소 중 하나에 연관된 정보 내에서 상기 검색어를 시각적으로 구별시키는 단계를 포함하는, 검색의 결과인 문서를 표시하는 방법.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 검색의 결과인 문서를 표시하는 시스템으로서,복수의 구조적 요소를 포함하는, 검색어와 관련된 문서를 취득하는 수단;상기 구조적 요소에 대해 상기 문서에서의 상기 검색어가 출현하는 페이지를 식별하는 수단;상기 문서에서의, 상기 검색어가 출현하는 페이지들을, 상기 검색어가 출현하는 페이지들간의 물리적 근접도에 기초하여, 클러스터로 분류하는 수단;각각의 클러스터를 포함하는 상기 구조적 요소 중 하나를 식별하는 수단; 및상기 검색어가 출현하는 페이지들 중 하나와 연관된 상기 식별된 구조적 요소 중 하나에 관한 정보를 표시하는 수단을 포함하는, 검색의 결과인 문서를 표시하는 시스템.
- 검색의 결과인 문서를 표시하는 시스템으로서,문서들 중 적어도 일부는 복수의 구조적 요소를 포함하는 상기 문서들의 코퍼스를 저장하는 메모리; 및프로세서를 포함하고,상기 프로세서는,검색어를 포함하는 검색 질의를 수신하고,상기 검색어와 관련된, 상기 문서의 코퍼스 내의 문서를 식별하며,상기 구조적 요소에 기초하여 상기 문서 내에서 상기 검색어가 출현하는 페이지를 결정하고,상기 문서에서의, 상기 검색어가 출현하는 페이지들을, 상기 검색어가 출현하는 페이지들간의 물리적 근접도에 기초하여, 클러스터로 분류하며,각각의 클러스터를 포함하는 상기 구조적 요소 중 하나를 식별하고,상기 식별된 구조적 요소와 연관된 정보를 상기 검색 질의에 대한 결과로서 제공하는,검색의 결과인 문서를 표시하는 시스템.
- 검색의 결과인 문서를 표시하는 방법으로서,복수의 구조적 요소를 포함하는, 검색어와 관련된 문서를 식별하는 단계;상기 문서에서의 상기 검색어가 출현하는 페이지를 결정하는 단계;상기 검색어가 출현하는 페이지들간의 물리적 근접도에 기초하여 상기 검색어가 출현하는 페이지들을 클러스터로 분류하는 단계;각각의 클러스터를 포함하는 상기 구조적 요소 중 가장 작은 것을 결정하는 단계; 및상기 결정된 구조적 요소에 관한 정보를 제공하는 단계를 포함하는, 검색의 결과인 문서를 표시하는 방법.
- 제26항에 있어서,상기 검색어가 출현하는 두 개의 페이지가, 클러스터화되기 위한 물리적 근접도로서 어느 정도 근접해야 하는지를 지정하는 임계값을 제공하는 단계를 더 포함하고,상기 검색어가 출현하는 페이지들을 클러스터로 분류하는 것은 상기 임계값에 기초하여 수행되는, 검색의 결과인 문서를 표시하는 방법.
- 제27항에 있어서,상기 임계값은 상기 문서의 페이지 수에 비례하는, 검색의 결과인 문서를 표시하는 방법.
- 제26항에 있어서,상기 클러스터로 분류하는 단계는, 하나의 구조적 요소 내에 있는 클러스터를 복수의 구조적 요소에 걸쳐 있는 클러스터에 비해 우위에 두는, 검색의 결과인 문서를 표시하는 방법.
- 검색의 결과인 문서를 표시하는 시스템으로서,복수의 구조적 요소를 포함하는, 검색어와 관련된 문서를 식별하는 수단;상기 문서 내에서의 상기 검색어가 출현하는 페이지를 식별하는 수단;상기 검색어가 출현하는 두 개의 페이지가, 클러스터화되기 위한 물리적 근접도로서 어느 정도 근접해야 하는지를 지정하는 임계값에 기초하여 상기 검색어가 출현하는 페이지들을 클러스터로 분류하는 수단;각각의 상기 클러스터를 포함하는 상기 구조적 요소 중 가장 작은 것을 결정하는 수단; 및상기 가장 작은 구조적 요소에 관한 정보를 표시하는 수단을 포함하는, 검색의 결과인 문서를 표시하는 시스템.
- 검색의 결과인 문서를 표시하는 방법으로서,문서, 상기 문서의 파트의 세트, 및 상기 문서의 페이지의 세트를 포함하는 복수의 구조적 요소를 포함하는, 검색어와 관련된 문서를 식별하는 단계;상기 문서의 페이지는 종단 노드에 대응하고, 상기 문서의 파트는 상위 레벨 노드에 대응하며, 상기 문서는 루트 노드에 대응하는, 문서의 트리 표현을 식별하는 단계;상기 종단 노드가 상기 검색어의 출현을 포함하는지에 기초하여 상기 종단 노드에 스코어를 할당하는 단계;상기 종단 노드 중 연관된 종단 노드에 기초하여 상위 레벨 노드에 대한 스코어를 결정하는 단계;상기 상위 레벨 노드에 대한 스코어에 기초하여 상기 루트 노드의 스코어를 결정하는 단계;상기 종단 노드의 스코어, 상기 상위 레벨 노드의 스코어, 및 상기 루트 노드의 스코어에 기초하여, 상기 종단 노드 중 하나, 상기 상위 레벨 노드 중 하나, 또는 상기 루트 노드를 선택된 노드로서 선택하는 단계; 및상기 선택하는 단계에서 선택된 상기 선택된 노드에 관한 정보를 제공하는 단계를 포함하는, 검색의 결과인 문서를 표시하는 방법.
- 제31항에 있어서,임계값을 제공하는 단계를 더 포함하고;상기 종단 노드 중 하나, 상기 상위 레벨 노드 중 하나, 또는 상기 루트 노드를 선택하는 단계는,상기 검색어의 출현을 포함하는 상기 종단 노드 중 하나를 잠재적인 결과로서 선택하는 단계;상기 상위 레벨 노드의 스코어가 상기 임계값보다 더 높은 경우에, 상기 상위 레벨 노드 중 하나를 잠재적인 결과로서 선택하는 단계; 및상기 루트 노드의 스코어가 상기 임계값보다 더 높은 경우에, 상기 루트 노드를 잠재적인 결과로서 선택하는 단계를 더 포함하는, 검색의 결과인 문서를 표시하는 방법.
- 제32항에 있어서,상기 임계값은, 상기 임계값이 상기 종단 노드와 연관된 것인지, 상기 상위 레벨 노드와 연관된 것인지, 또는 상기 루트 노드와 연관된 것인지에 기초하여 설정되는, 검색의 결과인 문서를 표시하는 방법.
- 제32항에 있어서,상기 임계값은, 상기 종단 노드, 상기 상위 레벨 노드, 또는 상기 루트 노드 중 하나와 연관된 페이지 수에 기초하여 설정되는, 검색의 결과인 문서를 표시하는 방법.
- 제32항에 있어서,상기 종단 노드 중 하나 또는 상기 상위 레벨 노드 중 하나 또는 상기 루트 노드를 선택하는 단계는,상기 상위 레벨 노드가 잠재적인 결과로서 선택된 경우에, 상기 상위 레벨 노드와 연관된 종단 노드의 선택을 삭제하는 단계; 및상기 루트 노드가 잠재적인 결과로서 선택된 경우에, 상기 종단 노드 및 상기 상위 레벨 노드의 선택을 삭제하는 단계를 더 포함하는, 검색의 결과인 문서를 표시하는 방법.
- 제31항에 있어서,상기 종단 노드에 스코어를 할당하는 단계는,상기 검색어의 출현을 포함하지 않는 종단 노드에 스코어 0(영)을 할당하는 단계; 및상기 검색어의 출현을 포함하는 종단 노드에 스코어 1을 할당하는 단계를 포함하는, 검색의 결과인 문서를 표시하는 방법.
- 제31항에 있어서,상기 종단 노드에 스코어를 할당하는 단계는,상기 검색어의 출현을 포함하지 않는 종단 노드에 스코어 0(영)을 할당하는 단계; 및상기 검색어의 출현을 포함하는 종단 노드에, 상기 검색어의 출현의 중요도(importance)의 함수인 스코어를 할당하는 단계를 포함하는, 검색의 결과인 문서를 표시하는 방법.
- 제31항에 있어서,상기 선택된 노드에 관련된 정보는, 상기 문서가 상기 선택된 노드인 경우에 상기 문서의 표제 페이지인, 검색의 결과인 문서를 표시하는 방법.
- 제31항에 있어서,상기 선택된 노드에 관련된 정보는, 상기 파트가 상기 선택된 노드인 경우에 상기 파트의 첫 페이지인, 검색의 결과인 문서를 표시하는 방법.
- 제31항에 있어서,상기 선택된 노드에 관련된 정보는, 상기 페이지가 상기 선택된 노드인 경우에 상기 문서의 페이지인, 검색의 결과인 문서를 표시하는 방법.
- 검색의 결과인 문서를 표시하는 시스템으로서,검색어와 관련된 문서를 식별하는 수단;상기 문서의 페이지는 종단 노드에 대응하고, 상기 문서의 파트는 상위 레벨 노드에 대응하며, 상기 문서는 루트 노드에 대응하는, 상기 문서의 트리 표현을 식별하는 수단;상기 종단 노드가 상기 검색어의 출현을 포함하는지에 기초하여 상기 종단 노드에 스코어를 할당하는 수단;상기 종단 노드 중 연관된 종단 노드의 스코어에 기초하여 상위 레벨 노드에 대한 스코어를 결정하는 수단;상기 상위 레벨 노드에 대한 스코어에 기초하여 상기 루트 노드의 스코어를 결정하는 수단;임계값을 제공하는 수단;상기 스코어 및 임계값에 기초하여, 상기 종단 노드 중 하나 또는 상기 상위 레벨 노드 중 하나 또는 상기 루트 노드를 선택된 노드로서 선택하는 수단; 및상기 선택하는 수단에 의해 선택된 상기 선택된 노드에 관한 정보를 제공하는 수단을 포함하는, 검색의 결과인 문서를 표시하는 시스템.
- 컴퓨터로 실행가능한 명령어들을 포함하는, 검색의 결과인 문서를 표시하는, 컴퓨터로 판독가능한 메모리 디바이스로서,복수의 구조적 요소를 포함하는, 검색어와 관련된 문서를 결정하기 위한 명령어;상기 문서에서의 상기 검색어의 출현을 결정하기 위한 명령어;상기 검색어의 출현의 물리적 근접도에 기초하여 상기 검색어의 출현을 클러스터로 분류하기 위한 명령어;각각의 클러스터를 포함하는 상기 구조적 요소 중 하나를 결정하기 위한 명령어; 및상기 결정된 구조적 요소 중 하나 이상에 관한 정보를 표시하기 위한 명령어를 포함하는, 컴퓨터로 판독가능한 메모리 디바이스.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/949,708 US9031898B2 (en) | 2004-09-27 | 2004-09-27 | Presentation of search results based on document structure |
US10/949,708 | 2004-09-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070058685A KR20070058685A (ko) | 2007-06-08 |
KR100957080B1 true KR100957080B1 (ko) | 2010-05-13 |
Family
ID=35414787
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020077009771A KR100957080B1 (ko) | 2004-09-27 | 2005-08-19 | 문서 구조에 기초한 검색 결과의 표시 |
Country Status (9)
Country | Link |
---|---|
US (1) | US9031898B2 (ko) |
EP (1) | EP1800226A1 (ko) |
JP (1) | JP4637181B2 (ko) |
KR (1) | KR100957080B1 (ko) |
CN (1) | CN101061479B (ko) |
AU (1) | AU2005290154B2 (ko) |
BR (1) | BRPI0517356B1 (ko) |
CA (1) | CA2581713C (ko) |
WO (1) | WO2006036376A1 (ko) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7590657B1 (en) * | 2005-06-10 | 2009-09-15 | At&T Corp. | System and method for identifying hierarchical heavy hitters in a multidimensional environment |
US7475071B1 (en) * | 2005-11-12 | 2009-01-06 | Google Inc. | Performing a parallel nearest-neighbor matching operation using a parallel hybrid spill tree |
US7506011B2 (en) * | 2006-07-26 | 2009-03-17 | International Business Machines Corporation | System and apparatus for optimally trading off the replication overhead and consistency level in distributed applications |
US7660804B2 (en) | 2006-08-16 | 2010-02-09 | Microsoft Corporation | Joint optimization of wrapper generation and template detection |
JP4801555B2 (ja) * | 2006-09-29 | 2011-10-26 | 株式会社ジャストシステム | 文書処理装置、文書処理方法および文書処理プログラム |
JP2008146209A (ja) * | 2006-12-07 | 2008-06-26 | Just Syst Corp | 文書検索装置、文書検索方法および文書検索プログラム |
US20080270381A1 (en) * | 2007-04-24 | 2008-10-30 | Interse A/S | Enterprise-Wide Information Management System for Enhancing Search Queries to Improve Search Result Quality |
US9239835B1 (en) * | 2007-04-24 | 2016-01-19 | Wal-Mart Stores, Inc. | Providing information to modules |
JP2009129013A (ja) * | 2007-11-20 | 2009-06-11 | Just Syst Corp | 文書検索方法、文書検索装置および文書検索プログラム |
JP2009129280A (ja) * | 2007-11-26 | 2009-06-11 | Just Syst Corp | 文書検索方法、文書検索装置および文書検索プログラム |
US20100287177A1 (en) * | 2009-05-06 | 2010-11-11 | Foundationip, Llc | Method, System, and Apparatus for Searching an Electronic Document Collection |
US20100287148A1 (en) * | 2009-05-08 | 2010-11-11 | Cpa Global Patent Research Limited | Method, System, and Apparatus for Targeted Searching of Multi-Sectional Documents within an Electronic Document Collection |
CN102105875B (zh) | 2009-07-15 | 2013-05-01 | 呢哦派豆株式会社 | 用于提供全面主页服务的系统和方法 |
US8364679B2 (en) * | 2009-09-17 | 2013-01-29 | Cpa Global Patent Research Limited | Method, system, and apparatus for delivering query results from an electronic document collection |
US20110082839A1 (en) * | 2009-10-02 | 2011-04-07 | Foundationip, Llc | Generating intellectual property intelligence using a patent search engine |
US20110119250A1 (en) * | 2009-11-16 | 2011-05-19 | Cpa Global Patent Research Limited | Forward Progress Search Platform |
CN102279856B (zh) * | 2010-06-09 | 2013-10-02 | 阿里巴巴集团控股有限公司 | 一种网站导航实现方法及系统 |
EP2599011A4 (en) * | 2010-07-30 | 2017-04-26 | Hewlett-Packard Development Company, L.P. | Selection of main content in web pages |
CN102143142A (zh) * | 2010-09-30 | 2011-08-03 | 华为软件技术有限公司 | Ip多媒体子系统业务中订阅处理方法和资源列表服务器 |
CN103218719B (zh) | 2012-01-19 | 2016-12-07 | 阿里巴巴集团控股有限公司 | 一种电子商务网站导航方法及系统 |
WO2014107809A1 (en) * | 2013-01-11 | 2014-07-17 | La Presse, Ltée | Device, method and system for displaying digital editions |
WO2014146265A1 (en) * | 2013-03-20 | 2014-09-25 | Nokia Corporation | Method and apparatus for personalized resource recommendations |
CN105005562B (zh) * | 2014-04-15 | 2018-09-21 | 索意互动(北京)信息技术有限公司 | 检索结果的显示处理方法及装置 |
US9858251B2 (en) | 2014-08-14 | 2018-01-02 | Rakuten Kobo Inc. | Automatically generating customized annotation document from query search results and user interface thereof |
US20160239161A1 (en) * | 2015-02-12 | 2016-08-18 | Kobo Incorporated | Method and system for term-occurrence-based navigation of apportioned e-book content |
TW201832105A (zh) * | 2017-02-17 | 2018-09-01 | 雲拓科技有限公司 | 專利檢索之檢索關鍵字建議方法 |
US20190130027A1 (en) | 2017-11-02 | 2019-05-02 | International Business Machines Corporation | Data classification |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6105044A (en) | 1991-07-19 | 2000-08-15 | Enigma Information Systems Ltd. | Data processing system and method for generating a representation for and random access rendering of electronic documents |
US20040083211A1 (en) | 2000-10-10 | 2004-04-29 | Bradford Roger Burrowes | Method and system for facilitating the refinement of data queries |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5619709A (en) * | 1993-09-20 | 1997-04-08 | Hnc, Inc. | System and method of context vector generation and retrieval |
US5799268A (en) * | 1994-09-28 | 1998-08-25 | Apple Computer, Inc. | Method for extracting knowledge from online documentation and creating a glossary, index, help database or the like |
US5694594A (en) * | 1994-11-14 | 1997-12-02 | Chang; Daniel | System for linking hypermedia data objects in accordance with associations of source and destination data objects and similarity threshold without using keywords or link-difining terms |
JP3598742B2 (ja) | 1996-11-25 | 2004-12-08 | 富士ゼロックス株式会社 | 文書検索装置及び文書検索方法 |
US6233575B1 (en) * | 1997-06-24 | 2001-05-15 | International Business Machines Corporation | Multilevel taxonomy based on features derived from training documents classification using fisher values as discrimination values |
US6167397A (en) * | 1997-09-23 | 2000-12-26 | At&T Corporation | Method of clustering electronic documents in response to a search query |
US6363378B1 (en) * | 1998-10-13 | 2002-03-26 | Oracle Corporation | Ranking of query feedback terms in an information retrieval system |
WO2000046701A1 (en) * | 1999-02-08 | 2000-08-10 | Huntsman Ici Chemicals Llc | Method for retrieving semantically distant analogies |
US6718363B1 (en) * | 1999-07-30 | 2004-04-06 | Verizon Laboratories, Inc. | Page aggregation for web sites |
US20030050927A1 (en) * | 2001-09-07 | 2003-03-13 | Araha, Inc. | System and method for location, understanding and assimilation of digital documents through abstract indicia |
US6819339B1 (en) * | 2000-02-24 | 2004-11-16 | Eric Morgan Dowling | Web browser with multilevel functions |
US6678692B1 (en) * | 2000-07-10 | 2004-01-13 | Northrop Grumman Corporation | Hierarchy statistical analysis system and method |
JP2002108710A (ja) * | 2000-07-24 | 2002-04-12 | Sony Corp | 情報処理システム、情報処理方法、および情報処理装置、並びにプログラム提供媒体 |
US20070226640A1 (en) * | 2000-11-15 | 2007-09-27 | Holbrook David M | Apparatus and methods for organizing and/or presenting data |
JP3907161B2 (ja) | 2001-06-29 | 2007-04-18 | インターナショナル・ビジネス・マシーンズ・コーポレーション | キーワード検索方法、キーワード検索端末、コンピュータプログラム |
CA2358048A1 (en) * | 2001-09-25 | 2003-03-25 | Luis Rueda | A cryptosystem for data security |
US20030115191A1 (en) * | 2001-12-17 | 2003-06-19 | Max Copperman | Efficient and cost-effective content provider for customer relationship management (CRM) or other applications |
DE60332315D1 (de) * | 2002-01-16 | 2010-06-10 | Elucidon Group Ltd | Abruf von informationsdaten, wobei daten in bedingungen, dokumenten und dokument-corpora organisiert sind |
WO2003098466A1 (en) | 2002-05-14 | 2003-11-27 | Verity, Inc. | Apparatus and method for region sensitive dynamically configurable document relevance ranking |
US7085771B2 (en) * | 2002-05-17 | 2006-08-01 | Verity, Inc | System and method for automatically discovering a hierarchy of concepts from a corpus of documents |
WO2003107174A1 (en) * | 2002-06-13 | 2003-12-24 | Cerisent Corporation | Xml database mixed structural-textual classification system |
US7171404B2 (en) * | 2002-06-13 | 2007-01-30 | Mark Logic Corporation | Parent-child query indexing for XML databases |
US7383258B2 (en) * | 2002-10-03 | 2008-06-03 | Google, Inc. | Method and apparatus for characterizing documents based on clusters of related words |
JP2004157628A (ja) | 2002-11-05 | 2004-06-03 | Mitsubishi Electric Corp | 文書検索方法及びその装置及びそのプログラム |
US7320000B2 (en) * | 2002-12-04 | 2008-01-15 | International Business Machines Corporation | Method and apparatus for populating a predefined concept hierarchy or other hierarchical set of classified data items by minimizing system entrophy |
US20040133560A1 (en) * | 2003-01-07 | 2004-07-08 | Simske Steven J. | Methods and systems for organizing electronic documents |
US7512615B2 (en) * | 2003-11-07 | 2009-03-31 | International Business Machines Corporation | Single pass workload directed clustering of XML documents |
US7523109B2 (en) * | 2003-12-24 | 2009-04-21 | Microsoft Corporation | Dynamic grouping of content including captive data |
US7165216B2 (en) * | 2004-01-14 | 2007-01-16 | Xerox Corporation | Systems and methods for converting legacy and proprietary documents into extended mark-up language format |
US20050177555A1 (en) * | 2004-02-11 | 2005-08-11 | Alpert Sherman R. | System and method for providing information on a set of search returned documents |
WO2006012487A1 (en) * | 2004-07-22 | 2006-02-02 | Genometric Systems Llc | Method and apparatus for informational processing based on creation of term-proximity graphs and their embeddings into informational units |
-
2004
- 2004-09-27 US US10/949,708 patent/US9031898B2/en active Active
-
2005
- 2005-08-19 BR BRPI0517356-6A patent/BRPI0517356B1/pt active Search and Examination
- 2005-08-19 WO PCT/US2005/029691 patent/WO2006036376A1/en active Application Filing
- 2005-08-19 CN CN2005800399646A patent/CN101061479B/zh active Active
- 2005-08-19 JP JP2007533473A patent/JP4637181B2/ja not_active Expired - Fee Related
- 2005-08-19 AU AU2005290154A patent/AU2005290154B2/en active Active
- 2005-08-19 KR KR1020077009771A patent/KR100957080B1/ko active IP Right Grant
- 2005-08-19 EP EP05792767A patent/EP1800226A1/en not_active Withdrawn
- 2005-08-19 CA CA2581713A patent/CA2581713C/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6105044A (en) | 1991-07-19 | 2000-08-15 | Enigma Information Systems Ltd. | Data processing system and method for generating a representation for and random access rendering of electronic documents |
US20040083211A1 (en) | 2000-10-10 | 2004-04-29 | Bradford Roger Burrowes | Method and system for facilitating the refinement of data queries |
Also Published As
Publication number | Publication date |
---|---|
JP2008515049A (ja) | 2008-05-08 |
BRPI0517356B1 (pt) | 2019-09-24 |
KR20070058685A (ko) | 2007-06-08 |
CN101061479A (zh) | 2007-10-24 |
CA2581713A1 (en) | 2006-04-06 |
WO2006036376A1 (en) | 2006-04-06 |
CA2581713C (en) | 2015-12-29 |
AU2005290154A1 (en) | 2006-04-06 |
BRPI0517356A (pt) | 2008-10-07 |
JP4637181B2 (ja) | 2011-02-23 |
EP1800226A1 (en) | 2007-06-27 |
CN101061479B (zh) | 2011-06-15 |
US9031898B2 (en) | 2015-05-12 |
US20060074907A1 (en) | 2006-04-06 |
AU2005290154B2 (en) | 2010-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100957080B1 (ko) | 문서 구조에 기초한 검색 결과의 표시 | |
US10528650B2 (en) | User interface for presentation of a document | |
KR101065071B1 (ko) | 확장 스니핏 | |
US7716216B1 (en) | Document ranking based on semantic distance between terms in a document | |
US9483534B2 (en) | User interfaces for a document search engine | |
US9342583B2 (en) | Book content item search | |
US7676745B2 (en) | Document segmentation based on visual gaps | |
US20130110839A1 (en) | Constructing an analysis of a document | |
US20130151497A1 (en) | Providing information relating to a document | |
US8930822B2 (en) | Method for human-centric information access and presentation | |
US8316032B1 (en) | Book content item search | |
US20150172299A1 (en) | Indexing and retrieval of blogs | |
KR100954842B1 (ko) | 카테고리 태그 정보를 이용한 웹 페이지 분류 방법, 그 시스템 및 이를 기록한 기록매체 | |
Roy et al. | Discovering and understanding word level user intent in web search queries | |
US7788258B1 (en) | Automatic determination of whether a document includes an image gallery | |
US20080033953A1 (en) | Method to search transactional web pages | |
JP2017117022A (ja) | キーワード抽出装置、キーワード抽出方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130503 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20140423 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20150424 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20160422 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20170424 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20180424 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20190423 Year of fee payment: 10 |