Nothing Special   »   [go: up one dir, main page]

KR101067830B1 - Apparatus and method for resource search based on combination of multiple resource - Google Patents

Apparatus and method for resource search based on combination of multiple resource Download PDF

Info

Publication number
KR101067830B1
KR101067830B1 KR1020100097797A KR20100097797A KR101067830B1 KR 101067830 B1 KR101067830 B1 KR 101067830B1 KR 1020100097797 A KR1020100097797 A KR 1020100097797A KR 20100097797 A KR20100097797 A KR 20100097797A KR 101067830 B1 KR101067830 B1 KR 101067830B1
Authority
KR
South Korea
Prior art keywords
resource
technical
type
terms
search
Prior art date
Application number
KR1020100097797A
Other languages
Korean (ko)
Inventor
정한민
김평
이승우
이미경
서동민
성원경
Original Assignee
한국과학기술정보연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술정보연구원 filed Critical 한국과학기술정보연구원
Priority to KR1020100097797A priority Critical patent/KR101067830B1/en
Priority to PCT/KR2010/007240 priority patent/WO2012046905A1/en
Application granted granted Critical
Publication of KR101067830B1 publication Critical patent/KR101067830B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 다중 자원의 통합에 의한 자원 검색 장치 및 방법에 관한 것으로서, 각 기술분야에 대한 기술용어가 정의된 기술용어 사전 및 문맥 패턴 정보가 저장된 데이터베이스, 각 자원별로 상기 기술용어 사전을 이용하여 입력 문서에서의 기술용어를 인식하고, 상기 문맥 패턴 정보를 이용하여 상기 인식된 기술용어간의 관계를 생성하는 기술용어 인식 및 관계 생성 모듈, 서로 다른 다중 자원에서 상기 인식된 기술용어와 기술용어간의 관계를 통합 온톨로지로 매핑하여 저장하고, 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장하는 지식베이스 구축 모듈, 사용자에 의해 입력된 기술분야에 대한 자원 검색 정보 제공이 요청된 경우, 상기 기술분야에 대한 연구주체유형 및 자원유형을 선택하기 위한 유형 선택 화면을 제공하여 연구주체유형 및 자원유형을 입력받는 유형 선택 모듈, 상기 통합 지식베이스를 검색하여 상기 기술분야를 다루는 상기 연구주체유형에 해당하는 하나 이상의 대표 연구주체를 획득하고, 상기 획득된 대표 연구주체들에 대해 상기 입력된 자원유형에 해당하는 자원 검색 정보를 각각 획득하는 자원 검색 정보 획득 모듈, 상기 획득된 자원 검색 정보를 상기 자원유형들을 축으로 하는 그래프상에 표시하여 제공하는 자원 검색 정보 제공 모듈을 포함한다.
따라서, 본 발명에 따르면 사용자에 의해 입력된 연구주체유형 및 자원유형에 따른 검색정보를 그래프 상에 연도순으로 정렬하여 제공하므로, 해당 연구주체에 대한 기술 동향을 파악하고, 향후 동향을 예측할 수 있는 효과가 있다.
The present invention relates to an apparatus and method for searching for resources by integrating multiple resources, comprising: a technical term dictionary and context pattern information in which technical terms for each technical field are defined, and input using the technical term dictionary for each resource Descriptive term recognition and relationship generation module for recognizing descriptive terminology in a document and generating a relationship between the recognized descriptive term using the context pattern information, and a relationship between the recognized descriptive term and descriptive term in different multiple resources. A knowledge base construction module that maps and stores the integrated ontology, infers the integrated ontology, and expands the integrated knowledge base. When requested to provide resource search information for a technical field input by a user, Type selection screen for selecting research subject type and resource type A type selection module that receives a research subject type and a resource type, retrieves the integrated knowledge base, acquires one or more representative research subjects corresponding to the research subject type covering the technical field, and obtains the representative research subjects. A resource search information acquisition module for acquiring resource search information corresponding to the input resource type, and a resource search information providing module configured to display and obtain the obtained resource search information on a graph around the resource types. .
Therefore, according to the present invention, since the search information according to the research subject type and resource type inputted by the user is arranged and provided in the order of the year on the graph, it is possible to grasp the technical trend of the research subject and predict the future trend. It works.

Description

다중 자원의 통합에 의한 자원 검색 장치 및 방법{Apparatus and Method for Resource search based on combination of multiple resource}Apparatus and Method for Resource search based on combination of multiple resource}

본 발명은 다중 자원의 통합에 의한 자원 검색 장치 및 방법에 관한 것으로, 더욱 상세하게는 서로 다른 다중 자원에서 각각 인식된 기술용어와 기술용어간의 관계를 통합 온톨로지로 매핑하여 저장하고, 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장한 후, 사용자에 의해 입력된 기술분야에 대한 자원 검색 정보 제공이 요청된 경우, 통합 지식베이스를 검색하여 상기 기술분야를 다루는 연구주체유형에 해당하는 하나 이상의 대표 연구주체를 획득하고, 상기 획득된 대표 연구주체들에 대해 해당 자원유형에 해당하는 자원 검색 정보를 각각 획득하여 상기 자원유형들을 축으로 하는 그래프상에 표시하여 제공하는 다중 자원의 통합에 의한 자원 검색 장치 및 방법에 관한 것이다.
The present invention relates to an apparatus and method for resource searching by integrating multiple resources. More particularly, the present invention relates to technology ontology and technology terms recognized in different multiple resources by mapping them into an integrated ontology, and storing them in the integrated ontology. After performing inference on the integrated knowledge base and providing the resource search information for the technical field input by the user, the search is performed to search the integrated knowledge base and one or more types of research subjects dealing with the technical field. A resource obtained by integrating multiple resources that obtains a representative research subject, obtains resource search information corresponding to a corresponding resource type, and displays them on a graph with the resource types as axes. A search apparatus and method.

일반적으로 자원 검색 장치는 정보를 수집/분류/축적하여 필요에 따라 추출할 수 있도록 하는 장치이다.In general, a resource retrieval device is a device that collects, classifies, and accumulates information to be extracted as needed.

정보화 사회에 있어서 인간의 지적 활동에 필요 불가결한 행위의 하나는 첨단과학기술에 의존한 정보의 수집과 축적 및 검색과 이용이라고 할 수 있다. 개인적으로는 필요한 정보나 데이터를 보다 신속, 정확하게 입수하여 연구개발이나 의사결정에 활용할 수 있는 방법을 모색하고, 사회적으로는 사회 각 부문에서의 다양한 정보요구를 충족시킬 수 있는 방법이 필요하다. 그러므로, 정보검색으로 충족시킬 수 있는 자원 검색 장치를 어떻게 구축, 유지, 운영하느냐가 중요하다.One of the indispensable actions of human intellectual activity in the information society is the collection, accumulation, retrieval and use of information based on advanced science and technology. Personally, we need to find ways to obtain necessary information and data more quickly and accurately and to use it for R & D or decision making. Socially, we need a way to meet various information needs in each sector of society. Therefore, how to construct, maintain, and operate a resource retrieval apparatus that can be satisfied by information retrieval is important.

그래서 자원 검색 장치는 정보 수요자가 필요하다고 예측되는 정보나 데이터를 미리 수집, 가공, 처리하여 찾기 쉬운 형태로 축적해 놓은 데이터베이스로부터 요구에 적합한 정보를 신속하게 찾아내어 정보 요구자에게 제공하는 장치를 말한다. 이러한 형태에는 정보 검색장치에서 출력된 검색결과를 전화로 알려주거나 팩스로 전송하거나 또는 우송하는 경우가 있고, 인터넷을 통해 컴퓨터를 보유하고 있는 요구자의 가정이나 사무실에 온라인으로 검색결과를 전송해 줄 수 있다.Therefore, the resource retrieval device is a device that quickly finds information suitable for a request from a database accumulated in an easy-to-find form by collecting, processing, and processing information or data which is expected to be required by the information consumer, and provides the information requester. In this form, the search results output from the information retrieval device may be reported by telephone, fax or mail, and the search results may be sent online to the home or office of the requester who owns the computer via the Internet. have.

그리고 데이터베이스에 축적되어 있는 정보의 종류에 따라 참조검색/사실검색/전문(full-text)검색으로 구분된다. 참조검색은 요구자가 알고자 하는 주제를 핵심적으로 다루고 있는 문헌의 서지사항을 검색하는 것이다. 사실검색은 일반데이터나 수치데이터 및 사실데이터를 검색할 수 있는 것이다. 전문검색은 문헌의 전문을 축적해 놓은 데이터베이스로부터 서지적 데이터뿐만 아니라 해당문장이나 원문 전부를 필요에 따라 검색해서 볼 수 있는 것이다.It is divided into reference search, fact search, and full-text search according to the kind of information accumulated in the database. Reference search is the search for bibliographic references in the literature that focus on the subject that the requester wants to know. The fact search is to search general data, numerical data and fact data. The full-text search can search and view not only the bibliographic data but also the relevant text or the original text as needed from the database that accumulates the full text of the literature.

그러나 종래의 자원 검색 장치는 논문, 연구보고서, 특허 등을 등의 서로 다른 자원을 독립적으로 그 자체만 제시할 뿐 과학기술과 관련된 이들 각각의 정보들을 융합하여 제시하지는 못하는 한계가 있었다.However, the conventional resource retrieval device has limited limitations in presenting different resources such as papers, research reports, patents, and the like independently of each other.

따라서 정보의 홍수 속에서 서로 다른 다중 자원을 융합한 검색 정보를 사용자의 요구에 따라 기술분야별로 분류하여 제공함으로써 해당 기술분야에 대한 연구개발과 연구동향 파악에 필요한 기술분야별 융합 정보를 서비스하여 시기적절하게 과학기술을 활용할 수 있도록 할 필요성이 대두되었다.
Therefore, in the flood of information, search information, which is a convergence of different resources, is categorized and provided according to the user's needs, so as to service convergence information by technology field necessary for research and development and research trends in the relevant technology field. There is a need to make it possible to use science and technology.

본 발명은 상기와 같은 종래의 제반 문제점을 해결하기 위해 제안된 것으로, 본 발명의 목적은 서로 다른 다중 자원을 융합하여 사용자의 요구에 따라 다양한 관점에서의 정보 서비스를 가능하게 하는 다중 자원의 통합에 의한 자원 검색 장치 및 방법을 제공하는데 있다.SUMMARY OF THE INVENTION The present invention has been proposed to solve the above-mentioned general problems, and an object of the present invention is to integrate multiple resources that enable information services from various points of view according to the needs of users by fusing different multiple resources. The present invention provides an apparatus and method for resource searching.

본 발명의 다른 목적은 사용자에 의해 입력된 연구주체유형 및 자원유형에 따른 검색정보를 그래프 상에 연도순으로 제공하여 해당 연구주체에 대한 기술 동향을 파악하고, 향후 동향을 예측할 수 있도록 하는 다중 자원의 통합에 의한 자원 검색 장치 및 방법을 제공하는데 있다.
Another object of the present invention is to provide the search information according to the research subject type and resource type input by the user on a graph in order of year to grasp the technical trends for the research subject, and to predict future trends. To provide an apparatus and method for retrieving resources by the integration of.

본 발명의 일 측면에 따르면, 각 기술분야에 대한 기술용어가 정의된 기술용어 사전 및 문맥 패턴 정보가 저장된 데이터베이스, 각 자원별로 상기 기술용어 사전을 이용하여 입력 문서에서의 기술용어를 인식하고, 상기 문맥 패턴 정보를 이용하여 상기 인식된 기술용어간의 관계를 생성하는 기술용어 인식 및 관계 생성 모듈, 서로 다른 다중 자원에서 상기 인식된 기술용어와 기술용어간의 관계를 통합 온톨로지로 매핑하여 저장하고, 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장하는 지식베이스 구축 모듈, 사용자에 의해 입력된 기술분야에 대한 자원 검색 정보 제공이 요청된 경우, 상기 기술분야에 대한 연구주체유형 및 자원유형을 선택하기 위한 유형 선택 화면을 제공하여 연구주체유형 및 자원유형을 입력받는 유형 선택 모듈, 상기 통합 지식베이스를 검색하여 상기 기술분야를 다루는 상기 연구주체유형에 해당하는 하나 이상의 대표 연구주체를 획득하고, 상기 획득된 대표 연구주체들에 대해 상기 입력된 자원유형에 해당하는 자원 검색 정보를 각각 획득하는 자원 검색 정보 획득 모듈, 상기 획득된 자원 검색 정보를 상기 자원유형들을 축으로 하는 그래프상에 표시하여 제공하는 자원 검색 정보 제공 모듈을 포함하는 다중 자원의 통합에 의한 자원 검색 장치가 제공된다. According to an aspect of the present invention, a technical term dictionary and context pattern information in which technical terms are defined for each technical field are stored, and technical terms are recognized in an input document using the technical term dictionary for each resource. A technical term recognition and relationship generation module for generating a relationship between the recognized technical terms using context pattern information, and mapping and storing the relation between the recognized technical terms and technical terms in an integrated ontology in different multiple resources, and storing the integrated terms. Knowledge base building module that expands the integrated knowledge base by inferring ontologies, and when requested to provide resource retrieval information for a technical field input by a user, selecting a research subject type and a resource type for the technical field Type selection screen that receives research subject type and resource type by providing type selection screen Module, the integrated knowledge base is searched to obtain one or more representative research subjects corresponding to the research subject type covering the technical field, and resource search information corresponding to the input resource type for the acquired representative research subjects. Provided by the resource retrieval information acquisition module comprising a resource retrieval information acquisition module for respectively obtaining a resource retrieval module, and a resource retrieval information providing module for displaying the obtained resource retrieval information on a graph of the resource type axis; do.

상기 자원 검색 장치는 상기 자원 검색 정보 제공 모듈을 통해 제공된 그래프상의 특정 위치가 선택된 경우, 해당 위치의 검색 결과에 해당하는 검색 리스트 또는 해당 자원의 내용을 제공하는 자원 내용 제공 모듈을 더 포함할 수 있다.The resource searching apparatus may further include a resource list providing module for providing a search list corresponding to a search result of the corresponding position or the content of the corresponding resource when a specific position on the graph provided through the resource searching information providing module is selected. .

상기 데이터베이스는 하나 이상의 기술분야, 각 기술분야에 속하는 기술용어, 각 기술용어의 식별자가 매핑된 기술용어 사전이 저장된 기술용어 사전 데이터베이스, 기술용어 사이의 문맥에 대한 패턴 정보가 저장된 문맥 패턴 정보 데이터베이스, 문맥을 정규화하기 위한 정규화 사전 데이터베이스를 포함한다.The database may include at least one technical field, a technical term belonging to each technical field, a technical term dictionary database storing a technical term dictionary mapped with an identifier of each technical term, a context pattern information database storing pattern information about a context between technical terms, Contains a normalization dictionary database for normalizing context.

상기 기술용어 인식 및 관계 생성 모듈은 상기 입력 문서에 대해 형태소 분석, 구문 분석, 의미 분석을 수행하여 용어를 인식하고, 상기 인식된 용어가 상기 기술용어 사전에 등록된 경우, 기술용어로 인식하는 기술용어 인식부, 상기 기술용어 인식 모듈에서 2개 이상의 기술용어가 인식된 경우, 상기 문맥 패턴 정보를 근거로 상기 인식된 기술용어 사이의 문맥을 추출하고, 상기 정규화 사전 데이터베이스를 근거로 상기 추출된 문맥을 정규화하는 방식으로 기술용어간의 관계를 생성하는 관계 생성부를 포함한다.The terminology recognition and relationship generation module recognizes terms by performing morphological analysis, syntax analysis, and semantic analysis on the input document, and if the recognized terms are registered in the terminology dictionary, When two or more technical terms are recognized by the term recognition unit and the technical term recognition module, the context between the recognized technical terms is extracted based on the context pattern information, and the extracted context is based on the normalized dictionary database. It includes a relationship generating unit for generating a relationship between the technical terms in a manner that normalizes.

상기 기술용어 인식부는 상기 인식된 각 기술용어에 기술분야 및 식별자를 부여한다.The technical term recognition unit assigns a technical field and an identifier to each of the recognized technical terms.

상기 관계 생성부는 상기 추출된 기술용어와 상기 생성된 기술용어간의 관계를 주체(Subject), 관계명(Predicate), 객체(Object)로 표현한다.The relationship generating unit expresses a relationship between the extracted description term and the generated description term as a subject, a relationship name, and an object.

상기 지식베이스 구축 모듈은 상기 서로 다른 다중 자원에서 생성된 기술용어간의 관계 또는 각 자원의 메타 데이터를 다중 자원간의 연결관계를 표현한 통합 온톨로지로 저장한다.The knowledge base construction module stores the relationship between the technical terms generated in the different multiple resources or the metadata of each resource as an integrated ontology representing the connection relationship between the multiple resources.

상기 자원유형은 특허, 논문, 보고서, 학술자료, 표준, 통계, 전자 문서 중 적어도 하나를 말하고, 상기 연구주체유형은 국가, 단체, 기관, 연구자 중 적어도 하나일 수 있다.The resource type refers to at least one of patents, papers, reports, academic data, standards, statistics, and electronic documents, and the type of research subject may be at least one of a country, a group, an institution, and a researcher.

상기 자원 검색 정보는 기술분야에 따른 연도별 연구 건수를 포함한다.The resource search information includes the number of research by year according to the technical field.

상기 자원 검색 정보 제공 모듈은 상기 입력된 자원유형들을 축으로 하고, 대표 연구주체별로 자원유형에 따른 연구 건수, 기술분야 및 연도가 표시된 그래프를 생성하여 제공한다.The resource retrieval information providing module is based on the input resource types, and generates and provides a graph displaying the number of studies, technical fields, and years according to the resource types for each representative research subject.

본 발명의 다른 측면에 따르면, 자원 검색 장치가 다중 자원의 통합에 의한 자원 검색 정보를 제공하는 방법에 있어서, (a) 각 자원별로 기술용어 사전을 이용하여 입력 문서에서의 기술용어를 인식하고, 문맥 패턴 정보를 이용하여 상기 인식된 기술용어간의 관계를 생성하는 단계, (b) 서로 다른 다중 자원에서 상기 인식된 기술용어와 기술용어간의 관계를 통합 온톨로지로 매핑하여 저장하고, 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장하는 단계, (c) 사용자에 의해 입력된 기술분야에 대한 자원 검색 정보 제공이 요청된 경우, 상기 기술분야에 대한 연구주체유형 및 자원유형을 선택하기 위한 유형 선택 화면을 제공하여 연구주체유형 및 자원유형을 입력받는 단계, (d) 상기 통합 지식베이스를 검색하여 상기 기술분야를 다루는 상기 연구주체유형에 해당하는 하나 이상의 대표 연구주체를 획득하고, 상기 획득된 대표 연구주체들에 대해 상기 입력된 자원유형에 해당하는 자원 검색 정보를 각각 획득하는 단계, (e) 상기 획득된 자원 검색 정보를 상기 자원유형들을 축으로 하는 그래프상에 표시하여 제공하는 단계를 포함하는 다중 자원의 통합에 의한 자원 검색 방법이 제공된다. According to another aspect of the present invention, a method for providing a resource search information by integrating multiple resources in the resource retrieval device, (a) using the technical term dictionary for each resource to recognize the technical terms in the input document, Generating a relationship between the recognized technical terms using context pattern information, (b) mapping and storing the relationship between the recognized technical terms and technical terms in an integrated ontology in different multiple resources, and storing the integrated ontology for the integrated ontology Expanding the integrated knowledge base by performing inference; and (c) selecting a research subject type and a resource type for the technical field when requested to provide resource search information on the technical field input by the user. Providing a screen and inputting a research subject type and a resource type; (d) searching the integrated knowledge base to deal with the technical field; Acquiring at least one representative research subject corresponding to the research subject type, and acquiring resource search information corresponding to the input resource type with respect to the acquired representative research subjects, respectively (e) the obtained resource There is provided a resource searching method by integrating multiple resources, including providing and displaying search information on a graph with the resource types as axes.

상기 다중 자원의 통합에 의한 자원 검색 방법은 상기 제공된 그래프상의 특정 위치가 선택된 경우, 해당 위치의 검색 결과에 해당하는 검색 리스트 또는 해당 자원의 내용을 제공하는 단계를 더 포함할 수 있다.The resource searching method by integrating the multiple resources may further include providing a search list corresponding to a search result of the corresponding position or contents of the corresponding resource when a specific position on the provided graph is selected.

상기 (a) 단계는 상기 입력 문서에 대해 형태소 분석, 구문 분석, 의미 분석을 수행하여 용어를 인식하고, 상기 인식된 용어가 상기 기술용어 사전에 등록된 경우, 기술용어로 인식하는 단계, 상기 인식된 기술용어가 2개 이상인 경우, 상기 문맥 패턴 정보를 근거로 상기 인식된 기술용어 사이의 문맥을 추출하는 단계, 기 저장된 정규화 사전을 근거로 상기 추출된 문맥을 정규화하는 방식으로 기술용어간의 관계를 생성하는 단계를 포함한다.The step (a) is to perform a morphological analysis, a syntax analysis, a semantic analysis on the input document to recognize a term, and if the recognized term is registered in the technical term dictionary, recognize the term as technical term, the recognition Extracting a context between the recognized descriptive terms based on the context pattern information, and extracting a context between descriptive terms in a manner of normalizing the extracted context based on a previously stored normalization dictionary. Generating.

상기 자원유형은 특허, 논문, 보고서, 학술자료, 표준, 통계, 전자 문서 중 적어도 하나를 말하고, 상기 연구주체유형은 국가, 단체, 기관, 연구자 중 적어도 하나일 수 있다.The resource type refers to at least one of patents, papers, reports, academic data, standards, statistics, and electronic documents, and the type of research subject may be at least one of a country, a group, an institution, and a researcher.

상기 자원 검색 정보는 기술분야에 따른 연도별 연구 건수를 포함한다.The resource search information includes the number of research by year according to the technical field.

상기 (e) 단계는 상기 입력된 자원유형들을 축으로 하고, 대표 연구주체별로 자원유형에 따른 연도별 연구 건수 및 기술분야가 표시된 그래프를 생성하여 제공할 수 있다.The step (e) may be based on the input resource types, generating and providing a graph indicating the number of studies and technical fields by year according to resource types for each representative research subject.

본 발명의 또 다른 측면에 따르면, 다중 자원의 통합에 의한 자원 검색 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체가 제공된다.
According to still another aspect of the present invention, there is provided a computer-readable recording medium having recorded thereon a program for executing a resource searching method by integrating multiple resources.

본 발명에 따르면, 서로 다른 다중 자원을 융합하여 사용자의 요구에 따라 다양한 관점에서의 정보 서비스가 가능하고, 의사 결정을 지원하기 위한 여러 서비스들을 제공함으로써 단편적 지식에 의한 의사 결정 오류를 방지하고 정확한 결정이 가능한 효과가 있다.According to the present invention, information services from various viewpoints are possible according to a user's request by fusing different resources, and various services for supporting decision making are prevented and accurate decisions are prevented by fragmentary knowledge. This has a possible effect.

또한, 사용자에 의해 입력된 연구주체유형 및 자원유형에 따른 검색정보를 그래프 상에 연도순으로 정렬하여 제공하므로, 해당 연구주체에 대한 기술 동향을 파악하고, 향후 동향을 예측할 수 있는 효과가 있다.
In addition, since the search information according to the research subject type and resource type inputted by the user is arranged and provided in the order of year on the graph, it is possible to grasp the technical trend of the research subject and predict the future trend.

도 1은 본 발명의 실시예에 따른 다중 자원의 통합에 의한 자원 검색 장치의 구성을 개략적으로 나타낸 블럭도.
도 2는 본 발명의 실시예에 따른 자원 검색 장치가 다중 자원의 통합에 의한 자원 검색 정보를 제공하는 방법을 나타낸 흐름도.
도 3은 본 발명에 따른 유형 선택 화면의 예시도.
도 4는 본 발명에 따른 자원 검색 결과 제공 화면의 예시도.
1 is a block diagram schematically illustrating a configuration of an apparatus for resource searching by integrating multiple resources according to an embodiment of the present invention.
2 is a flowchart illustrating a method in which a resource searching apparatus provides resource search information by integrating multiple resources according to an embodiment of the present invention.
3 is an exemplary view of a type selection screen according to the present invention.
4 is an exemplary view of a resource search result providing screen according to the present invention.

본 발명의 전술한 목적과 기술적 구성 및 그에 따른 작용 효과에 관한 자세한 사항은 본 발명의 명세서에 첨부된 도면에 의거한 이하 상세한 설명에 의해 보다 명확하게 이해될 것이다.
Details of the above-described objects and technical configurations of the present invention and the effects thereof according to the present invention will be more clearly understood by the following detailed description based on the accompanying drawings.

도 1은 본 발명의 실시예에 따른 다중 자원의 통합에 의한 자원 검색 장치의 구성을 개략적으로 나타낸 블럭도이다. 1 is a block diagram schematically illustrating a configuration of an apparatus for resource searching by integrating multiple resources according to an embodiment of the present invention.

도 1을 참조하면, 다중 자원의 통합에 의한 자원 검색 장치(이하, 자원 검색 장치로 칭함)(100)는 데이터베이스(110), 기술용어 인식 및 관계 생성 모듈(120), 지식베이스 구축 모듈(130), 유형 선택 모듈(150), 자원검색 정보 획득 모듈(160), 자원 검색정보 제공 모듈(170)을 포함한다. Referring to FIG. 1, a resource search apparatus (hereinafter referred to as a resource search apparatus) 100 by integrating multiple resources may include a database 110, a technical term recognition and relationship generation module 120, and a knowledge base construction module 130. ), A type selection module 150, a resource search information acquisition module 160, and a resource search information providing module 170.

상기 데이터 베이스(110)는 하나 이상의 기술분야, 각 기술분야에 속하는 기술용어, 각 기술용어의 식별자가 매핑된 기술용어 사전이 저장된 기술용어 사전 데이터베이스(112), 기술용어 사이의 문맥에 대한 패턴 정보가 저장된 문맥 패턴 정보 데이터베이스(114), 문맥을 정규화하기 위한 정규화 사전 데이터베이스9116)를 포함한다.The database 110 includes one or more technical fields, a technical term belonging to each technical field, a technical term dictionary database 112 in which a technical term dictionary mapped with an identifier of each technical term is stored, and pattern information about a context between technical terms. The stored context pattern information database 114, and a normalization dictionary database 9316 for normalizing the context.

상기 기술용어 인식 및 관계 생성 모듈(120)은 각 자원별로 상기 기술용어 사전을 이용하여 입력 문서에서의 기술용어를 인식하고, 상기 문맥 패턴 정보를 이용하여 상기 인식된 기술용어간의 관계를 생성한다. The terminology recognition and relationship generation module 120 recognizes a terminology in an input document by using the terminology dictionary for each resource, and generates a relationship between the recognized terminology using the context pattern information.

상기와 같은 기술용어 인식 및 관계 생성 모듈(120)은 기술용어 인식부(122)와 관계 생성부(124)로 구성된다. The terminology recognition and relationship generation module 120 as described above includes a terminology recognition unit 122 and a relationship generation unit 124.

상기 기술용어 인식부(122)는 상기 입력 문서에 대해 형태소 분석, 구문 분석, 의미 분석을 수행하여 용어를 인식하고, 상기 인식된 용어가 상기 기술용어 사전에 등록된 경우, 기술용어로 인식한다. 이때, 상기 기술용어 인식부(122)는 상기 인식된 각 기술용어에 기술분야 및 식별자를 부여한다.The technical term recognition unit 122 recognizes terms by performing morphological analysis, syntax analysis, and semantic analysis on the input document, and recognizes the technical terms when the recognized terms are registered in the technical term dictionary. In this case, the technical term recognition unit 122 assigns a technical field and an identifier to each recognized technical term.

상기 관계 생성부(124)는 상기 기술용어 인식부(122)에서 2개 이상의 기술용어가 인식된 경우, 상기 문맥 패턴 정보를 근거로 상기 인식된 기술용어 사이의 문맥을 추출하고, 상기 정규화 사전 데이터베이스(116)를 근거로 상기 추출된 문맥을 정규화하는 방식으로 기술용어간의 관계를 생성한다.When two or more technical terms are recognized by the technical term recognition unit 122, the relationship generator 124 extracts a context between the recognized technical terms based on the context pattern information, and extracts the normalized dictionary database. On the basis of 116, the relation between the technical terms is generated by normalizing the extracted context.

예를 들어, "notebook consists of monitor, SSD, and mobile processor" 문장의 경우, 상기 기술용어 인식부(122)는 상기 문장에서 notebook, monitor, SSD, mobile processor의 기술용어를 인식하게 된다.For example, in the case of a "notebook consists of monitor, SSD, and mobile processor" sentence, the terminology recognition unit 122 recognizes the terminology of the notebook, monitor, SSD, mobile processor in the sentence.

이때, 2개 이상의 기술용어가 인식되었으므로, 상기 관계 생성부(124)는 기 저장된 문맥 패턴 정보 예를 들면, "Be동사 + 과거분사형 + 전치사"에 부합하는 문맥만을 추출한다.In this case, since two or more technical terms have been recognized, the relationship generation unit 124 extracts only the contexts matching the pre-stored context pattern information, for example, "Be verb + past participle type + preposition".

그런 다음 상기 관계 생성부(124)는 상기 정규화 사전 데이터베이스(116)를 근거로, 해당 문맥의 시제, 예를 들면 "was"를 "be"로 통일하고, 유사표현 예를 들면, “similar to"와 "similar with"를 "similar to"로 통일하는 등의 문맥 정규화를 수행하여 기술용어간의 관계를 생성한다.Then, based on the normalization dictionary database 116, the relationship generation unit 124 unifies the tense of the context, for example, "was" as "be", and similar expressions, for example, "similar to". Contextual normalization, such as unifying "similar with" with "similar to", creates a relationship between technical terms.

상기 관계 생성부(124)는 상기 인식된 기술용어간의 관계를 주체(Subject), 관계명(Predicate), 객체(Object)로 표현한다.The relationship generation unit 124 expresses the relationship between the recognized technical terms as a subject, a relationship name, and an object.

상기 기술용어 인식 및 관계 생성 모듈(120)이 기술용어 인식 및 관계를 생성하는 방법은 자원별로 이루어지고, 여기서 자원은 특허, 논문, 보고서, 학술자료, 표준, 통계, 전자 문서 등을 말한다.The technical term recognition and relationship generation module 120 is a method for generating the technical term recognition and relationship is made for each resource, where the resource refers to patents, articles, reports, academic data, standards, statistics, electronic documents, and the like.

상기 지식베이스 구축 모듈(130)은 서로 다른 다중 자원에서 상기 기술용어 인식 및 관계 생성 모듈에서 인식된 기술용어와 기술용어간의 관계를 통합 온톨로지로 매핑하여 저장하고, 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장한다.The knowledge base construction module 130 maps and stores the relation between the technical term and the technical term recognized in the technical term recognition and relationship generation module as an integrated ontology in different multiple resources, and performs inference on the integrated ontology. Extend the integrated knowledge base.

이때, 상기 지식베이스 구축 모듈(130)은 서로 다른 다중 자원에서 생성된 기술용어간의 관계 또는 각 자원의 메타 데이터를 다중 자원간의 연결관계로 표현한 통합 온톨로지로 저장한다.In this case, the knowledge base construction module 130 stores the relationship between the technical terms generated in different multiple resources or metadata of each resource as an integrated ontology represented as a connection relationship between the multiple resources.

상기 지식 베이스 구축 모듈(130)에 의해 생성된 통합 지식베이스는 지식 베이스 DB(140)에 저장된다.The integrated knowledge base generated by the knowledge base building module 130 is stored in the knowledge base DB 140.

상기 유형 선택 모듈(150)은 사용자에 의해 입력된 기술분야에 대한 자원 검색 정보 제공이 요청된 경우, 상기 기술분야에 대한 연구주체유형 및 그래프의 축이 되는 자원유형을 선택하기 위한 유형 선택 화면을 제공하여 상기 사용자로부터 연구주체유형 및 자원유형을 입력받는다.When the type selection module 150 is requested to provide resource search information for a technical field input by a user, the type selection module 150 displays a type selection screen for selecting a research subject type for the technical field and a resource type as an axis of a graph. Provides input of research subject type and resource type from the user.

즉, 상기 유형 선택 모듈(150)은 사용자가 검색을 원하는 기술분야를 입력하면, 상기 기술분야에 대한 연구주체유형 및 자원유형을 선택하기 위한 유형 선택 화면을 제공한다. 상기 유형 선택 화면은 연도범위를 지정하기 위한 연도범위 지정영역을 더 포함할 수 있다.That is, the type selection module 150 provides a type selection screen for selecting a research subject type and a resource type for the technical field when the user inputs a technical field to be searched. The type selection screen may further include a year range designation area for designating a year range.

상기 사용자는 상기 유형 선택 화면을 통해 연구주체유형 및 자원유형을 입력하고, 부가적으로 연도범위를 지정할 수도 있다.The user may input a research subject type and a resource type through the type selection screen and additionally specify a year range.

여기서, 상기 연구주체유형은 국가, 단체, 기관, 연구자 등을 말하고, 상기 자원유형은 특허, 논문, 보고서, 학술자료, 표준, 통계, 전자 문서 등을 말한다.Here, the type of research subject refers to a country, a group, an institution, a researcher, and the like, and the resource type refers to a patent, a paper, a report, an academic data, a standard, statistics, an electronic document, and the like.

상기 자원 검색 정보 획득 모듈(160)은 상기 지식베이스 구축 모듈(130)에서 확장된 통합 지식베이스를 검색하여 상기 기술분야를 다루며 상기 입력된 연구주체유형에 해당하는 하나 이상의 대표 연구주체를 획득하고, 상기 대표 연구주체들에 대해 상기 기술분야 중에서 상기 입력된 자원유형에 해당하는 자원 검색 정보를 각각 획득한다. 상기 자원 검색 정보는 기술분야에 따른 연도별 연구 건수를 말할 수 있다.The resource search information acquisition module 160 searches the integrated knowledge base extended by the knowledge base construction module 130 to obtain one or more representative research subjects corresponding to the inputted research subject type, covering the technical field, Obtaining resource search information corresponding to the input resource type from the technical field for the representative research subjects, respectively. The resource search information may refer to the number of research by year according to the technical field.

즉, 상기 자원검색 정보 획득 모듈(160)은 상기 통합 지식베이스를 검색하여 상기 기술분야를 다루며 상기 연구주체유형에 해당하는 연구주체들을 획득하고, 상기 획득된 연구주체들 중에서 상위 일정 개수의 연구주체들을 대표 연구주체로 검색한다. That is, the resource retrieval information acquisition module 160 searches the integrated knowledge base to cover the technical field and acquire research subjects corresponding to the research subject type, and the predetermined number of research subjects among the acquired research subjects. Search them as a representative research subject.

그런 다음 상기 자원검색 정보 획득 모듈(160)은 상기 검색된 대표 연구주체들이 상기 기술분야에 대해 발표한 자원 중에서 상기 입력된 자원유형에 해당하는 자원 검색 정보를 각각 획득한다. Then, the resource retrieval information acquisition module 160 obtains resource retrieval information corresponding to the input resource type, respectively, among the resources published by the searched representative research subjects in the technical field.

이때, 상기 자원검색 정보 획득 모듈(160)은 상기 유형 선택 화면을 통해 연도범위가 지정된 경우, 상기 획득된 자원검색 정보 중에서 상기 연도 범위에 해당하는 자원검색 정보만을 획득하게 된다.In this case, when the year range is designated through the type selection screen, the resource search information obtaining module 160 obtains only the resource search information corresponding to the year range from the obtained resource search information.

상기 자원 검색 정보 제공 모듈(170)은 상기 자원 검색 정보 획득 모듈(160)에서 획득된 자원 검색 정보를 상기 자원유형들을 축으로 하는 그래프상에 표시하여 제공한다. 이때, 상기 자원 검색 정보는 연구주체별로 연도순으로 정렬되어 그래프상에 표시된다. The resource search information providing module 170 displays and provides the resource search information acquired by the resource search information obtaining module 160 on a graph around the resource types. In this case, the resource search information is displayed on a graph arranged in order by year for each research subject.

즉, 상기 자원 검색 정보 제공 모듈(170)은 상기 입력된 자원유형들을 축으로 하고, 대표 연구주체별로 자원유형에 따른 연구 건수 및 기술분야가 표시된 그래프를 생성하여 제공한다. That is, the resource search information providing module 170 is based on the input resource types, and generates and provides a graph in which the number of studies and technical fields according to the resource types are displayed for each representative research subject.

상기 자원 검색 정보 제공 모듈(170)은 사용자에 의해 입력된 연구주체유형 및 자원유형에 따른 검색정보를 그래프 상에 연도순으로 정렬하여 제공하므로, 해당 연구주체에 대한 기술 동향을 파악할 수 있도록 하고, 향후 동향을 예측할 수 있도록 한다. The resource search information providing module 170 provides search information according to the research subject type and the resource type input by the user in order of year on a graph, so that the technology trend for the research subject can be identified. Make it possible to predict future trends.

상기 자원 검색 장치(100)는 상기 자원 검색 정보 제공 모듈(170)을 통해 제공된 그래프상의 특정 위치가 선택된 경우, 해당 위치의 검색 결과에 해당하는 검색 리스트 또는 해당 자원의 내용을 제공하는 자원 내용 제공 모듈(미도시)를 더 포함할 수 있다.When the specific location on the graph provided through the resource search information providing module 170 is selected, the resource search apparatus 100 provides a resource list providing module for providing a search list corresponding to a search result of the corresponding location or the content of the corresponding resource. It may further include (not shown).

상기와 같이 구성된 자원 검색 장치(100)는 논문, 특허, 보고서 등 다중 자원 내에서 텍스트 마이닝을 통해 내적 정보(Implicit Information)를 추출하여 메타데이터와 같은 외형적 정보(Explicit Information)와 융합하고, 이를 시맨틱 웹 기술 기반의 서비스 플랫폼에 올려 다양한 관점에서의 정보 서비스를 가능하게 한다.
The resource retrieval apparatus 100 configured as described above extracts implicit information through text mining within multiple resources such as articles, patents, and reports, and fuses it with explicit information such as metadata. It is put on the service platform based on semantic web technology to enable information service from various viewpoints.

도 2는 본 발명의 실시예에 따른 자원 검색 장치가 다중 자원의 통합에 의한 자원 검색 정보를 제공하는 방법을 나타낸 흐름도, 도 3은 본 발명에 따른 유형 선택 화면의 예시도, 도 4는 본 발명에 따른 자원 검색 결과 제공 화면의 예시도이다.2 is a flowchart illustrating a method of providing a resource search information by integrating multiple resources by a resource searching apparatus according to an embodiment of the present invention, FIG. 3 is an exemplary view of a type selection screen according to the present invention, and FIG. An example of a resource search result providing screen according to FIG.

도 2를 참조하면, 자원 검색 장치는 각 자원별로 기술용어 사전을 이용하여 입력 문서에서의 기술용어를 인식하고(S200), 문맥 패턴 정보를 이용하여 상기 인식된 기술용어간의 관계를 생성한다(S202). 즉, 상기 자원 검색 장치는 상기 입력 문서에 대해 형태소 분석, 구문 분석, 의미 분석을 수행하여 용어를 인식하고, 상기 인식된 용어가 상기 기술용어 사전에 등록된 경우, 기술용어로 인식한다. 그런 다음 상기 자원 검색 장치는 상기 인식된 기술용어가 2개 이상인 경우, 상기 문맥 패턴 정보를 근거로 상기 인식된 기술용어 사이의 문맥을 추출하고, 기 저장된 정규화 사전을 근거로 상기 추출된 문맥을 정규화하는 방식으로 기술용어간의 관계를 생성한다.Referring to FIG. 2, the resource retrieval apparatus recognizes a technical term in an input document by using a technical term dictionary for each resource (S200), and generates a relationship between the recognized technical terms using context pattern information (S202). ). That is, the resource retrieval apparatus recognizes a term by performing morphological analysis, syntax analysis, and semantic analysis on the input document, and recognizes the term as a technical term when the recognized term is registered in the technical term dictionary. Then, when the recognized technical term is two or more, the resource searching apparatus extracts a context between the recognized technical terms based on the context pattern information, and normalizes the extracted context based on a previously stored normalization dictionary. Create relationships between technical terms.

상기 S202의 수행 후 상기 자원 검색 장치는 서로 다른 다중 자원에서 각각 인식된 기술용어와 기술용어간의 관계를 통합 온톨로지로 매핑하여 저장하고(S204), 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장한다(S206). 즉, 상기 자원 검색 장치는 논문, 특허, 보고서 등 다중 자원 내에서 텍스트 마이닝을 통해 내적 정보를 추출하여 메타데이터와 같은 외형적 정보와 융합하고, 이를 시맨틱 웹 기술 기반의 서비스 플랫폼에 올려 다양한 관점에서의 정보 서비스를 가능하게 한다. After performing the step S202, the resource retrieval apparatus maps and stores the relationship between the technical term and the technical term respectively recognized in different multiple resources as an integrated ontology (S204), and performs an inference on the integrated ontology to generate an integrated knowledge base. It expands (S206). In other words, the resource retrieval device extracts internal information through text mining within multiple resources such as papers, patents, and reports, fuses it with external information such as metadata, and uploads it to a semantic web technology based service platform from various viewpoints. Enable information services.

상기 S206의 수행 후, 상기 자원 검색 장치는 사용자에 의해 입력된 기술분야에 대한 자원 검색 정보 제공이 요청된 경우(S208), 상기 기술분야에 대한 연구주체유형 및 자원유형을 선택하기 위한 유형 선택 화면을 제공하여(S210) 연구주체유형 및 자원유형을 입력받는다(S212).After performing the step S206, when the resource search apparatus is requested to provide resource search information for the technical field input by the user (S208), a type selection screen for selecting a research subject type and a resource type for the technical field. Provide (S210) receives the research subject type and resource type (S212).

즉, 상기 사용자는 검색어 입력 화면을 통해 검색을 원하는 기술분야를 입력한다. 그러면, 상기 자원 검색 장치는 도 3과 같은 유형 선택 화면을 제공한다. That is, the user inputs a technical field to be searched through the search word input screen. Then, the resource search apparatus provides a type selection screen as shown in FIG.

상기 유형 선택 화면에 대해 도 3을 참조하면, 상기 유형 선택 화면(300)은 연구주체유형을 선택하기 위한 연구주체유형 선택 영역(310), 그래프의 축이 되는 자원을 선택하기 위한 자원 선택 영역(320)을 포함한다.Referring to FIG. 3 for the type selection screen, the type selection screen 300 includes a research subject type selection region 310 for selecting a research subject type, a resource selection region for selecting a resource which is an axis of a graph ( 320).

상기 사용자는 상기 연구주체유형 선택 영역(310)에서 국가, 단체, 기관, 연구자 중 하나의 연구주체유형을 선택하고, 상기 자원선택 영역(320)에서 특허, 논문, 보고서, 학술자료, 표준, 통계, 전자 문서 중 그래프의 축을 위한 적어도 하나의 자원을 선택한다. 여기에서는 자원 선택 영역(320)을 2개의 자원을 선택할 수 있는 형식으로 구성하였으나, 3개, 4개 등의 다수개의 자원을 선택할 수 있는 다양한 형태로 할 수 있음은 당연하다.The user selects a research subject type from a country, a group, an institution, or a researcher in the research subject type selection region 310, and patents, articles, reports, academic data, standards, and statistics in the resource selection region 320. Select at least one resource for the axis of the graph from the electronic document. Here, although the resource selection area 320 is configured in a form capable of selecting two resources, it is natural that the resource selection area 320 can be configured in various forms in which a plurality of resources such as three or four can be selected.

상기 S212의 수행 후, 상기 자원 검색 장치는 상기 통합 지식베이스를 검색하여 상기 기술분야를 다루며 상기 연구주체유형에 해당하는 하나 이상의 대표 연구주체를 획득하고(S214), 상기 대표 연구주체들에 대해 상기 기술분야 중에서 상기 입력된 자원유형에 해당하는 자원 검색 정보를 각각 획득한다(S216). After performing the S212, the resource search apparatus searches the integrated knowledge base to cover the technical field and acquire one or more representative research subjects corresponding to the research subject type (S214), and the representative research subjects Resource search information corresponding to the input resource type is obtained from the technical field, respectively (S216).

그런 다음 상기 자원 검색 장치는 상기 획득된 자원 검색 정보를 상기 자원유형들을 축으로 하는 그래프상에 표시하여 제공한다(S218).Then, the resource retrieval apparatus displays the obtained resource retrieval information on a graph with the resource types as axes (S218).

즉, 상기 자원 검색 장치는 도 4와 같은 자원 검색 결과 제공 화면(400)을 제공할 수 있다. That is, the resource search apparatus may provide a resource search result providing screen 400 as shown in FIG. 4.

도 4를 참조하면, 사용자가 유형 선택 화면에서 연구주체유형을 "국가"로 선택하고, 자원 유형을 "특허"와 "논문"으로 선택한 경우이다. Referring to FIG. 4, a user selects a research subject type as "country" and a resource type as "patent" and "paper" in the type selection screen.

상기 자원 검색 장치는 통합 지식베이스를 검색하여 하나 이상의 대표 국가 즉, A국가, B국가, C국가를 획득하고, 상기 획득된 대표 국가들이 발표한 "특허"와 "논문"을 검색한다.The resource search apparatus searches an integrated knowledge base to obtain one or more representative countries, namely, A, B, and C countries, and searches for "patents" and "papers" published by the acquired representative countries.

그런 다음 상기 자원 검색 장치는 X축을 논문, Y축을 특허로 하는 그래프를 생성하고, 상기 생성된 그래프에 자원 검색 결과를 표시한다. The resource retrieval apparatus then generates a graph with the X-axis as the paper and the Y-axis as the patent, and displays the resource search results on the generated graph.

즉, A국가가 2007년에 논문 4편, 특허 4건의 성과를 냈다면, 상기 자원 검색 장치는 그래프 상에서 X값이 4이며, Y값이 4인 위치에 점이나 아이콘과 함께 기관, 연도, 기술분야를 표시한다.In other words, if the country A achieved four papers and four patents in 2007, the resource retrieval device has an institution, year, and technology along with a dot or icon at a position where the X value is 4 and the Y value is 4 on the graph. Mark the field.

또한, A국가가 2008년에 논문 6편, 특허 6건의 성과를 냈다면, 상기 자원 검색 장치는 그래프 상에서 X값이 6이며, Y값이 6인 위치에 점이나 아이콘과 함께 기관, 연도, 기술분야를 표시한다.In addition, if the country A achieved six papers and six patents in 2008, the resource retrieval device has an institution, year, and technology with a dot or icon at the position where the X value is 6 and the Y value is 6 on the graph. Mark the field.

또한, A국가가 2009년에 논문 8편, 특허 8건의 성과를 냈다면, 상기 자원 검색 장치는 그래프 상에서 X값이 8이며, Y값이 8인 위치에 점이나 아이콘과 함께 기관, 연도, 기술분야를 표시한다.In addition, if the country A has achieved eight papers and eight patents in 2009, the resource retrieval device has an institution, year, and technology with a dot or icon at the position where the X value is 8 and the Y value is 8 on the graph. Mark the field.

또한, B국가가 2007년에 논문 5편, 특허 2건의 성과를 냈다면, 상기 자원 검색 장치는 그래프 상에서 X값이 5이며, Y값이 2인 위치에 점이나 아이콘과 함께 기관, 연도, 기술분야를 표시한다.In addition, if the country B achieved five papers and two patents in 2007, the resource retrieval device has an institution, year, and technology along with a dot or icon at a position with an X value of 5 and a Y value of 2 on the graph. Mark the field.

또한, C국가가 2007년에 논문 3편, 특허 7건의 성과를 냈다면, 상기 자원 검색 장치는 그래프 상에서 X값이 3이며, Y값이 7인 위치에 점이나 아이콘과 함께 기관, 연도, 기술분야를 표시한다.In addition, if the country C achieved three papers and seven patents in 2007, the resource retrieval device has an institution, year, and technology with a dot or icon at a position where the X value is 3 and the Y value is 7 on the graph. Mark the field.

상기와 같이 상기 자원 검색 장치는 상기 획득된 자원 검색 정보를 그래프 상에 연도순으로 정렬함으로써 해당 연구주체에 대한 기술 동향을 파악하고, 향후 동향을 예측할 수 있게 한다. 그래프 상의 특정 위치는 특정 연구주체에 대해 해당 자원의 연구 성과들이 가지는 값을 의미한다.
As described above, the resource retrieval apparatus sorts the acquired resource retrieval information on a graph in order of year so as to identify a technical trend for the research subject and to predict a future trend. The specific location on the graph means the value of the research outcomes of the resource for a particular research subject.

이와 같이, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
As such, those skilled in the art will appreciate that the present invention can be implemented in other specific forms without changing the technical spirit or essential features thereof. Therefore, the above-described embodiments are to be understood as illustrative in all respects and not as restrictive. The scope of the present invention is shown by the following claims rather than the detailed description, and all changes or modifications derived from the meaning and scope of the claims and their equivalents should be construed as being included in the scope of the present invention. do.

이상과 같이 본 발명의 다중 자원의 통합에 의한 자원 검색 장치 및 방법은 사용자에 의해 입력된 연구주체유형 및 자원유형에 따른 검색정보를 그래프 상에 연도순으로 정렬 및 제공하여, 해당 연구주체에 대한 기술 동향을 파악할 필요성이 높은 것에 적합하다.
As described above, the apparatus and method for resource searching by integrating multiple resources of the present invention sorts and provides the research subject type input by the user and the search information according to the resource type in the order of the year on the graph, for the research subject. It is suitable for those that have a high need to understand the technical trend.

100: 자원 검색 정보 제공 장치 110 : 데이터베이스
120 : 기술용어 인식 및 관계 생성 모듈
130 : 지식 베이스 구축 모듈 140 : 지식베이스 DB
150 : 유형 선택 모듈 160 : 자원 검색 정보 획득 모듈
170 : 자원 검색 정보 제공 모듈
100: resource search information providing apparatus 110: database
120: technical term recognition and relationship generation module
130: knowledge base building module 140: knowledge base DB
150: type selection module 160: resource search information acquisition module
170: resource search information providing module

Claims (17)

각 기술분야에 대한 기술용어가 정의된 기술용어 사전 및 문맥 패턴 정보가 저장된 데이터베이스;
각 자원별로 상기 기술용어 사전을 이용하여 입력 문서에서의 기술용어를 인식하고, 상기 문맥 패턴 정보를 이용하여 상기 인식된 기술용어간의 관계를 생성하는 기술용어 인식 및 관계 생성 모듈;
서로 다른 다중 자원에서 각각 인식된 기술용어와 기술용어간의 관계를 통합 온톨로지로 매핑하여 저장하고, 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장하는 지식베이스 구축 모듈;
사용자에 의해 입력된 기술분야에 대한 자원 검색 정보 제공이 요청된 경우, 상기 기술분야에 대한 연구주체유형 및 자원유형을 선택하기 위한 유형 선택 화면을 제공하여 연구주체유형 및 자원유형을 입력받는 유형 선택 모듈;
상기 통합 지식베이스를 검색하여 상기 기술분야를 다루며 상기 연구주체유형에 해당하는 하나 이상의 대표 연구주체를 획득하고, 상기 획득된 대표 연구주체들에 대해 상기 입력된 자원유형에 해당하는 자원 검색 정보를 각각 획득하는 자원 검색 정보 획득 모듈; 및
상기 획득된 자원 검색 정보를 상기 자원유형들을 축으로 하는 그래프상에 표시하여 제공하는 자원 검색 정보 제공 모듈;
을 포함하는 다중 자원의 통합에 의한 자원 검색 장치.
A database storing a technical term dictionary and context pattern information in which technical terms for each technical field are defined;
A technical term recognition and relationship generation module for recognizing a technical term in an input document by using the technical term dictionary for each resource, and generating a relationship between the recognized technical term using the context pattern information;
A knowledge base building module for mapping and storing relations between technical terms and technology terms recognized in different multiple resources as integrated ontology, and expanding the integrated knowledge base by inferring the integrated ontology;
When a request for providing resource search information for a technical field input by a user is requested, a type selection screen for selecting a research subject type and a resource type for the technical field is provided to select a type for receiving a research subject type and a resource type. module;
Search the integrated knowledge base to obtain one or more representative research subjects that cover the technical field and correspond to the research subject type, and obtain resource search information corresponding to the input resource type for the acquired representative research subjects, respectively. Obtaining resource search information obtaining module; And
A resource search information providing module configured to display the obtained resource search information on a graph with the resource types as an axis;
Resource search apparatus by the integration of multiple resources including a.
제1항에 있어서,
상기 자원 검색 정보 제공 모듈을 통해 제공된 그래프상의 특정 위치가 선택된 경우, 해당 위치의 검색 결과에 해당하는 검색 리스트 또는 해당 자원의 내용을 제공하는 자원 내용 제공 모듈을 더 포함하는 것을 특징으로 하는 다중 자원의 통합에 의한 자원 검색 장치.
The method of claim 1,
When a specific location on the graph provided through the resource search information providing module is selected, a resource list providing module for providing a search list corresponding to the search result of the location or the content of the corresponding resource further comprises Resource retrieval device by integration.
제1항에 있어서,
상기 데이터베이스는,
하나 이상의 기술분야, 각 기술분야에 속하는 기술용어, 각 기술용어의 식별자가 매핑된 기술용어 사전이 저장된 기술용어 사전 데이터베이스;
기술용어 사이의 문맥에 대한 패턴 정보가 저장된 문맥 패턴 정보 데이터베이스; 및
문맥을 정규화하기 위한 정규화 사전 데이터베이스를 포함하는 것을 특징으로 하는 연구 주체간의 상관관계가 표시된 다중 자원의 통합에 의한 자원 검색 장치.
The method of claim 1,
The database includes:
A technical term dictionary database in which one or more technical fields, a technical term belonging to each technical field, and a technical term dictionary mapped with an identifier of each technical term are stored;
A context pattern information database in which pattern information about a context between description terms is stored; And
Apparatus for retrieving resources by integrating multiple resources in which correlations among study subjects are included, including a normalization dictionary database for normalizing a context.
제1항에 있어서,
상기 기술용어 인식 및 관계 생성 모듈은,
상기 입력 문서에 대해 형태소 분석, 구문 분석, 의미 분석을 수행하여 용어를 인식하고, 상기 인식된 용어가 상기 기술용어 사전에 등록된 경우, 기술용어로 인식하는 기술용어 인식부; 및
상기 기술용어 인식부에서 2개 이상의 기술용어가 인식된 경우, 상기 문맥 패턴 정보를 근거로 상기 인식된 기술용어 사이의 문맥을 추출하고, 구비된 정규화 사전 데이터베이스를 근거로 상기 추출된 문맥을 정규화하는 방식으로 기술용어간의 관계를 생성하는 관계 생성부를 포함하는 것을 특징으로 하는 다중 자원의 통합에 의한 자원 검색 장치.
The method of claim 1,
The terminology recognition and relationship generation module,
A technical term recognition unit that recognizes terms by performing morphological analysis, syntax analysis, and semantic analysis on the input document, and recognizes the technical terms when the recognized terms are registered in the technical term dictionary; And
When two or more technical terms are recognized by the technical term recognition unit, a context between the recognized technical terms is extracted based on the context pattern information, and the extracted context is normalized based on a normalized dictionary database. Apparatus for retrieving resources by integrating multiple resources, characterized in that it comprises a relationship generating unit for generating a relationship between the technical terms in a manner.
제4항에 있어서,
상기 기술용어 인식부는 상기 인식된 각 기술용어에 기술분야 및 식별자를 부여하는 것을 특징으로 하는 다중 자원의 통합에 의한 자원 검색 장치.
The method of claim 4, wherein
The technical term recognition unit is a resource retrieval apparatus by integrating multiple resources, characterized in that to assign a technical field and identifier to each of the recognized technical terms.
제4항에 있어서,
상기 관계 생성부는 상기 인식된 기술용어간의 관계를 주체(Subject), 관계명(Predicate), 객체(Object)로 표현하는 것을 특징으로 하는 다중 자원의 통합에 의한 자원 검색 장치.
The method of claim 4, wherein
And the relationship generating unit expresses the relationship between the recognized technical terms as a subject, a relationship name, and an object.
제1항에 있어서,
상기 지식베이스 구축 모듈은 상기 서로 다른 다중 자원에서 생성된 기술용어간의 관계 또는 각 자원의 메타 데이터를 다중 자원간의 연결관계로 표현한 통합 온톨로지로 저장하는 것을 특징으로 하는 다중 자원의 통합에 의한 자원 검색 장치.
The method of claim 1,
The knowledge base construction module stores the resource between the technical terms generated in the different multiple resources or the integrated ontology representing metadata of each resource as a connection relationship between the multiple resources. .
제1항에 있어서,
상기 자원유형은 특허, 논문, 보고서, 학술자료, 표준, 통계, 전자 문서 중 적어도 하나를 말하고, 상기 연구주체유형은 국가, 단체, 기관, 연구자 중 적어도 하나인 것을 특징으로 하는 다중 자원의 통합에 의한 자원 검색 장치.
The method of claim 1,
The resource type refers to at least one of patents, papers, reports, academic data, standards, statistics, and electronic documents, and the research subject type is at least one of a country, a group, an institution, and a researcher. Resource retrieval device.
제1항에 있어서,
상기 자원 검색 정보는 기술분야에 따른 연도별 연구 건수를 포함하는 것을 특징으로 하는 다중 자원의 통합에 의한 자원 검색 장치.
The method of claim 1,
The resource retrieval information is a resource retrieval apparatus by integrating multiple resources, characterized in that it includes the number of research by year according to the technical field.
제1항에 있어서,
상기 자원 검색 정보 제공 모듈은 상기 입력된 자원유형들을 축으로 하고, 대표 연구주체별로 자원유형에 따른 연구 건수, 기술분야 및 연도가 표시된 그래프를 생성하여 제공하는 것을 특징으로 하는 다중 자원의 통합에 의한 자원 검색 장치.
The method of claim 1,
The resource retrieval information providing module is based on the input resource types, and generates and provides a graph indicating the number of studies, technical fields, and years according to the resource type for each representative research subject. Resource Retrieval Device.
자원 검색 장치가 다중 자원의 통합에 의한 자원 검색 정보를 제공하는 방법에 있어서,
(a) 각 자원별로 기술용어 사전을 이용하여 입력 문서에서의 기술용어를 인식하고, 문맥 패턴 정보를 이용하여 상기 인식된 기술용어간의 관계를 생성하는 단계;
(b) 서로 다른 다중 자원에서 각각 인식된 기술용어와 기술용어간의 관계를 통합 온톨로지로 매핑하여 저장하고, 상기 통합 온톨로지에 대한 추론을 수행하여 통합 지식베이스를 확장하는 단계;
(c) 사용자에 의해 입력된 기술분야에 대한 자원 검색 정보 제공이 요청된 경우, 상기 기술분야에 대한 연구주체유형 및 자원유형을 선택하기 위한 유형 선택 화면을 제공하여 연구주체유형 및 자원유형을 입력받는 단계;
(d) 상기 통합 지식베이스를 검색하여 상기 기술분야를 다루며 상기 연구주체유형에 해당하는 하나 이상의 대표 연구주체를 획득하고, 상기 획득된 대표 연구주체들에 대해 상기 입력된 자원유형에 해당하는 자원 검색 정보를 각각 획득하는 단계; 및
(e) 상기 획득된 자원 검색 정보를 상기 자원유형들을 축으로 하는 그래프상에 표시하여 제공하는 단계;
를 포함하는 다중 자원의 통합에 의한 자원 검색 방법.
In the method for providing a resource retrieval information by integrating multiple resources, the resource retrieval apparatus,
(a) recognizing a technical term in an input document by using a technical term dictionary for each resource, and generating a relationship between the recognized technical terms using context pattern information;
(b) mapping and storing the relations between the technical terms and the technical terms respectively recognized in different multiple resources as integrated ontology, and expanding the integrated knowledge base by performing inference on the integrated ontology;
(c) When requested to provide resource search information for a technical field input by a user, provide a type selection screen for selecting a research subject type and resource type for the technical field, and input the research subject type and resource type. Receiving step;
(d) search the integrated knowledge base to obtain one or more representative research subjects covering the technical field and corresponding to the research subject type, and search for resources corresponding to the input resource type for the acquired representative research subjects; Obtaining information, respectively; And
(e) providing the obtained resource search information on a graph with the resource types as axes;
Resource search method by the integration of multiple resources comprising a.
제11항에 있어서,
상기 제공된 그래프상의 특정 위치가 선택된 경우, 해당 위치의 검색 결과에 해당하는 검색 리스트 또는 해당 자원의 내용을 제공하는 단계를 더 포함하는 것을 특징으로 하는 다중 자원의 통합에 의한 자원 검색 방법.
The method of claim 11,
When the specific location on the provided graph is selected, providing a search list or the content of the resource corresponding to the search result of the location further comprising the step of resource search by integrating multiple resources.
제11항에 있어서,
상기 (a) 단계는,
상기 입력 문서에 대해 형태소 분석, 구문 분석, 의미 분석을 수행하여 용어를 인식하고, 상기 인식된 용어가 상기 기술용어 사전에 등록된 경우, 기술용어로 인식하는 단계;
상기 인식된 기술용어가 2개 이상인 경우, 상기 문맥 패턴 정보를 근거로 상기 인식된 기술용어 사이의 문맥을 추출하는 단계; 및
기 저장된 정규화 사전을 근거로 상기 추출된 문맥을 정규화하는 방식으로 기술용어간의 관계를 생성하는 단계를 포함하는 것을 특징으로 하는 다중 자원의 통합에 의한 자원 검색 방법.
The method of claim 11,
In step (a),
Recognizing terms by performing morphological analysis, syntax analysis, and semantic analysis on the input document, and recognizing technical terms when the recognized terms are registered in the technical term dictionary;
Extracting a context between the recognized technical terms based on the context pattern information when the recognized technical terms are two or more; And
And generating a relationship between descriptive terms in a manner of normalizing the extracted context based on a previously stored normalization dictionary.
제11항에 있어서,
상기 자원유형은 특허, 논문, 보고서, 학술자료, 표준, 통계, 전자 문서 중 적어도 하나를 말하고, 상기 연구주체유형은 국가, 단체, 기관, 연구자 중 적어도 하나인 것을 특징으로 하는 다중 자원의 통합에 의한 자원 검색 방법.
The method of claim 11,
The resource type refers to at least one of patents, papers, reports, academic data, standards, statistics, and electronic documents, and the research subject type is at least one of a country, a group, an institution, and a researcher. Resource retrieval method.
제11항에 있어서,
상기 자원 검색 정보는 기술분야에 따른 연도별 연구 건수를 포함하는 것을 특징으로 하는 다중 자원의 통합에 의한 자원 검색 방법.
The method of claim 11,
The resource retrieval information is a resource retrieval method by integrating multiple resources, characterized in that it includes the number of research by year according to the technical field.
제11항에 있어서,
상기 (e) 단계는,
상기 입력된 자원유형들을 축으로 하고, 대표 연구주체별로 자원유형에 따른 연도별 연구 건수 및 기술분야가 표시된 그래프를 생성하여 제공하는 것을 특징으로 하는 다중 자원의 통합에 의한 자원 검색 방법.
The method of claim 11,
In step (e),
The resource retrieval method by integrating multiple resources based on the input resource types, and generating and providing a graph indicating the number of researches and technical fields by year according to the resource type for each representative research subject.
삭제delete
KR1020100097797A 2010-10-07 2010-10-07 Apparatus and method for resource search based on combination of multiple resource KR101067830B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020100097797A KR101067830B1 (en) 2010-10-07 2010-10-07 Apparatus and method for resource search based on combination of multiple resource
PCT/KR2010/007240 WO2012046905A1 (en) 2010-10-07 2010-10-21 Device and method for resource search based on combination of multiple resources

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100097797A KR101067830B1 (en) 2010-10-07 2010-10-07 Apparatus and method for resource search based on combination of multiple resource

Publications (1)

Publication Number Publication Date
KR101067830B1 true KR101067830B1 (en) 2011-09-27

Family

ID=44957910

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100097797A KR101067830B1 (en) 2010-10-07 2010-10-07 Apparatus and method for resource search based on combination of multiple resource

Country Status (2)

Country Link
KR (1) KR101067830B1 (en)
WO (1) WO2012046905A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180036460A (en) * 2016-09-30 2018-04-09 주식회사 솔트룩스 System and method for recommending knowledge actively to write document

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102111734B1 (en) * 2018-11-29 2020-05-15 주식회사 솔트룩스 System and method for building integration knowledge base based

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100421091B1 (en) * 2000-05-31 2004-03-10 노영희 System of search for nation base information by use the import knowledge base
KR20090114778A (en) * 2008-04-30 2009-11-04 한국과학기술정보연구원 Apparatus of semantic technological intelligence language mining system for large size database
KR20100054588A (en) * 2008-11-14 2010-05-25 한국과학기술정보연구원 Method and apparatus of semantic technological approach based on semantic relation in context and storage media having program source thereof
KR20100074372A (en) * 2008-12-24 2010-07-02 한국과학기술정보연구원 Research and development monitoring and alerting system and method in science and technology

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070060993A (en) * 2005-12-08 2007-06-13 한국전자통신연구원 Method and system for verifying protein-protein interaction using text mining
KR100993816B1 (en) * 2008-08-04 2010-11-12 한국과학기술정보연구원 System and method for providing a technology information

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100421091B1 (en) * 2000-05-31 2004-03-10 노영희 System of search for nation base information by use the import knowledge base
KR20090114778A (en) * 2008-04-30 2009-11-04 한국과학기술정보연구원 Apparatus of semantic technological intelligence language mining system for large size database
KR20100054588A (en) * 2008-11-14 2010-05-25 한국과학기술정보연구원 Method and apparatus of semantic technological approach based on semantic relation in context and storage media having program source thereof
KR20100074372A (en) * 2008-12-24 2010-07-02 한국과학기술정보연구원 Research and development monitoring and alerting system and method in science and technology

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180036460A (en) * 2016-09-30 2018-04-09 주식회사 솔트룩스 System and method for recommending knowledge actively to write document

Also Published As

Publication number Publication date
WO2012046905A1 (en) 2012-04-12

Similar Documents

Publication Publication Date Title
KR101873873B1 (en) Multimedia content search device through attribute information analysis and Method
KR101064981B1 (en) Apparatus and method for providing resource search information marked the relationship between research subject using of knowledge base combined multiple resource
JP2020135891A (en) Methods, apparatus, devices and media for providing search suggestions
JP5349699B1 (en) Document analysis apparatus and program
KR101055363B1 (en) Apparatus and method for providing search information based on multiple resource
US10229194B2 (en) Providing known distribution patterns associated with specific measures and metrics
JP5500070B2 (en) Data classification system, data classification method, and data classification program
KR101067830B1 (en) Apparatus and method for resource search based on combination of multiple resource
WO2020079752A1 (en) Document search method and document search system
KR20160120583A (en) Knowledge Management System and method for data management based on knowledge structure
JP7259854B2 (en) Question answering device, question answering method and program
KR101602342B1 (en) Method and system for providing information conforming to the intention of natural language query
JP2014102625A (en) Information retrieval system, program, and method
KR101458857B1 (en) Patent Analysis System and Method therefor and Computer Readable Recording Medium On Which Program Therefor is Recorded
Han et al. Mining integration patterns of programmable ecosystem with social tags
WO2014170965A1 (en) Document processing method, document processing device, and document processing program
US11507593B2 (en) System and method for generating queryeable structured document from an unstructured document using machine learning
JP2019061522A (en) Document recommendation system, document recommendation method and document recommendation program
De Virgilio et al. A reverse engineering approach for automatic annotation of Web pages
JP6854923B2 (en) Numerical information management device capable of numerical information retrieval
Yang et al. KOSMOS: Knowledge-graph oriented social media and mainstream media overview system
JP7371989B1 (en) Search server, search system, and search program
JP6887002B2 (en) Information processing equipment, server equipment, user terminals, methods and programs
KR20110017297A (en) Method and apparatus for mapping the heterogeneous classification systems
Suire et al. An OER on digital historical research on European historical newspapers with the NewsEye platform

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140718

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150904

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160630

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170703

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20180809

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20190701

Year of fee payment: 9