KR20150057322A - System and Method for Deducting about Weak Signal Using Big Data Analysis - Google Patents
System and Method for Deducting about Weak Signal Using Big Data Analysis Download PDFInfo
- Publication number
- KR20150057322A KR20150057322A KR1020130140531A KR20130140531A KR20150057322A KR 20150057322 A KR20150057322 A KR 20150057322A KR 1020130140531 A KR1020130140531 A KR 1020130140531A KR 20130140531 A KR20130140531 A KR 20130140531A KR 20150057322 A KR20150057322 A KR 20150057322A
- Authority
- KR
- South Korea
- Prior art keywords
- data
- module
- collection
- analysis
- word
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Z—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
- G16Z99/00—Subject matter not provided for in other main groups of this subclass
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
본 발명은 빅데이터 분석 기반의 위크시그널 도출 시스템 및 그 방법에 관한 것으로서, 보다 상세하게는, 정형 데이터는 물론 비정형 데이터까지 포함하는 빅데이터를 대상으로 수집, 저장 및 분석과정을 자동으로 수행하여 위크시그널을 계량적으로 분석할 수 있는 빅데이터 분석 기반의 위크시그널 도출 시스템 및 그 방법에 관한 것이다.
[0001] The present invention relates to a system and method for deriving a week signal based on big data analysis, and more particularly, to a system and method for deriving a week signal based on big data analysis, The present invention relates to a system and method for deriving a week signal based on a big data analysis capable of quantitatively analyzing a signal.
최근 들어 미래산업에 대한 관심이 더욱 고조됨에 따라 과학기술에 있어서 미래를 예측하는 것, 특히 미래 과학기술 변화의 징후, '위크시그널(weaksignal)'의 탐색에 대한 요구도 증가하고 있는 추세이다.In recent years, as the interest in the future industry has increased, there is a growing demand for forecasting the future of science and technology, especially the signs of future science and technology change and the search for 'weaksignal'.
위크시그널은 현재에는 불확실하고 비정상적인 신호이지만 미래 변화를 주도할 예비 징후를 의미하며, 이는 미래 예측에 있어서 중요한 실마리를 제공하게 된다.Week signals are now uncertain and unusual signals, but they are a preliminary indication that will lead to future changes, providing an important clue to future predictions.
위크시그널(weak signal)에 대한 정의는 학자에 따라 다양하며 유사한 개념의 용어로는 'emerging issues', 'seeds of change', 'wild cards', 'early indicator' 또는 'early warning signal' 등이 사용되고 있다.Definitions of weak signals vary from scholar to expert, and the terms 'emerging issues', 'seeds of change', 'wild cards', 'early indicators' or 'early warning signals' have.
위크시그널에 대한 연구는 기술의 미래를 연구하는데 있어 중요한 단초를 좀 더 먼저 제공한다는 점에서 중요성을 인식할 수 있으나, 그 개념부터 탐색 방법, 활용 분야에 이르기까지 길지 않은 역사를 가진 분야로 더욱 심도 깊은 연구가 요구되고 있다.Research on week signals can be important in that it provides a crucial first step in studying the future of technology, but it is a field with a long history ranging from its concept to its exploration methods and applications. Deep research is required.
그런데, 종래기술에 따른 위크시그널 탐색은 전문가의 통찰력에 주로 의존하고 있어, 신뢰성과 객관성이 문제가 되고 있으며, 데이터를 기반으로 계량정보분석 기법을 활용할 경우 정형화된 데이터만을 대상으로 함에 따라 매주 제한적인 분석만이 가능하다는 한계가 있었다.However, since the search of the week signal according to the prior art mainly depends on the expert's insight, reliability and objectivity are a problem. When using the metric information analysis technique based on the data, There was a limitation that only analysis was possible.
또한, 최근 폭발적으로 증가하여 그 비중이 높아지고 있는 비정형 데이터를 대상으로 하여 위크시그널을 분석하는 기술은 지원하지 않는다는 문제가 있었다.
In addition, there has been a problem in that it does not support the technique of analyzing the week signal with the unstructured data whose explosive increase has been increasing recently.
본 발명은 상술한 문제점을 해결하기 위하여 안출된 것으로서, 정형 데이터는 물론 비정형 데이터까지 포함하는 빅데이터를 대상으로 수집, 저장 및 분석과정을 자동으로 수행하여 위크시그널을 계량적으로 분석할 수 있는 빅데이터 분석 기반의 위크시그널 도출 시스템 및 그 방법을 제공하는데 그 기술적 과제가 있다.
SUMMARY OF THE INVENTION The present invention has been made in order to solve the above-mentioned problems, and it is an object of the present invention to provide a method and apparatus for automatically collecting, storing and analyzing large data including not only regular data but also atypical data, A system and method for deriving a week signal based on data analysis are provided.
상술한 과제를 해결하기 위한 본 발명의 일 측면에 따르면, 수집 대상 데이터 소스 모듈, 수집 대상 키워드 및 수집 대상 기간 중 적어도 어느 하나의 수집 기준을 설정하는 수집 관리 모듈; 상기 수집 관리 모듈로부터 설정 받은 데이터 수집 기준에 따라 해당 데이터 소스 모듈로부터 빅데이터를 수집하여 데이터베이스 모듈에 저장하는 데이터 수집 모듈; 상기 데이터베이스 모듈에 저장된 빅데이터의 형태소를 분석하여 형태소 별로 구분하고 형태소 분석 데이터를 생성하는 형태소 분석 모듈; 및 상기 형태소 분석 데이터를 분산 병렬 처리 기반의 통계분석 알고리즘으로 처리하여 통계값을 산출하고 상기 통계값에 따라 위크시그널을 출력하는 데이터 분석 모듈을 포함하는 빅데이터 분석 기반의 위크시그널 도출 시스템이 제공된다.According to an aspect of the present invention, there is provided a data collection system including a collection management module for setting collection criteria of at least one of a collection target data source module, a collection target keyword and a collection target period; A data collection module for collecting big data from the data source module according to the data collection criteria set by the collection management module and storing the collected big data in the database module; A morpheme analysis module for analyzing morphemes of big data stored in the database module and dividing them by morphemes and generating morpheme analysis data; And a data analysis module for processing the morpheme analysis data using a statistical analysis algorithm based on a distributed parallel processing to calculate a statistical value and output a weak signal according to the statistical value, .
여기서, 상기 데이터 분석 모듈은, 상기 형태소 분석 데이터를 저장하는 분산 파일 시스템; 상기 분산 파일 시스템에 존재하는 형태소 분석 데이터를 SQL(structured query language)을 기반으로 처리할 수 있도록 가상화 데이터베이스 인터페이스를 제공하는 데이터 처리부; 및 상기 데이터 처리부가 제공하는 가상화 데이터베이스 인터페이스를 통해 통계분석 알고리즘을 실행하여, 상기 형태소 분석 데이터로부터 연도별 출현빈도수(instance frequencies), 연도별 단어-단어 간 동시 출연 건수, 연도별 출현빈도수 및 연도별 단어-단어 간 동시 출현 건수로부터 가공된 값들 중 적어도 하나 이상을 산출하는 통계 분석부를 포함할 수 있다.Here, the data analysis module may include: a distributed file system for storing the morpheme analysis data; A data processing unit for providing a virtualization database interface to process morpheme analysis data existing in the distributed file system based on a structured query language (SQL); And a statistical analysis algorithm through the virtualization database interface provided by the data processing unit to calculate statistical analysis algorithms based on the morphological analysis data, such as instance frequencies, number of simultaneous appearances between words and words per year, And a statistical analysis unit for calculating at least one of the processed values from the number of simultaneous occurrences of word-words.
그리고, 상기 통계 분석부는, 상기 통계 분석부는 상기 연도별 출현건수(instance frequencies) 및 단어-단어간 동시 발생건수에 기초하여 단어 별 발생건수 증가율을 산출할 수 있다.In addition, the statistical analysis unit may calculate the rate of increase in the number of occurrences of words based on the instance frequencies and the number of simultaneous occurrences between the words.
또한, 상기 통계 분석부는, 상기 연도별 출현건수(instance frequencies)를 연도별 문서수로 나누어 문서당 상기 단어들의 연도별 출현 빈도수를 표준화하여 상기 단어들에 대한 표준화된 단어 별 출현 빈도수 증가율을 산출할 수 있다.In addition, the statistical analysis unit may standardize the frequency of appearances of the words per document by dividing the instance frequencies of each year by the number of documents per year to calculate the standardized frequency of occurrence rate of the words with respect to the words .
또한, 상기 통계 분석부는, 상기 단어-단어간 동시발생건수 매트릭스를 이용하여 단어 별 연결 정도 중심성 증가율을 산출하고, 상기 표준화된 단어 별 출현 빈도수 증가율 및 상기 연결 정도 중심성 증가율이 상위 일정 부분 이상인 단어 또는 하위 일정 부분 이하인 단어를 위크시그널로 도출할 수 있다.Also, the statistical analysis unit may calculate the connection degree-of-centration increase rate by using the word-word coincidence count matrix, and may further include a word or a word having the connection degree degree increase rate and the connection degree- The words below the lower part of the schedule can be derived as week signals.
한편, 상기 데이터 수집 모듈은, 이미지, 동영상, 음성, 센서, GPS, GIS, M2M 데이터 중 적어도 어느 하나의 비정형 데이터를 포함하는 빅데이터를 수집할 수 있다.Meanwhile, the data collection module may collect big data including at least one of image, moving picture, voice, sensor, GPS, GIS, and M2M data.
상술한 과제를 해결하기 위한 본 발명의 다른 측면에 따르면, (A) 데이터 수집 모듈이 기 설정된 수집 기준에 따라 네트워크를 통해 빅데이터를 수집하여 저장하는 단계; (B) 형태소 분석 모듈이 상기 빅데이터의 형태소를 분석하여 형태소 별로 구분하고 형태소 분석 데이터를 생성하는 단계; (C) 데이터 분석 모듈이 상기 형태소 분석 데이터를 분산 병렬 처리 기반의 통계분석 알고리즘으로 처리하여 통계값을 산출하는 단계; 및 (D) 상기 데이터 분석 모듈이 상기 통계값에 따라 위크시그널을 출력하는 단계를 포함하는 빅데이터 분석 기반의 위크시그널 도출 방법이 제공된다.According to another aspect of the present invention for solving the above-mentioned problems, there is provided a method of collecting and storing big data through a network according to a predetermined collection criterion, comprising the steps of: (A) (B) analyzing a morpheme of the big data, dividing the morpheme by morphemes, and generating morpheme analysis data; (C) calculating a statistical value by processing the morpheme analysis data with a statistical analysis algorithm based on a distributed parallel processing, by a data analysis module; And (D) the data analysis module outputting a week signal according to the statistical value.
여기서, 상기 (A) 단계는, 수집 관리 모듈이 수집 대상 데이터 소스 모듈, 수집 대상 키워드 및 수집 대상 기간 중 적어도 어느 하나의 수집 기준을 설정하는 단계를 포함할 수 있다.The step (A) may include the step of setting the collection criteria of at least one of the collection target data source module, the collection target keyword, and the collection target period.
또한, 상기 (A) 단계는, 상기 데이터 수집 모듈이, 이미지, 동영상, 음성, 센서, GPS, GIS, M2M 데이터 중 적어도 어느 하나의 비정형 데이터를 포함하는 빅데이터를 수집할 수 있다.In the step (A), the data collection module may collect big data including at least one of at least one of image, moving picture, voice, sensor, GPS, GIS, and M2M data.
그리고, 상기 (C) 단계는, 상기 형태소 분석 데이터로부터 연도별 출현빈도수(instance frequencies), 연도별 단어-단어 간 동시 출연 건수, 연도별 출현빈도수 및 연도별 단어-단어 간 동시 출현 건수로부터 가공된 값들 중 적어도 하나 이상을 산출하는 단계를 포함할 수 있다.
The step (C) may further include extracting, from the morphological analysis data, the number of simultaneous appearances between year-by-year instance frequencies, the number of simultaneous occurrences of word-words by year, the frequency of occurrence by year, And calculating at least one of the values.
본 발명의 빅데이터 분석 기반의 위크시그널 도출 시스템 및 그 방법은, 빅데이터를 대상으로 수집, 저장 및 분석과정을 자동으로 수행하여 위크시그널을 계량적으로 분석할 수 있다.The system and method for deriving the Big Signal based on Big Data analysis of the present invention can quantitatively analyze the Week signal by automatically collecting, storing and analyzing Big Data.
또한, 본 발명의 빅데이터 분석 기반의 위크시그널 도출 시스템 및 그 방법은, 빅데이터로부터 위크시그널을 계량적으로 분석함으로써 미래에 발생 가능한 이상 징후를 발견하여 기술 및 시장에서의 변화를 예측할 수 있다.
In addition, the system and method for deriving a Big Signal based on Big Data Analysis of the present invention can quantify a Great Signal from Big Data and predict a possible change in technology and market by detecting a possible anomaly in the future.
도 1은 본 발명의 실시예에 따른 빅데이터 분석 기반의 위크시그널 도출 시스템의 네트워크 접속 상태도
도 2는 본 발명의 실시예에 따른 빅데이터 분석 기반의 위크시그널 도출 시스템의 제어 블럭도
도 3은 본 발명의 실시예에 따른 빅데이터 분석 기반의 위크시그널 도출 방법의 흐름도
도 4는 본 발명의 실시예에 따른 빅데이터 분석 기반의 위크시그널 도출 시스템을 사용한 단어-단어간 동시 발생건수를 매트릭스 형태로 나타낸 도면
도 5는 본 발명의 실시예에 따른 빅데이터 분석 기반의 위크시그널 도출 시스템을 사용한 단어 별 연결 정도 중심성 증가율을 나타낸 도면
도 6은 본 발명의 실시예에 따른 빅데이터 분석 기반의 위크시그널 도출 시스템의 단어의 출현건수 증가율과 연결 정도 중심성 증가율의 관계를 도시한 도면FIG. 1 is a diagram illustrating a network connection state diagram of a big signal analysis based weak signal analysis system according to an embodiment of the present invention.
2 is a block diagram of a Big Signal analysis system based on Big Data Analysis according to an embodiment of the present invention.
3 is a flowchart of a method of deriving a week signal based on a big data analysis according to an embodiment of the present invention.
FIG. 4 is a diagram showing the number of simultaneous occurrences of word-words using a big signal analysis-based week signal derivation system according to an embodiment of the present invention in a matrix form
FIG. 5 is a graph showing the rate of increase in the degree of center-of-connection of words using the Big Signal analysis-based week signal derivation system according to the embodiment of the present invention
6 is a diagram showing a relationship between a rate of increase in the number of occurrences of a word and a degree of centrality of connection degree of centration in a week signal derivation system based on a big data analysis according to an embodiment of the present invention
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 보다 상세히 설명하기로 한다. 첨부 도면을 참조하여 설명함에 있어 동일하거나 대응하는 구성 요소는 동일한 도면번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the following description with reference to the accompanying drawings, the same or corresponding components will be denoted by the same reference numerals, and redundant description thereof will be omitted.
도 1은 본 발명의 실시예에 따른 빅데이터 분석 기반의 위크시그널 도출 시스템(200)의 네트워크 접속 상태도이다.FIG. 1 is a network connection diagram of a big signal analysis based weak
도 1에 도시된 바와 같이 이용자 단말(10)은 네트워크를 통해 서비스 서버(100)에 접속하여 문서 데이터를 작성하고, 서비스 서버(100)는 이용자 단말(10)이 제공하는 문서 데이터를 저장 및 게시한다. 여기서, 서비스 서버(100)는 SNS, 블로그, 카페, 뉴스 서비스 등, 데이터를 저장 및 게시할 수 있는 다양한 서비스 서버(100)를 적용할 수 있다.1, a
위크시그널 도출 시스템(200)은 각 서비스 서버(100)를 데이터 소스로 활용하여 정형 및 비정형 데이터를 포함하는 빅데이터를 수집하고 수집된 데이터를 분석 및 가공하여 위크시그널을 도출할 수 있다.The weak
여기서, 빅데이터는 기존의 데이터베이스 기술로 처리, 분석할 수 있는 범위를 초과하는 규모의 데이터로서, 금융/유통 분야의 거래정보, 통신/방송 분야의 시청률 및 로그정보, 미디어 분야의 소셜 미디어 데이터, 제조 분야의 센서 및 운영 데이터 등의 다양한 종류의 데이터가 빅데이터에 포함될 수 있다.Here, the Big Data is data of a size exceeding the range that can be processed and analyzed by existing database technology, and can be used for transaction information in the financial / distribution field, viewership and log information in the communication / broadcasting field, Various types of data such as sensors and operational data in the manufacturing field can be included in the big data.
빅데이터를 구분하는 중요한 기준으로는 데이터의 정형성(structuralization)을 들 수 있다. 먼저, 정형(structured) 데이터는 고정된 필드에 지정된 수치 혹은 기호 데이터를 일컫는데 관계형 데이터베이스 및 스프레드시트 등으로 관리하는 일반적인 데이터이다. 두 번째로 반정형(semi-structured) 데이터는 고정된 필드에 지정되어 있지는 않으나, 메타데이터 및 스키마 등에 의해서 관리되는 데이터로 XML 혹은 HTML 텍스트 데이터가 그 예이다. 마지막으로 비정형(unstructured) 데이터는 어떠한 고정된 필드나 스키마가 존재하지 않는 데이터로서 일반 텍스트 문서 및 이미지, 동영상, 음성, GPS, GIS, 센서, M2M 데이터 등을 포함할 수 있다.An important criterion for distinguishing Big Data is structuralization of data. First, structured data refers to numeric or symbol data specified in a fixed field, which is general data managed by relational databases and spreadsheets. Second, semi-structured data is not specified in fixed fields, but XML or HTML text data is data managed by metadata and schema. Lastly, unstructured data may include plain text documents and images, moving images, voice, GPS, GIS, sensors, M2M data, etc., without any fixed fields or schemas.
도 2는 본 발명의 실시예에 따른 빅데이터 분석 기반의 위크시그널 도출 시스템(200)의 제어 블럭도이다.FIG. 2 is a control block diagram of a Big Data analysis based weak
도 2에 도시된 바와 같이, 위크시그널 도출 시스템(200)은, 데이터 소스 모듈(210), 데이터 수집 모듈(220), 수집 관리 모듈(230), 저장 어댑터 모듈(240), 데이터베이스 모듈(250), 형태소 분석 모듈(260), 데이터 분석 모듈(270)을 포함한다.2, the weak
데이터 소스 모듈(210)은 SNS, 블로그, 카페, 뉴스 서비스 등, 데이터를 저장 및 게시할 수 있는 다양한 서비스 서버(100)를 포함한다.The
수집 관리 모듈(230)은 데이터 수집 모듈(220) 측에 데이터 수집 기준을 설정한다. 수집 관리 모듈(230)은 데이터 수집 모듈(220)의 수집 대상 데이터 소스 모듈(210), 수집 대상 키워드 및 수집 대상 기간 등의 수집 기준을 제공한다. The
또한, 수집 관리 모듈(230)은 사용자로부터의 요청에 따라, 데이터 수집 모듈(220)의 동작을 지시할 수 있다. 수집 관리 모듈(230)은 데이터 수집에 필요한 대상 모듈, 키워드, 기간 등 여러 가지 기준들을 설정할 수 있고 데이터 수집 모듈(220)에 실행 시기 및 방법을 지시할 수 있다. 데이터 수집 모듈(220)에 의하여 병렬 수집된 데이터들을 저장 어댑터 모듈(240)을 통해서 데이터베이스 모듈(250)의 특정 영역에 저장되도록 지시할 수 있다.In addition, the
데이터 수집 모듈(220)은 수집 관리 모듈(230)에서 제공한 수집 기준에 따라 데이터 소스 모듈(210)로부터 데이터를 수집하여 데이터베이스 모듈(250)의 특정 영역에 저장한다. The
데이터 수집 모듈(220)은 SNS, 뉴스, 카페, 블로그 등의 각 데이터 소스 모듈(210)의 구조에 따라 정해진 영역의 데이터를 수집할 수 있다. 데이터 수집 모듈(220)은 수집 관리 모듈(230)로부터 수신된 수집 기준에 부합되는 데이터 소스 모듈(210)의 각종 뉴스, 트윗, 블로그 및 카페 등의 게시 데이터를 기간별, 미디어별, 키워드별 세분화 분산 수집하는 것이 가능하다. 데이터 수집 모듈(220)을 통해 수집된 데이터는 일반 텍스트 문서 및 이미지, 동영상, 음성, GPS, GIS, 센서, M2M 데이터 등과 같은 비정형(unstructured) 데이터를 포함할 수 있다.The
이러한, 데이터 수집 모듈(220)은 다수의 시스템과 연계하여 병렬 처리방식(parallel processing) 방식으로 데이터를 수집할 수 있으며, 기존의 수집된 데이터를 변환 수집하거나 수집기(crawler)를 이용하여 온라인상의 데이터를 수집할 수 있다. 데이터 소스 모듈(210)은 데이터 소스 모듈(210)로부터 수집된, 소셜 미디어 데이터, 온라인 뉴스, 포털 사이트 카페 및 블로그 게시글 등의 데이터를 저장 어댑터 모듈(240)을 통해 데이터베이스 모듈(250)에 전송한다.저장 어댑터 모듈(240)은 데이터베이스 모듈(250)에 대한 접속 기능을 이용하여 데이터 수집 모듈(220)로부터 수신한 데이터를 데이터베이스 모듈(250)로 전송한다.The
데이터베이스 모듈(250)에는 데이터 수집 모듈(220)에서 수집된 데이터가 저장된다. 데이터베이스 모듈(250)은 처리 성능을 확보하기 위해 다수의 서버에서 운영될 수 있는 분산 병렬처리 환경으로 구성되어 있으며 저장 어댑터 모듈(240)로부터 수신한 데이터를 각 데이터베이스로 분산하여 저장할 수 있다.In the
형태소 분석 모듈(260)은 데이터베이스 모듈(250)에 저장된 원본 데이터를 형태소 분석 프로그램을 이용하여 형태소 별로 구분하여 형태소 분석 데이터를 생성한 후, 생성된 형태소 분석 데이터를 다시 데이터베이스 모듈(250)에 전송 및 저장한다. 데이터베이스 모듈(250)에 저장된 원본 데이터는, 소셜 미디어 데이터, 온라인 뉴스, 포털 사이트 카페 및 블로그 게시글 등을 포함할 수 있다. The
데이터 분석 모듈(270)은 통계 분석부(272), 데이터 처리부(274) 및 분산 파일 시스템(276)을 포함한다. The
분산 파일 시스템(276)은 데이터베이스 모듈(250)에 저장되어 있는 형태소 분석 데이터를 읽어 들여 대용량 데이터 처리가 가능한 분산 파일 시스템(276)에 저장한다. The
데이터 처리부(274)은 분산 파일 시스템(276)에 존재하는 형태소 분석 데이터를 SQL(structured query language)을 기반으로 처리할 수 있도록 가상화 데이터베이스 인터페이스를 제공한다. SQL은 데이터베이스에서 데이터를 조작하거나 접근할 수 있게 하는 일반적인 언어이다.The
통계 분석부(272)는 데이터 처리부(274)이 제공하는 가상화 데이터베이스 인터페이스를 통해, 분산 파일 시스템(276)에 저장되어 있는 형태소 분석 데이터에 대한 분산 병렬 처리 기반의 여러 가지 통계분석 알고리즘을 구현하고 실행한다. 여기서, 적용되는 통계 분석 알고리즘은 기술 및 시장 예측을 위한 모형에 활용되는 지표를 산출하기 위한 것으로서, 기술 및 시장 예측 모형은 기존의 Fisher-Pry 모형, Bass 모형, TAM(technology acceptance model) 등의 모형을 적용할 수 있으며, 상황에 따라 개량, 보완 또는 개발된 모형을 사용하여 연계할 수 있다.The
통계 분석부(272)는 형태소 분석 데이터로부터 연도별 출현빈도수(instance frequencies), 연도별 단어-단어 간 동시 출연 건수, 연도별 출현빈도수 및 연도별 단어-단어 간 동시 출현 건수로부터 가공된 값들 중 적어도 하나 이상을 변수로 지표화하여 사용할 수 있다.The
통계 분석부(272)는 추출된 단어에 대한 연도별 출현빈도수(instance frequencies)로부터 단어 별 출현 빈도수의 증가율을 분석할 수 있다. 또한, 통계 분석부(272)는 연도별 출현빈도수(instance frequencies)를 연도별 해당 문서 수로 나누어 문서당 해당 단어들의 연도별 출현 빈도수를 표준화하여 해당 단어들에 대한 표준화된 단어 별 출현 빈도수 증가율을 분석할 수 있다. 이러한 단어 별 출현건수의 증가율을 측정함으로써 평균 출현건수의 증가율에서 벗어나는 변화를 감지할 수 있다.The
또한, 통계 분석부(272)는 단어-단어 간 동시 출현 건수 매트릭스를 이용하여 단어 별 연결 정도 중심성 증가율을 분석할 수 있다. In addition, the
도 4는 단어-단어 간 동시 발생건수를 매트릭스 형태로 나타낸 도면이고, 도 5는 단어 별 연결 정도 중심성 증가율을 나타낸 도면이다.FIG. 4 is a diagram showing the number of simultaneous occurrences of word-words in a matrix form, and FIG.
도 4 및 도 5에 도시한 바와 같이, 단어-단어 간의 관계를 시계열로 분석함으로써 시간에 따라 어떠한 단어가 다른 단어와의 관계가 많아지는지 알 수 있고, 이것이 평균값에 비해 차이가 많이 날 경우 변화의 징후로 판단할 수 있다.As shown in FIG. 4 and FIG. 5, by analyzing the relationship between words and words in time series, it is possible to know which words are related to other words over time. If the difference is larger than the average value, It can be judged as a symptom.
단어 별 연결 정도 중심성 증가율을 평가하기 위하여, 단어 간의 사회연결망(SNA) 분석을 수행하여 중심성 지수의 변화를 측정할 수 있다.In order to evaluate the rate of increase of the degree of centrality of words, we can measure the change of centrality index by performing SNA analysis between words.
사회연결망 분석을 이용하면, 노드(node)는 측정대상 '단어'에 해당되고, 사건(event)은 각각의 기사로 볼 수 있으며, 연결(link)은 기사를 구성하고 있는 단어들과 사건의 관계로 볼 수 있다. 즉, 사회연결망 분석방법에서, 어떤 노드(단어)와 다른 노드(단어)와의 관계는 두 단어가 같은 기사에 동시에 존재하면 관계가 있고 연결되었다고 판단되는 것이다.Using social network analysis, a node corresponds to a measurement target word, an event can be viewed as an individual article, a link is a relationship between words constituting an article and an event Can be seen as. In other words, in a social network analysis method, a relationship between a certain node (word) and another node (word) is considered to be related if two words exist in the same article at the same time.
중심성(centrality) 분석은 특정한 노드가 네트워크에서 얼마나 중심에 위치하는지에 대한 정도를 측정하는 방법이다. 특히, 연결 정도 중심성(degree centrality) 분석이란 특정 노드에 연결된 연결선을 측정하여 네트워크에서 얼마나 중심에 위치하는지를 측정하는 것으로 내향중심성(in-degree centrality)과 외향중심성(out-degreecentrality)으로 측정한다. 네트워크의 노드들이 특정 노드와 연결되는 빈도가 높을수록 중심성이 높다는 개념이다.The centrality analysis is a measure of the degree to which a particular node is centrally located in the network. In particular, degree centrality analysis measures in-degree centrality and out-of-degreentality by measuring how closely the network is located in a network by measuring the connection lines connected to a particular node. The higher the frequency with which nodes in a network are connected to a particular node, the more centralized it is.
통계 분석부(272)는 표준화된 단어 별 출현 빈도수 증가율 및 연결 정도 중심성 증가율이 상위 일정 부분 이상인 단어 또는 하위 일정 부분 이하인 단어를 위크시그널로 판단할 수 있다. The
도 6은 본 발명의 실시예에 따른 빅데이터 분석 기반의 위크시그널 도출 시스템(200)의 단어의 출현건수 증가율과 연결 정도 중심성 증가율의 관계를 도시한 도면이다.FIG. 6 is a diagram illustrating a relationship between a rate of increase in the number of occurrences of a word and a degree of centrality of connection degree in a week
도 6에 도시한 바와 같이, 중심에 분포한 단어군은 거시적인 동향을 나타내며, 중심에서 벗어난 정도가 높은 단어군은 변화의 징후를 나타내는 위크시그널을 의미한다. 따라서, 통계 분석부(272)는 출현건수 증가율 및 연결 정도 중심성 증가율이 상위 일정 부분 이상인 단어 또는 하위 일정 부분 이하인 단어를 위크시그널로 판단할 수 있다. 즉, 통계 분석부(272)는 추출된 단어들의 연도별 출현 빈도수 및 연도별 출현 빈도수로부터 가공된 값들 중 적어도 하나 이상을 변수로 하는 분석방법으로 계량 분석하여, 특정 단어들이 기 설정된 판단 조건에 해당하면 위크시그널로 판단할 수 있다.As shown in FIG. 6, a group of words distributed at the center indicates macroscopic trends, and a group of words having a higher degree of deviation from the center indicates week signals indicating signs of change. Accordingly, the
도 3은 본 발명의 실시예에 따른 빅데이터 분석 기반의 위크시그널 도출 방법의 흐름도이다.3 is a flowchart of a method of deriving a week signal based on a big data analysis according to an embodiment of the present invention.
데이터 수집 모듈(220)은 기 설정된 기준에 따라 네트워크 상의 데이터를 수집하여 데이터베이스 모듈(250)에 저장한다(S110). 데이터 수집 모듈(220)은 수집 관리 모듈(230)에서 제공한 수집 기준에 따라 뉴스, 트윗, 블로그 및 카페 등의 게시 데이터를 기간별, 미디어별, 키워드 별로 세분화하여 분산 수집하는 것이 가능하다.The
형태소 분석 모듈(260)은 수집된 데이터의 형태소 데이터를 분석하여 형태소 분석 데이터를 데이터베이스 모듈(250)에 저장한다(S112). 형태소 분석 모듈(260)은 데이터베이스 모듈(250)에 저장된 소셜 미디어 데이터, 온라인 뉴스, 포털 사이트 카페 및 블로그 게시글 등의 데이터를 형태소 분석 프로그램을 이용하여 형태소 별로 구분하며 그 결과를 다시 데이터베이스 모듈(250)에 저장한다.The
형태소 분석 데이터를 대용량 데이터 처리가 가능한 분산 파일 시스템(276)에 저장한다(S114). 데이터 분석 모듈(270)은 데이터베이스 모듈(250)에 저장된 형태소 분석 결과를 분산 파일 시스템(276)으로 읽어 들여 저장한다.The morpheme analysis data is stored in the distributed
분산 파일 시스템(276)에 저장된 형태소 분석 데이터를 통계 분석부(272)에서 통계적인 방법으로 분석한다(S116). 데이터 분석 모듈(270)의 통계 분석부(272)는 형태소 분석 데이터로부터 연도별 출현빈도수(instance frequencies), 연도별 단어-단어 간 동시 출연 건수, 연도별 출현빈도수 및 연도별 단어-단어 간 동시 출현 건수로부터 가공된 값들 중 적어도 하나 이상을 변수로 지표화하여 사용할 수 있다. 또한, 통계 분석부(272)는 추출된 단어에 대한 연도별 출현빈도수(instance frequencies)로부터 단어 별 출현 빈도수의 증가율을 분석할 수 있다. The morphometric analysis data stored in the distributed
또한, 통계 분석부(272)는 연도별 출현빈도수(instance frequencies)를 연도별 해당 문서 수로 나누어 문서당 해당 단어들의 연도별 출현 빈도수를 표준화하여 해당 단어들에 대한 표준화된 단어 별 출현 빈도수 증가율을 분석할 수 있다. 이러한 단어 별 출현건수의 증가율을 측정함으로써 평균 출현건수의 증가율에서 벗어나는 변화를 감지할 수 있다. 또한, 통계 분석부(272)는 단어-단어 간 동시 출현 건수 매트릭스를 이용하여 단어 별 연결 정도 중심성 증가율을 분석할 수 있다. In addition, the
통계 분석부(272)는 분석결과에 따라 위크시그널을 도출한다(S118). 통계 분석부(272)는 표준화된 단어 별 출현 빈도수 증가율 및 연결 정도 중심성 증가율이 상위 일정 부분 이상인 단어 또는 하위 일정 부분 이하인 단어를 위크시그널로 판단할 수 있다. The
이와 같이, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
Thus, those skilled in the art will appreciate that the present invention may be embodied in other specific forms without departing from the spirit or essential characteristics thereof. It is therefore to be understood that the embodiments described above are to be considered in all respects only as illustrative and not restrictive. The scope of the present invention is defined by the appended claims rather than the detailed description and all changes or modifications derived from the meaning and scope of the claims and their equivalents are to be construed as being included within the scope of the present invention do.
본 발명은 정형 데이터는 물론 비정형 데이터까지 포함하는 빅데이터를 대상으로 수집, 저장 및 분석과정을 자동으로 수행하여 위크시그널을 계량적으로 분석할 수 있는 빅데이터 분석 기반의 위크시그널 도출 시스템 및 그 방법을 제공하는 데에 이용될 수 있다.
The present invention relates to a system and method for deriving a week signal based on a big data analysis capable of quantitatively analyzing a week signal by automatically collecting, storing and analyzing large data including not only regular data but also atypical data Lt; / RTI >
10 : 이용자 단말
100 : 서비스 서버
200 : 위크시그널 도출 시스템
210 : 데이터 소스 모듈
220 : 데이터 수집 모듈
230 : 수집 관리 모듈
240 : 저장 어댑터 모듈
250 : 데이터베이스 모듈
260 : 형태소 분석 모듈
270 : 데이터 분석 모듈
272 : 통계 데이터 분석부
274 : 데이터 처리부
276 : 분산 파일 시스템10: User terminal 100: Service server
200: Week signal derivation system 210: Data source module
220: data collection module 230: collection management module
240: storage adapter module 250: database module
260: Morphological analysis module 270: Data analysis module
272: statistical data analysis unit 274: data processing unit
276: Distributed File System
Claims (10)
상기 수집 관리 모듈로부터 설정 받은 데이터 수집 기준에 따라 해당 데이터 소스 모듈로부터 빅데이터를 수집하여 데이터베이스 모듈에 저장하는 데이터 수집 모듈;
상기 데이터베이스 모듈에 저장된 빅데이터의 형태소를 분석하여 형태소 별로 구분하고 형태소 분석 데이터를 생성하는 형태소 분석 모듈; 및
상기 형태소 분석 데이터를 분산 병렬 처리 기반의 통계분석 알고리즘으로 처리하여 통계값을 산출하고 상기 통계값에 따라 위크시그널을 출력하는 데이터 분석 모듈을 포함하는 빅데이터 분석 기반의 위크시그널 도출 시스템.
A collection management module that sets collection criteria of at least one of a collection target data source module, a collection target keyword, and a collection target period;
A data collection module for collecting big data from the data source module according to the data collection criteria set by the collection management module and storing the collected big data in the database module;
A morpheme analysis module for analyzing morphemes of big data stored in the database module and dividing them by morphemes and generating morpheme analysis data; And
And a data analysis module that processes the morpheme analysis data using a statistical analysis algorithm based on a distributed parallel processing to calculate a statistical value and outputs a weak signal according to the statistical value.
상기 데이터 분석 모듈은,
상기 형태소 분석 데이터를 저장하는 분산 파일 시스템;
상기 분산 파일 시스템에 존재하는 형태소 분석 데이터를 SQL(structured query language)을 기반으로 처리할 수 있도록 가상화 데이터베이스 인터페이스를 제공하는 데이터 처리부; 및
상기 데이터 처리부가 제공하는 가상화 데이터베이스 인터페이스를 통해 통계분석 알고리즘을 실행하여, 상기 형태소 분석 데이터로부터 연도별 출현빈도수(instance frequencies), 연도별 단어-단어 간 동시 출연 건수, 연도별 출현빈도수 및 연도별 단어-단어 간 동시 출현 건수로부터 가공된 값들 중 적어도 하나 이상을 산출하는 통계 분석부를 포함하는 것을 특징으로 하는 빅데이터 분석 기반의 위크시그널 도출 시스템.
The method according to claim 1,
The data analysis module comprising:
A distributed file system for storing the morpheme analysis data;
A data processing unit for providing a virtualization database interface to process morpheme analysis data existing in the distributed file system based on a structured query language (SQL); And
A statistical analysis algorithm is executed through a virtualization database interface provided by the data processing unit, and statistical analysis algorithms are executed to calculate statistical analysis frequencies based on the instance frequencies for each year, the number of simultaneous appearances between words and words per year, - a statistical analysis unit for calculating at least one of the processed values from the number of simultaneous occurrences between words.
상기 통계 분석부는,
상기 통계 분석부는 상기 연도별 출현건수(instance frequencies) 및 단어-단어간 동시 발생건수에 기초하여 단어 별 발생건수 증가율을 산출하는 것을 특징으로 하는 빅데이터 분석 기반의 위크시그널 도출 시스템.
3. The method of claim 2,
Wherein the statistical analysis unit comprises:
Wherein the statistical analysis unit calculates the number of occurrences per word based on the number of instances frequencies and the number of simultaneous occurrences between words and words by year.
상기 통계 분석부는,
상기 연도별 출현건수(instance frequencies)를 연도별 문서수로 나누어 문서당 상기 단어들의 연도별 출현 빈도수를 표준화하여 상기 단어들에 대한 표준화된 단어 별 출현 빈도수 증가율을 산출하는 것을 특징으로 하는 빅데이터 분석 기반의 위크시그널 도출 시스템.
The method of claim 3,
Wherein the statistical analysis unit comprises:
Wherein the number of occurrence frequencies for each word is standardized by dividing the instance frequencies by the number of documents per year to standardize the appearance frequency of the words per document to calculate the standardized word- Based weak signal derivation system.
상기 통계 분석부는,
상기 단어-단어간 동시발생건수 매트릭스를 이용하여 단어 별 연결 정도 중심성 증가율을 산출하고, 상기 표준화된 단어 별 출현 빈도수 증가율 및 상기 연결 정도 중심성 증가율이 상위 일정 부분 이상인 단어 또는 하위 일정 부분 이하인 단어를 위크시그널로 도출하는 것을 특징으로 하는 빅데이터 분석 기반의 위크시그널 도출 시스템.
In the fourth aspect,
Wherein the statistical analysis unit comprises:
Wherein the connection degree centricity increase rate for each word is calculated using the word-word coincidence count matrix, and the words having the connection degree centricity increase rate and the word having the connection degree centricity increase rate equal to or higher than a certain upper part, Wherein the system is derived from a big data analysis based on a week signal.
상기 데이터 수집 모듈은,
이미지, 동영상, 음성, 센서, GPS, GIS, M2M 데이터 중 적어도 어느 하나의 비정형 데이터를 포함하는 빅데이터를 수집하는 것을 특징으로 하는 빅데이터 분석 기반의 위크시그널 도출 시스템.
The method according to claim 1,
Wherein the data collection module comprises:
And collects big data including at least one of at least one of image, moving picture, voice, sensor, GPS, GIS, and M2M data.
(B) 형태소 분석 모듈이 상기 빅데이터의 형태소를 분석하여 형태소 별로 구분하고 형태소 분석 데이터를 생성하는 단계;
(C) 데이터 분석 모듈이 상기 형태소 분석 데이터를 분산 병렬 처리 기반의 통계분석 알고리즘으로 처리하여 통계값을 산출하는 단계; 및
(D) 상기 데이터 분석 모듈이 상기 통계값에 따라 위크시그널을 출력하는 단계를 포함하는 빅데이터 분석 기반의 위크시그널 도출 방법.
(A) collecting and storing big data through a network according to a predetermined collection criterion;
(B) analyzing a morpheme of the big data, dividing the morpheme by morphemes, and generating morpheme analysis data;
(C) calculating a statistical value by processing the morpheme analysis data with a statistical analysis algorithm based on a distributed parallel processing, by a data analysis module; And
(D) the data analysis module outputting a week signal according to the statistical value.
상기 (A) 단계는,
수집 관리 모듈이 수집 대상 데이터 소스 모듈, 수집 대상 키워드 및 수집 대상 기간 중 적어도 어느 하나의 수집 기준을 설정하는 단계를 포함하는 것을 특징으로 하는 빅데이터 분석 기반의 위크시그널 도출 방법.
8. The method of claim 7,
The step (A)
Wherein the collection management module includes a step of setting collection criteria of at least one of a collection target data source module, a collection target keyword, and a collection target period.
상기 (A) 단계는,
상기 데이터 수집 모듈이, 이미지, 동영상, 음성, 센서, GPS, GIS, M2M 데이터 중 적어도 어느 하나의 비정형 데이터를 포함하는 빅데이터를 수집하는 것을 특징으로 하는 빅데이터 분석 기반의 위크시그널 도출 방법.
8. The method of claim 7,
The step (A)
Wherein the data collection module collects big data including at least one of at least one of image, moving picture, voice, sensor, GPS, GIS, and M2M data.
상기 (C) 단계는,
상기 형태소 분석 데이터로부터 연도별 출현빈도수(instance frequencies), 연도별 단어-단어 간 동시 출연 건수, 연도별 출현빈도수 및 연도별 단어-단어 간 동시 출현 건수로부터 가공된 값들 중 적어도 하나 이상을 산출하는 단계를 포함하는 것을 특징으로 하는 빅데이터 분석 기반의 위크시그널 도출 방법.8. The method of claim 7,
The step (C)
Calculating at least one or more of the processed values from the number of simultaneous occurrences among the number of simultaneous appearances between year-by-year word-word occurrences, word-by-word occurrences, year-by-year occurrence frequency, And generating a Big Signal based on Big Data Analysis.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020130140531A KR101611166B1 (en) | 2013-11-19 | 2013-11-19 | System and Method for Deducting about Weak Signal Using Big Data Analysis |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020130140531A KR101611166B1 (en) | 2013-11-19 | 2013-11-19 | System and Method for Deducting about Weak Signal Using Big Data Analysis |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150057322A true KR20150057322A (en) | 2015-05-28 |
KR101611166B1 KR101611166B1 (en) | 2016-04-11 |
Family
ID=53392210
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020130140531A KR101611166B1 (en) | 2013-11-19 | 2013-11-19 | System and Method for Deducting about Weak Signal Using Big Data Analysis |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101611166B1 (en) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017146348A1 (en) * | 2016-02-24 | 2017-08-31 | 주식회사 케이앤컴퍼니 | Location-based big data system |
CN110032672A (en) * | 2019-04-03 | 2019-07-19 | 湖南科技学院 | A kind of computer data analysis and management system based on big data |
KR102112846B1 (en) * | 2019-12-17 | 2020-05-19 | 서울특별시 서초구 | Seocho Smart-Senior Kiosk Education System |
KR102182722B1 (en) * | 2020-01-21 | 2020-11-24 | 주식회사 병원어디가 | Hospital personnel matching system and 4 hour dispatch agency service |
CN112069036A (en) * | 2020-11-10 | 2020-12-11 | 南京信易达计算技术有限公司 | Management and monitoring system based on cluster computing |
KR102333492B1 (en) * | 2021-07-16 | 2021-12-01 | 주식회사 엔터즈컴퍼니 | Media-based chatbot service provision system |
KR102334255B1 (en) * | 2021-08-31 | 2021-12-02 | (주)네오플로우 | Text data collection platform construction and integrated management method for AI-based voice service |
KR102334236B1 (en) * | 2021-08-31 | 2021-12-02 | (주)네오플로우 | Method and application of meaningful keyword extraction from speech-converted text data |
KR102344075B1 (en) * | 2021-07-08 | 2021-12-29 | 이인익 | Data mining-based online marketing platform |
KR102355787B1 (en) * | 2021-07-26 | 2022-02-08 | 해봄테크 주식회사 | Methods to gather screen requirements and to manage processes for the software development including web based services and mobile services |
KR102355791B1 (en) * | 2021-07-26 | 2022-02-08 | 해봄테크 주식회사 | Tools to define requirements specification for the screen developing a software, web based service and mobile platform service |
KR102375955B1 (en) * | 2021-11-24 | 2022-03-18 | 케이디시스 주식회사 | Data backup system with improved security |
CN117874700A (en) * | 2024-01-19 | 2024-04-12 | 中国民航科学技术研究院 | Flight operation data processing and evaluating system and method and electronic equipment |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102382741B1 (en) * | 2021-09-16 | 2022-04-11 | 김윤환 | System for unmanned management of a golf driving range |
KR102496970B1 (en) * | 2021-11-24 | 2023-02-07 | 주식회사 멍이마켓 | Automated dispatch system for companion animals based on artificial intelligence |
KR102375962B1 (en) * | 2021-11-24 | 2022-03-18 | 박경진 | User-centered learning space matching integrated management system |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101418744B1 (en) | 2013-06-24 | 2014-07-11 | 한국과학기술정보연구원 | System and method for searching weak signal |
-
2013
- 2013-11-19 KR KR1020130140531A patent/KR101611166B1/en active IP Right Grant
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017146348A1 (en) * | 2016-02-24 | 2017-08-31 | 주식회사 케이앤컴퍼니 | Location-based big data system |
CN110032672A (en) * | 2019-04-03 | 2019-07-19 | 湖南科技学院 | A kind of computer data analysis and management system based on big data |
KR102112846B1 (en) * | 2019-12-17 | 2020-05-19 | 서울특별시 서초구 | Seocho Smart-Senior Kiosk Education System |
KR102182722B1 (en) * | 2020-01-21 | 2020-11-24 | 주식회사 병원어디가 | Hospital personnel matching system and 4 hour dispatch agency service |
CN112069036A (en) * | 2020-11-10 | 2020-12-11 | 南京信易达计算技术有限公司 | Management and monitoring system based on cluster computing |
CN112069036B (en) * | 2020-11-10 | 2021-09-03 | 南京信易达计算技术有限公司 | Management and monitoring system based on cluster computing |
KR102406453B1 (en) * | 2021-07-08 | 2022-06-07 | 이인익 | Online marketing platform using big data morpheme analysis techniques. |
KR102406442B1 (en) * | 2021-07-08 | 2022-06-07 | 이인익 | Online marketing platform for data analysis and promotion contents production through AI. |
KR102344075B1 (en) * | 2021-07-08 | 2021-12-29 | 이인익 | Data mining-based online marketing platform |
KR102333492B1 (en) * | 2021-07-16 | 2021-12-01 | 주식회사 엔터즈컴퍼니 | Media-based chatbot service provision system |
KR102355787B1 (en) * | 2021-07-26 | 2022-02-08 | 해봄테크 주식회사 | Methods to gather screen requirements and to manage processes for the software development including web based services and mobile services |
KR102355791B1 (en) * | 2021-07-26 | 2022-02-08 | 해봄테크 주식회사 | Tools to define requirements specification for the screen developing a software, web based service and mobile platform service |
KR102334236B1 (en) * | 2021-08-31 | 2021-12-02 | (주)네오플로우 | Method and application of meaningful keyword extraction from speech-converted text data |
KR102334255B1 (en) * | 2021-08-31 | 2021-12-02 | (주)네오플로우 | Text data collection platform construction and integrated management method for AI-based voice service |
KR102395097B1 (en) * | 2021-11-24 | 2022-05-09 | 케이디시스 주식회사 | Data backup system |
KR102375955B1 (en) * | 2021-11-24 | 2022-03-18 | 케이디시스 주식회사 | Data backup system with improved security |
WO2023096027A1 (en) * | 2021-11-24 | 2023-06-01 | 케이디시스 주식회사 | Data backup system having enhanced security |
CN117874700A (en) * | 2024-01-19 | 2024-04-12 | 中国民航科学技术研究院 | Flight operation data processing and evaluating system and method and electronic equipment |
Also Published As
Publication number | Publication date |
---|---|
KR101611166B1 (en) | 2016-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101611166B1 (en) | System and Method for Deducting about Weak Signal Using Big Data Analysis | |
Culotta | Towards detecting influenza epidemics by analyzing Twitter messages | |
CN109388637B (en) | Data warehouse information processing method, device, system and medium | |
Zahedi et al. | How well developed are altmetrics? A cross-disciplinary analysis of the presence of ‘alternative metrics’ in scientific publications | |
US8442863B2 (en) | Real-time-ready behavioral targeting in a large-scale advertisement system | |
JP5715261B2 (en) | Time-series data management system and method | |
Lécué et al. | Predicting severity of road traffic congestion using semantic web technologies | |
RU2716029C1 (en) | System for monitoring quality and processes based on machine learning | |
CN106815125A (en) | A kind of log audit method and platform | |
CN104899324B (en) | One kind monitoring systematic sample training system based on IDC harmful informations | |
US20190073406A1 (en) | Processing of computer log messages for visualization and retrieval | |
CN109815382B (en) | Method and system for sensing and acquiring large-scale network data | |
CN104756106A (en) | Characterizing data sources in a data storage system | |
CN107862022A (en) | Cultural resource commending system | |
KR20180072167A (en) | System for extracting similar patents and method thereof | |
CN117971606B (en) | Log management system and method based on elastic search | |
US20200394318A1 (en) | Privacy trustworthiness based api access | |
Tong et al. | Tracking frequent items over distributed probabilistic data | |
US11295555B2 (en) | Systems and methods for analyzing machine performance | |
Afyouni et al. | Deep-Eware: spatio-temporal social event detection using a hybrid learning model | |
CN113742118B (en) | Method and system for detecting anomalies in data pipes | |
CN109819019B (en) | Monitoring and statistical analysis method and system for large-scale network data acquisition | |
Dutta et al. | Big data architecture for environmental analytics | |
Bailis et al. | Macrobase: Analytic monitoring for the internet of things | |
CN114518988B (en) | Resource capacity system, control method thereof, and computer-readable storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |