KR102168198B1 - 기업 부도 예측 시스템 및 이의 동작 방법 - Google Patents
기업 부도 예측 시스템 및 이의 동작 방법 Download PDFInfo
- Publication number
- KR102168198B1 KR102168198B1 KR1020180159763A KR20180159763A KR102168198B1 KR 102168198 B1 KR102168198 B1 KR 102168198B1 KR 1020180159763 A KR1020180159763 A KR 1020180159763A KR 20180159763 A KR20180159763 A KR 20180159763A KR 102168198 B1 KR102168198 B1 KR 102168198B1
- Authority
- KR
- South Korea
- Prior art keywords
- articles
- company
- analysis target
- risk
- default
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Software Systems (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
기업 부도 예측 시스템 및 이의 동작 방법이 도시된다. 본 발명의 다양한 실시예에 따른 기업의 부도 위험성을 예측 방법은, 인터넷 상에서 복수의 뉴스 기사들을 수집하는 단계; 분석 대상이 되는 기업을 선택하는 단계; 수집된 복수의 뉴스 기사들 중 분석 대상 기업과 관련된 뉴스 기사들을 분석 대상 기사들로 분류하는 단계; 상기 분석 대상 기사들 각각에 대한 위험 레벨을 산출하는 단계; 산출된 위험 레벨을 기준으로 상기 분석 대상 기사들의 그룹화를 수행하여 각 그룹을 나타내는 특성 벡터들을 생성하는 단계; 및 생성된 특성 벡터들을 토대로 상기 분석 대상 기업의 부도 위험성을 계산하는 단계를 포함할 수 있다.
Description
본 발명의 다양한 실시예는 기업 부도 예측 시스템 및 이의 동작 방법에 관한 것으로 뉴스 데이터 분석을 기반으로 기업의 부도 위험을 평가하는 시스템에 관한 것이다.
현대사회에서 가장 규모가 크고 중요도가 높은 경제 주체는 기업이다. 한 해에도 수많은 기업들이 생성되고 소멸되며 경제적으로 많은 영향을 연관된 개인들, 기업들, 나아가 국가에 미치게 된다. 따라서, 기업들의 흥망성쇠를 분석하는 것은 해당 기업이 속하는 산업군뿐 아니라, 전체 산업군의 분석에 있어서도 기초가 된다. 기업이 소멸하는 원인은 다양하게 존재하나, 그 중 부도(Default)를 통해 기업이 소멸하는 경우 해당 기업의 임직원들은 물론, 해당 기업의 투자자나 거래 기업 또한 막대한 영향을 받게 된다.
이에 따라, 각 기업에 대한 부도가능성 예측에 대한 연구가 꾸준히 이루어져 왔다. 일반적으로 기업의 부도가능성은 기업의 영업이익을 통해 이자비용을 얼마나 감당할 수 있는지를 보여주는 지표인 이자보상배율, 부채비율 등을 통해 예측되었다. 이와 같이, 기업의 부도가능성 분석 예측에 있어 정량적으로 획득될 수 있는 재무적인 데이터들이 주로 이용되어 왔으나, 최근 들어서는 비재무적인 데이터를 토대로 기업의 리스크를 분석하는 방법론이 부각되고 있다.
기업들이 공개하는 재무적 데이터에는 해당 기업에게 불리한 내용이 반영되지 않을 가능성이 있으며, 기업이 제공하는 재무 관련 보고서에 대한 신뢰성 또한 의심되는 경우도 존재하였다. 따라서, 비재무적인 데이터를 분석하는 방법론들이 다양하게 대두되고 있는 실정이며, 비재무적인 데이터 중 분석이 충분히 될만큼의 양을 가지고 있는 뉴스 기사 데이터가 주로 이용되기 시작하였다.
뉴스 기사 데이터는 그 양이 분석의 대상이 될만큼 많지만, 뉴스 기사가 어떠한 기업에 관한 기사인지를 분별하고 해당 뉴스 기사를 부도 위험과 어떠한 방식으로 연관시켜 분석할 것인지 결정함에 있어 많은 어려움이 존재하였다.
본 발명의 다양한 실시예는 복수의 뉴스 기사들을 토대로 특정 기업의 부도 위험성을 예측하는 방법을 제공하는 것을 그 목적으로 한다.
본 발명의 다양한 실시예는 다양한 머신러닝 알고리즘 및 분석 방법을 통해 부도 위험성 예측의 정확도를 향상시키는 것을 그 목적으로 한다.
본 발명이 해결하고자 하는 과제들은 이상에서 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
상술한 과제를 해결하기 위한 본 발명의 다양한 실시예에 따른 기업의 부도 위험성 예측 방법은, 인터넷 상에서 복수의 뉴스 기사들을 수집하는 단계; 분석 대상이 되는 기업을 선택하는 단계; 수집된 복수의 뉴스 기사들 중 분석 대상 기업과 관련된 뉴스 기사들을 분석 대상 기사들로 분류하는 단계; 상기 분석 대상 기사들 각각에 대한 위험 레벨을 산출하는 단계; 산출된 위험 레벨을 기준으로 상기 분석 대상 기사들의 그룹화를 수행하여 각 그룹을 나타내는 특성 벡터들을 생성하는 단계; 및 생성된 특성 벡터들을 토대로 상기 분석 대상 기업의 부도 위험성을 계산하는 단계를 포함할 수 있다.
상기 분석 대상 기사들 각각에 대한 위험 레벨을 산출하는 단계는, 특정 머신 러닝 알고리즘을 채택하고 채택한 머신 러닝 알고리즘을 이용하여 수집된 뉴스 기사들에 대해 회귀 또는 항목화 분석을 수행한 뒤, 상기 회귀 또는 항목화 분석을 통해 도출된 위험 산출 알고리즘을 이용하여 상기 분석 대상 기사들 각각에 대한 위험 레벨을 산출하는 것일 수 있다.
기업의 부도 위험성 예측 방법은, 수집된 뉴스 기사들에 대해 회귀 또는 항목화 분석을 수행함에 있어, 부도가 발생한 기업과 관련된 뉴스 기사들 중 해당 기업의 부도로부터 일정 시간 이내에 발행된 뉴스 기사들만을 분석 대상으로 선택하는 단계를 더 포함할 수 있다.
수집된 복수의 뉴스 기사들 중 분석 대상 기업과 관련된 뉴스 기사들을 분석 대상 기사들로 분류하는 단계는, 상기 분석 대상 기업의 명칭이 포함된 뉴스 기사들을 선별하는 단계; 및 선별된 뉴스 기사들 각각에 대해 상기 분석 대상 기업과 관련 있는 기사인지 판단하는 단계를 더 포함할 수 있다.
선별된 뉴스 기사들 각각에 대해 상기 분석 대상 기업과 관련 있는 기사인지 판단하는 단계는, 선별된 뉴스 기사들 각각에 대한 문맥 또는 주제를 식별하고, 식별된 문맥 또는 주제가 상기 분석 대상 기업 정보와 연관이 있는지 여부를 판단하는 단계를 더 포함할 수 있다.
산출된 위험 레벨을 기준으로 상기 분석 대상 기사들의 그룹화를 수행하여 각 그룹을 나타내는 특성 벡터들을 생성하는 단계는, 상기 분석 대상 기사들에 대해 산출된 위험 레벨을 기초로 하여, 위험 레벨을 복수의 구간으로 분류하고 이를 통해 상기 분석 대상 기사들의 그룹화를 수행하는 단계를 더 포함할 수 있다.
상기 위험 레벨을 복수의 구간으로 분류하는 단계는, 상기 분석 대상 기업이 속하는 산업의 종류에 따라 상이한 방식으로 분류를 수행하는 것을 특징으로 할 수 있다.
생성된 특성 벡터들을 토대로 상기 분석 대상 기업의 부도 위험성을 계산하는 단계는, 그룹화가 수행된 분석 대상 기사들의 특성 벡터들을 의사 결정 나무 알고리즘을 통해 분류한 뒤 분류 결과를 기초로 하여 상기 분석 대상 기업의 부도 위험성 예측값을 산출하는 단계를 더 포함할 수 있다.
그룹화가 수행된 분석 대상 기사들의 특성 벡터들을 의사 결정 나무 알고리즘을 통해 분류하는 단계는, 상기 분석 대상 기사들의 그룹에 대해 생성된 특성 벡터들을 포함하는 데이터를 n개로 분류한 뒤 n개의 데이터 집합에 대해 교차 검증(n-Cross Validation) 방식으로 의사 결정 나무(Decision Tree) 알고리즘을 적용하여 특성 벡터들을 분류하는 단계를 더 포함할 수 있다.
본 발명의 다른 실시예에 따르면, 뉴스 기사들을 기초로 하여 기업의 부도 위험성을 예측하는 컴퓨팅 시스템은, 인터넷 상에서 복수의 뉴스 기사들을 수집하는 뉴스 기사 수집부; 분석 대상이 되는 기업을 선택하는 분석 기업 선정부; 수집된 복수의 뉴스 기사들 중 분석 대상 기업과 관련된 뉴스 기사들을 분석 대상 기사들로 분류하는 분석 대상 기사 분류부; 상기 분석 대상 기사들 각각에 대한 위험 레벨을 산출하는 위험 레벨 산출부; 산출된 위험 레벨을 기준으로 상기 분석 대상 기사들의 그룹화를 수행하여 각 그룹을 나타내는 특성 벡터를 생성하는 특성 벡터 생성부; 및 생성된 특성 벡터를 토대로 상기 분석 대상 기업의 부도 위험성을 계산하는 부도 위험성 예측부를 포함할 수 있다.
본 발명의 실시예들에 따르면, 특정 기업에 대해 해당 기업과 직접적인 관련이 있는 뉴스 기사들을 선별하여 해당 기사들만을 토대로 기업의 부도 위험성 예측을 수행할 수 있다.
본 발명의 실시예들에 따르면, 부도 위험성 예측에 효과적인 머신러닝 알고리즘이 채택되어 사용될 수 있으며, 각 기사들에 대한 위험 레벨이 독립적으로 계산될 뿐 아니라 뉴스 기사들의 그룹화를 통한 분석으로 부도 위험성 예측의 정확도를 향상시킬 수 있다.
본 발명의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 일 실시예에 따른 기업 부도 예측 시스템이 동작하는 환경을 개략적으로 나타낸 화면이다.
도 2는 본 발명의 일 실시예에 따른 기업 부도 예측 시스템이 동작하는 방식을 개략적으로 나타낸 흐름도이다.
도 3은 본 발명의 일 실시예에 따른 부도 예측 장치가 뉴스 기사들을 수집하는 동작을 나타내는 도면이다.
도 4는 본 발명의 일 실시예에 따른 부도 예측 장치가 NER 알고리즘을 이용하여 분석 대상 기업과 관련된 뉴스 기사를 분석 대상 기사로 분류하는 방식을 나타낸 도면이다.
도 5는 본 발명의 일 실시예에 따른 부도 예측 장치가 분석 대상 기사들에 대한 위험 레벨을 산출함에 있어 사용하는 독립 변수를 선택하는 과정을 나타낸 도면이다.
도 6은 본 발명의 일 실시예에 따른 부도 예측 장치가 분석 대상 기사들에 대한 위험 레벨 산출에 이용할 머신 러닝 알고리즘을 선택하는 과정을 나타낸 도면이다.
도 7은 본 발명의 일 실시예에 따른 부도 예측 장치가 분석 대상 기사들의 위험 레벨을 토대로 기업의 부도를 예측하는 과정을 나타내는 도면이다.
도 8은 본 발명의 일 실시예에 따른 부도 예측 장치가 특정 기업과 관련된 분석 대상 기사들을 그룹화 하는 방식을 나타낸 도면이다.
도 9는 본 발명의 일 실시예에 따른 부도 예측 장치가 분류된 특성 벡터들을 통해 분석 대상 기업의 부도 위험성을 계산하는 방식을 설명하기 위한 도면이다.
도 10은 본 발명의 일 실시예에 따른 부도 예측 장치가 의사 결정 나무 알고리즘을 통해 특성 벡터들을 분류하는데 사용하는 교차 검증 방식을 설명하기 위한 도면이다.
도 11은 본 발명의 일 실시예에 따른 부도 예측 장치의 구성을 블록도로 나타낸 것이다.
도 12는 본 발명의 일 실시예에 따른 부도 예측 장치가 분석 대상 기업의 부도 위험성 예측값을 도출하기 위한 과정을 나타낸 흐름도이다.
도 2는 본 발명의 일 실시예에 따른 기업 부도 예측 시스템이 동작하는 방식을 개략적으로 나타낸 흐름도이다.
도 3은 본 발명의 일 실시예에 따른 부도 예측 장치가 뉴스 기사들을 수집하는 동작을 나타내는 도면이다.
도 4는 본 발명의 일 실시예에 따른 부도 예측 장치가 NER 알고리즘을 이용하여 분석 대상 기업과 관련된 뉴스 기사를 분석 대상 기사로 분류하는 방식을 나타낸 도면이다.
도 5는 본 발명의 일 실시예에 따른 부도 예측 장치가 분석 대상 기사들에 대한 위험 레벨을 산출함에 있어 사용하는 독립 변수를 선택하는 과정을 나타낸 도면이다.
도 6은 본 발명의 일 실시예에 따른 부도 예측 장치가 분석 대상 기사들에 대한 위험 레벨 산출에 이용할 머신 러닝 알고리즘을 선택하는 과정을 나타낸 도면이다.
도 7은 본 발명의 일 실시예에 따른 부도 예측 장치가 분석 대상 기사들의 위험 레벨을 토대로 기업의 부도를 예측하는 과정을 나타내는 도면이다.
도 8은 본 발명의 일 실시예에 따른 부도 예측 장치가 특정 기업과 관련된 분석 대상 기사들을 그룹화 하는 방식을 나타낸 도면이다.
도 9는 본 발명의 일 실시예에 따른 부도 예측 장치가 분류된 특성 벡터들을 통해 분석 대상 기업의 부도 위험성을 계산하는 방식을 설명하기 위한 도면이다.
도 10은 본 발명의 일 실시예에 따른 부도 예측 장치가 의사 결정 나무 알고리즘을 통해 특성 벡터들을 분류하는데 사용하는 교차 검증 방식을 설명하기 위한 도면이다.
도 11은 본 발명의 일 실시예에 따른 부도 예측 장치의 구성을 블록도로 나타낸 것이다.
도 12는 본 발명의 일 실시예에 따른 부도 예측 장치가 분석 대상 기업의 부도 위험성 예측값을 도출하기 위한 과정을 나타낸 흐름도이다.
본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다. 명세서 전체에 걸쳐 동일한 도면 부호는 동일한 구성 요소를 지칭하며, "및/또는"은 언급된 구성요소들의 각각 및 하나 이상의 모든 조합을 포함한다. 비록 "제1", "제2" 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.
명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.
도 1은 본 발명의 일 실시예에 따른 기업 부도 예측 시스템이 동작하는 환경을 개략적으로 나타낸 화면이다.
도 1을 참조하면, 기업 부도 예측 시스템은 부도 예측 장치(100), 사용자 단말기(200) 및 외부 서버(300)를 포함하여 구성될 수 있다.
부도 예측 장치(100)는 뉴스 기사를 수집하고 수집된 뉴스 기사들의 분석을 통해 특정 기업에 대한 부도 위험성 예측을 수행할 수 있다.
부도 예측 장치(100)는 메모리 수단 및 연산 장치를 구비하고 있는 컴퓨팅 시스템으로 구성될 수 있다. 즉, 부도 예측 장치(100)는 집약적인 처리기능을 가지는 서버로 구성될 수도 있으며, 이와 달리 개인용 컴퓨터(예를 들어, 데스크탑 컴퓨터, 노트북 컴퓨터 등), 워크스테이션, PDA, 웹 패드 등과 같이 메모리 수단을 구비하고 마이크로 프로세서를 탑재하여 연산 능력을 갖춘 디지털 기기 중 하나로 구성될 수도 있다. 부도 예측 장치(100)가 포함하고 있는 메모리 수단에는, 부도 예측과 관련된 기능을 구현하는 소프트웨어가 저장 또는 설치된 상태로 기록될 수 있다.
사용자 단말기(200)는 부도 예측 장치(100)와의 통신을 통해 특정 기업의 부도 위험성과 관련된 정보를 획득하고자 하는 사용자에 의해 사용되는 단말기일 수 있다.
본 발명의 일 실시예에 따른 사용자 단말기(200)는 휴대폰, 스마트폰, PDA(Personal Digital Assistant), PMP(Portable Multimedia Player), 태블릿 PC, 등과 같이 네트워크를 통하여 웹 서버와 연결될 수 있는 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있으며, 개인용 컴퓨터(예를 들어, 데스크탑 컴퓨터, 노트북 컴퓨터 등), 워크스테이션, PDA, 웹 패드 등과 같이 메모리 수단을 구비하고 마이크로 프로세서를 탑재하여 연산 능력을 갖춘 디지털 기기 중 하나일 수도 있다.
일 실시예에 따르면, 사용자는 사용자 단말기(200)를 이용하여 부도 위험성을 알고 싶은 기업에 대한 식별 정보를 부도 예측 장치(100)에 전송하여, 부도 예측 장치(100)가 분석한 해당 기업에 대한 부도 위험성 예측에 대한 정보를 사용자 단말기(200)를 통해 수신하여 확인할 수 있다.
외부 서버(300)는 부도 예측 장치(100)의 관리 주체에 의해 관리되지 않는 서버로, 일 실시예에 따르면 뉴스 데이터를 포함하고 있는 서버일 수 있다. 부도 예측 장치(100)는 외부 서버(300)에 접속하여 뉴스 데이터의 수집을 수행할 수 있다. 부도 예측 장치(100)에 의해 수행되는 뉴스 데이터의 수집은 웹 상에서 발행되는 다양한 종류의 뉴스 데이터를 크롤링(Crawling)하는 방식으로 이루어질 수 있다. 이 경우, 부도 예측 장치(100)는 복수의 외부 서버(300)들로부터 뉴스 데이터를 수집할 수 있다. 이와 같이, 외부 서버(300)의 수는 특정 개수로 한정되지 않음은 물론이다.
부도 예측 장치(100)는 다양한 방식으로 구현되는 통신망을 통해 사용자 단말기(200) 및 외부 서버(300)들과의 통신을 수행할 수 있다.
통신망은 유선 통신망, 무선 통신망 및 복합 통신망 중 하나로써 구현될 수 있다. 예를 들어, 통신망은 3G, LTE(Long Term Evolution), 및 LTE-A 등과 같은 이동 통신망을 포함할 수 있다. 통신망은 와이파이(Wi-Fi), UMTS(Universal Mobile Telecommunisations System)/GPRS(General Packet Radio Service), 또는 이더넷(Ethernet) 등과 같은 유선 또는 무선 통신망을 포함할 수 있다. 통신망은 마그네틱 보안 전송(MST, Magnetic Secure Transmission), RFID(Radio Frequency IDentification), NFC(Near Field Communication), 지그비(ZigBee), Z-Wave, 블루투스(Bluetooth), 저전력 블루투스(BLE, Bluetooth Low Energy), 또는 적외선 통신(IR, InfraRed communication) 등과 같은 근거리 통신망을 포함할 수 있다. 통신망은 근거리 네트워크(LAN, Local Area Network), 도시권 네트워크(MAN, Metropolitan Area Network), 또는 광역 네트워크(WAN, Wide Area Network) 등을 포함할 수 있다. 도 2는 본 발명의 일 실시예에 따른 기업 부도 예측 시스템이 동작하는 방식을 개략적으로 나타낸 흐름도이다.
도 2를 참조하면, 부도 예측 장치(100)는 개략적으로 3단계 동작을 거쳐 최종적으로 기업의 부도 위험성을 예측할 수 있다.
도 2의 (a) 단계는 뉴스 데이터를 수집하여 전처리를 수행하는 단계이며, (b) 단계는 뉴스 기사별 위험 레벨을 산출하는 단계이고, (c) 단계는 최종적으로 기업의 부도 위험성 예측을 수행하는 단계이다.
도 2의 (a) 단계부터 살펴보면, (a) 단계에서 부도 예측 장치(100)는 인터넷에 접속하여 크롤링을 통해 뉴스 기사들을 수집할 수 있다. 이 과정에서, 부도 예측 장치(100)는 분석 대상으로 선택된 분석 대상 기업의 명칭을 포함하고 있는 뉴스 기사들만을 수집할 수도 있다.
이후, 부도 예측 장치(100)는 수집한 뉴스 기사들이 분석 대상 기업과 관련되었는지 여부를 판단하고 이를 통해 복수의 뉴스 기사들의 일부를 분석 대상 기사로 분류할 수 있다. 예를 들어, 분석 대상 기업의 명칭을 텍스트의 형태로 포함하고 있는 뉴스 기사가 존재하더라도, 해당 명칭이 뉴스 기사의 텍스트 상에서 분석 대상 기업의 명칭을 지칭하는 것이 아닌 다른 용도로 사용되는 경우가 존재할 수 있다. 또한, 기사의 문맥 또는 주제가 분석 대상이 되는 기업과 연관이 없는 경우도 존재할 수 있다. 상기와 같은 경우들에 있어서는, 뉴스 기사에 분석 대상 기업의 명칭이 포함되어 있지만 해당 기사들이 분석 대상 기사로 분류되지 않을 수 있다.
도 2의 (b) 단계를 살펴보면, (b) 단계에서 부도 예측 장치(100)는 분석의 대상이 되는 기업과 관련되었다고 분류된 분석 대상 기사들 각각에 대한 위험 레벨을 산출할 수 있다.
(b)단계에서 분석 대상 기사들 각각에 대한 위험 레벨 산출은 머신 러닝(Machine Learning)을 통해 수행될 수 있다. 즉, 부도 예측 장치(100)는 수집한 뉴스 기사들의 적어도 일부를 머신 러닝을 위한 학습용 데이터(Training Set) 및 시험용 데이터(Test set)로 설정하고, 특정 머신 러닝 알고리즘을 채택한후 해당 머신 러닝 알고리즘을 통해 학습용 데이터에 대한 분석을 수행하고 이를 시험용 데이터에 적용하여 분석 결과를 평가하는 방식으로 위험 레벨 산출에 사용되는 위험 산출 알고리즘을 도출할 수 있다. 이후, 부도 예측 장치(100)는 도출된 위험 산출 알고리즘을 통해 분석 대상 기사들에 대한 위험 레벨을 산출할 수 있다.
부도 예측 장치(100)는 다양한 종류의 머신 러닝 알고리즘에 대해 학습 및 시험을 상기와 같은 방식으로 수행하고 그 결과를 평가하여 평가 결과가 가장 나은 머신 러닝 알고리즘을 채택할 수 있다. 평가 결과에 따른 머신 러닝 알고리즘의 채택은 부도 예측 장치(100)에 의해 자동적으로 수행될 수도 있으며, 부도 예측 장치(100)의 관리자가 평가 결과를 확인하고 선택할 수도 있다.
일 실시예에 따르면, 학습용 데이터 내에는 어떠한 기업에 대해 부도가 발생하였는지에 대한 정보가 포함되어 있어, 부도 예측 장치(100)는 이와 같은 정보를 활용하여 머신 러닝 알고리즘의 평가를 수행할 수 있다. 예를 들어, 부도가 발생한 기업에 대한 뉴스 기사의 위험 레벨을 높게 산출하고 부도가 발생하지 않은 기업에 대한 뉴스 기사의 위험 레벨을 낮게 산출한 정도에 따라 머신 러닝 알고리즘들의 평가가 수행될 수 있다.
(b) 단계에서는 최종적으로 채택된 머신 러닝 알고리즘에 의해 도출된 위험 산출 알고리즘이 활용되어, 분석 대상 기사들 각각에 대한 위험 레벨이 산출될 수 있다.
도 2의 (c) 단계를 살펴보면, 부도 예측 장치(100)는 (b) 단계에서 산출된 뉴스 기사들의 위험 레벨을 기초로 하여, 최종적으로 기업의 부도 위험성 예측을 수행할 수 있다.
부도 예측 장치(100)는 분석 대상 기업에 대해 분류된 분석 대상 기사들의 위험 레벨을 기초로 하여, 분석 대상 기업의 부도 위험성을 수치화된 형태로 계산할 수 있다. 또한, 부도 예측 장치는 계산된 부도 위험성을 기초로 하여 해당 기업에 대한 부도 예상을 가부 형식(yes or no)으로 판단할 수도 있으며, 계산된 부도 위험성의 신뢰도를 부가적으로 산출할 수도 있다.
부도 예측 장치(100)는 분석 대상 기사들의 위험 레벨을 기초로 하여 분석 대상 기업의 부도 위험성을 계산함에 있어, 산출된 위험 레벨을 기준으로 분석 대상 기사들의 그룹화를 수행하고 각 그룹별 특성 벡터들을 생성하여 이를 토대로 부도 위험성을 계산할 수도 있다.
도 3은 본 발명의 일 실시예에 따른 부도 예측 장치(100)가 뉴스 기사들을 수집하는 동작을 나타내는 도면이다.
도 3을 참조하면, 부도 예측 장치(100)는 인터넷 상에서 크롤링을 통해 뉴스 기사를 수집할 수 있다. 도 3에는 부도 예측 장치(100)가 수집한 뉴스 기사 중 특정한 기업에 대한 뉴스 기사만이 표시되어 있다.
일 실시예에 따르면, 부도 예측 장치(100)는 Lucene과 같은 형태소 분석 라이브러리를 이용하여 전체 뉴스 기사들 중 특정 기업의 명칭을 포함하는 뉴스 기사만을 선별할 수 있다.
도 4는 본 발명의 일 실시예에 따른 부도 예측 장치(100)가 NER 알고리즘을 이용하여 분석 대상 기업과 관련된 뉴스 기사를 분석 대상 기사로 분류하는 방식을 나타낸 도면이다.
도 4를 참조하면, 부도 예측 장치(100)는 분석 대상 기업과 관련된 기사를 분류하는데 있어 특성화된 NER(Named Entity Recognition) 알고리즘을 활용할 수 있다. 도 3에서 전술된 바와 같이, 형태소 분석 라이브러리 등을 활용하여 전체 뉴스 기사들 중 특정 기업의 명칭을 포함하는 뉴스 기사만이 선별될 수 있지만, 이 경우 선별된 기사들을 그대로 분석 대상 기사로 분류하여 사용하기에는 몇가지 문제점이 존재하였다. 문제점들을 살펴보면, 특정 뉴스는 해당 기업과 전혀 관련이 없는 경우가 존재하였으며, 형태소 분석 라이브러리가 철자가 약간 틀렸다고 판단되는 기사를 허용하여 관련 없는 기사가 선별되는 경우가 존재하였다. 또한, 특정 기업의 명칭은 해당 기업의 명칭으로 사용될 뿐만 아니라 해당 기업이 판매하는 상품의 명칭으로 사용되는 등 기업의 명칭이 다른 의미로 사용된 기사가 선별되는 경우도 존재하였다.
상기와 같은 문제점을 해결하기 위해, 부도 예측 장치(100)는 NER 알고리즘을 활용하여, 형태소 분석 라이브러리를 통해 선별된 뉴스 기사가 분석 대상 기업과 관련된 뉴스인지를 판단하고 해당하는 기사들을 분석 대상 기사로 분류할 수 있다. 즉, 부도 예측 장치(100)는 분석 대상 기업의 명칭이 포함된 뉴스 기사들을 형태소 분석 라이브러리를 활용하여 선별하고, NER 알고리즘을 통해 선별된 뉴스 기사들 각각에 대해 해당 기사가 분석 대상 기업과 관련 있는 기사인지를 판단할 수 있다.
일 실시예에 따르면, NER 알고리즘은 프로그래밍 언어인 R을 통해 구현될 수 있으며, POS tagging과 n-gram 방식을 활용하여 구현될 수 있다. POS(Part-Of-Speech) tagging이란, 텍스트를 문법적인 기능이나 형태에 따라 구분하는 방식을 의미하며, 이와 같은 구분은 다양한 기준을 통해 수행될 수 있다. n-gram이란, 단어를 그룹화하는 방식으로 문장을 n개의 음절 또는 단어를 가지는 그룹들로 분류하고 이에 대한 분석을 수행하는 방식을 의미할 수 있다.
도 4를 참조하면, NER 알고리즘을 통해 분석 대상 기업에 대해 선별된 기사들이 분석 대상 기업과 관련이 있는지 여부가 판단될 수 있다. 기업의 명칭이 포함된 텍스트가 추출되었는지 여부를 기초로 하여 NER 알고리즘이 적용되어 해당 기사가 분석 대상 기업과 관련이 있는지 여부가 판단될 수 있으며, 도 4에서와 같이 'ACCEPT' 또는 'REJECT'와 같은 가부 형식(yes or no)으로 결과가 도출될 수 있다.
상기와 같이, NER 알고리즘에 따르면, 선별된 뉴스 기사들 각각에 대한 문맥 또는 주제가 식별되고, 식별된 문맥 또는 주제가 분석 대상 기업 정보와 연관이 있는지 여부가 판단될 수 있으며, 특정 기업의 명칭이 해당 기업을 지칭하는 것이 아닌 다른 의미로 사용되고 있는지 여부가 판단될 수 있다.
도 5는 본 발명의 일 실시예에 따른 부도 예측 장치(100)가 분석 대상 기사들에 대한 위험 레벨을 산출함에 있어 사용하는 독립 변수를 선택하는 과정을 나타낸 도면이다.
부도 예측 장치(100)는 도 3 및 도 4를 통해 전술된 방식을 통해 분류된 분석 대상 기사들에 대한 분석을 수행함에 있어, 머신 러닝 알고리즘을 활용할 수 있다. 부도 예측 장치(100)는 특정 머신러닝 알고리즘을 채택하고 분석 대상 기사들의 일부를 학습용 데이터로 설정한 뒤 그에 대한 분석을 수행하여 위험 산출 알고리즘을 도출할 수 있다. 이 과정에서 사용되는 머신러닝 알고리즘은 회귀 분석 또는 항목화 분석 방식을 활용할 수 있다.
도 5를 참조하면, 부도 예측 장치(100)는 다양한 방식을 통해 위험 레벨 산출에 사용할 독립 변수들을 선택할 수 있다. 위험 레벨 산출에 사용되는 독립 변수들은 뉴스 기사들에 포함되는 문장 또는 단어들의 적어도 일부를 포함할 수 있다.
일 실시예에 따르면, 부도 예측 장치(100)는 뉴스 기사들에 포함되는 단어를 n-gram 형식으로 분류하여 선택할 수 있으며, 다양한 특징 선택(Feature Selection) 방식을 통해 단어를 선택할 수도 있다. 또한, 단어들이 뉴스 기사에서 등장하는 빈도에 따라 계산되는 희소성을 기초로 하여, 위험 레벨 산출을 수행함에 있어 독립 변수로 사용될 단어가 선택될 수도 있다.
도 5는 다양한 방식으로 독립 변수가 선택되었을 때의 결과치를 나타내고 있다. 도 5의 우측의 그래프에서 가로축은 독립 변수 선택이 서로 다르게 이루어진 방식을 나타내며, 막대 그래프는 각 방식에서 사용된 독립 변수의 개수, 선그래프는 각 방식 별 평가 점수를 나타낸다.
도 5를 참조하면, 1-3 및 1-4 방식에서 살펴볼 수 있듯이 독립 변수의 개수가 커지게 되면 평가 점수도 그에 따라 상승될 수 있지만, 이와 같은 방식에 있어서는 과적합(Overfitting)의 문제도 발생할 수 있으며 너무 과대한 독립 변수의 수를 처리하는 방식은 컴퓨팅 시스템의 리소스를 과다하게 요구할 수 있다. 따라서, 3-1 방식과 3-2 방식에서 나타난 것과 같이 적당한 수의 독립 변수가 선정되면 그에 따라 적절한 평가 점수가 과적합의 문제 없이 산출될 수 있다.
도 6은 본 발명의 일 실시예에 따른 부도 예측 장치(100)가 분석 대상 기사들에 대한 위험 레벨 산출에 이용할 머신 러닝 알고리즘을 선택하는 과정을 나타낸 도면이다.
도 6을 참조하면, 부도 예측 장치(100)는 다양한 종류의 머신 러닝 알고리즘을 채택하여 분석 대상 기사들을 분석하고 분석 결과를 기초로 하여 위험 산출 알고리즘을 도출할 수 있다. 일 실시예에 따르면, 머신 러닝 알고리즘은 회귀 분석 또는 항목화 분석을 이용할 수 있다. 머신 러닝 알고리즘의 종류는 도 6에 도시된 것과 같이 MLP Regression, Logistic Regression, Decision Tree, Random Forest, Adaboost Classifier, SVM(Support Vector Machine) 등을 포함할 수 있다. 다만, 부도 예측 장치(100)가 채택하여 사용할 수 있는 머신 러닝 알고리즘의 종류는 상기와 같은 예에 한정되지 않음은 물론이다.
도 6에는 다양한 종류의 머신 러닝 알고리즘을 통해 분석 대상 기사를 분석한 결과를 AUC 및 지니 계수(Gini Value)를 통해 평가한 수치가 나타나 있다. AUC(Area Under Curve)는 통계학에서 판별 모형의 성능을 평가하기 위하여 사용하는 계산 방식으로, x축을 False Positive Rate로 설정하고 Y축을 True Positive Rate로 설정한 그래프에서 나타나는 ROC(Receiver Operating Characteristics) 곡선의 아래 면적을 의미한다. AUC의 최대값은 1이며 높은 값이 나올수록 분류의 성능이 뛰어난 것으로 해석될 수 있다. 지니 계수 또한 통계학에서 판별 모형의 성능을 평가하기 위하여 사용되는 계산 방식 중 하나로, 그래프에서 ROC 곡선과 원점에서 시작되어 그래프를 절반으로 분류하는 대각선 사이의 면적을 A라고 하고, ROC 곡선 아래의 면적을 B라고 할 때 A를 (A+B)로 나눔으로써 구해질 수 있다. AUC와 지니 계수와의 관계는, AUC에 2를 곱한 값에서 1을 차감하면 지니 계수가 산출되는 관계일 수 있다.
부도 예측 장치(100)는 상기와 같은 평가 결과를 토대로, 특정한 머신 러닝 알고리즘을 채택하고, 채택한 알고리즘을 통해 도출된 위험 산출 알고리즘을 이용하여 분석 대상 기사들 각각에 대한 위험 레벨을 산출할 수 있다.
도 7은 본 발명의 일 실시예에 따른 부도 예측 장치(100)가 분석 대상 기사들의 위험 레벨을 토대로 기업의 부도를 예측하는 과정을 나타내는 도면이다.
도 7을 참조하면, 부도 예측 장치(100)는 분석 대상 기업에 관련된 분석 대상 기사들의 위험 레벨을 토대로 부도 기사 비율을 판단할 수 있으며 이에 따라 부도 위험성을 계산할 수 있다. 도 7을 참조하면, 대략의 오차는 존재하지만 시간이 진행될수록 부도 기사의 비율이 점차적으로 증가하는 것으로 표시되어 있으며, 부도 발생 4개월 전인 M-4의 시점부터는 부도 기사의 비율과 함께 부도 위험성 수치(D.D: Distance to Default) 또한 증가하는 것으로 표시된다. 도 7에서 원으로 표시된 부분(701)에서는 일시적으로 부도 기사 비율이 증가하였지만 부도 위험성 수치는 큰 변동을 보이지 않음을 볼 수 있다. 이와 같이, 부도 예측 장치(100)는 부도 기사 비율이 일시적으로 증가하거나 감소하더라도 부도 위험성 수치가 이에 과도하게 연계되어 변화하지 않도록 제어할 수 있다.
도 8은 본 발명의 일 실시예에 따른 부도 예측 장치(100)가 특정 기업과 관련된 분석 대상 기사들을 그룹화 하는 방식을 나타낸 도면이다.
도 8을 참조하면, 복수의 분석 대상 기사들에 대한 위험 레벨이 수치화 된 형태로 나타나 있으며, 분석 대상 기사들의 그룹화가 위험 레벨을 기준으로 수행된 형태가 표시되어 있다.
본 발명의 일 실시예에 따르면, 복수의 분석 대상 기사들은 도 8에서와 같이 다양한 수치의 위험 레벨로 표시될 수 있으며, 이는 위험 레벨에 기초한 임의의 기준에 따라 복수개의 그룹으로 그룹화될 수 있다. 도 8에서는 0.7, 0.8 및 0.9의 위험 레벨이 산출된 분석 대상 기사들이 제1 그룹(801)으로 그룹화되었으며, 1.2 및 1.3의 위험 레벨이 산출된 분석 대상 기사들이 제2 그룹(803)으로 그룹화되었고, 0.3, 0.4 및 0.5의 위험 레벨이 산출된 분석 대상 기사들이 제3 그룹(805)으로 그룹화된 상태가 표시되었다. 이와 같이, 본 발명의 일 실시예에 따르면 위험 레벨에 따른 복수의 구간이 설정되어 각 구간에 분석 대상 기사들이 속하게 됨으로써 분석 대상 기사들의 그룹화가 수행될 수 있다.
도 9는 본 발명의 일 실시예에 따른 부도 예측 장치(100)가 분류된 특성 벡터들을 통해 분석 대상 기업의 부도 위험성을 계산하는 방식을 설명하기 위한 도면이다.
도 9를 참조하면, 부도 예측 장치(100)는 상기와 같이 분석 대상 기사들이 위험 레벨을 기준으로 그룹화된 후, 각 그룹을 나타내는 특성 벡터(Feature Vector)들을 생성할 수 있다. 특성 벡터는, 각 그룹에 속하는 분석 대상 기사들의 위험 레벨을 기초로 계산되는 통계치를 벡터의 원소로 포함할 수 있다. 분석 대상 기사들의 위험 레벨을 기초로 계산되는 통계치는 최소값(Minimum), 최대값(Maximum), 평균(Mean), 중앙값(Median), 최빈값(mode) 등을 포함할 수 있다.
각 그룹에 대한 특성 벡터들을 생성한 후, 부도 예측 장치(100)는 생성된 특성 벡터들을 기초로 하여 분석 대상 기업의 부도 위험성을 계산할 수 있다. 일 실시예에 따르면, 부도 예측 장치(100)는 부도 위험성을 계산하고 최종적으로 해당 기업의 부도 위험성을 가부 형식(yes or no)으로 판단할 수도 있다.
이 과정에서 부도 예측 장치(100)는 특성 벡터들을 의사 결정 나무(Decision Tree) 알고리즘을 통해 분류할 수 있다. 즉 특성 벡터들이 가지는 다양한 종류의 특성을 기초로 특성 벡터들이 분류될 수 있으며 그 분류 결과를 기초로 하여 분석 대상 기업의 부도 위험성 예측값이 계산될 수 있고, 부도 위험성 예측의 신뢰도 또한 계산될 수 있다.
일 실시예에 따르면, 부도 예측 장치(100)는 의사 결정 나무 알고리즘을 통해 부도 위험성 예측값을 계산함에 있어, 각 클래스의 확률 분포값을 기초로할 수 있다. 예를 들어, 의사 결정 나무의 같은 가지(branch) 내에서 동일한 클래스가 나올 확률, 즉 데이터 분류에 이용되는 특성 벡터들이 특정 클래스로 분류될 확률을 기초로 하여 부도 위험성 예측값을 계산할 수 있다.
부도 예측 장치(100)는 부도 위험성 예측과 함께 부도 위험성 예측의 신뢰도 또한 계산할 수 있는데, 이는 의사 결정 나무 알고리즘에 의해 특성 벡터들의 모든 특성이 검토되지 않은 상태로 부도 위험성 예측값이 계산되는 경우 신뢰도를 감소시키는 형태로 계산될 수 있다. 예를 들어, 특성 벡터들이 의사 결정 나무 알고리즘 상에서 분류될 수 있는 기준이 10개인데 그 기준 중 일부만이 사용된 상태에서 최종 클래스 분류가 완료되어 부도 위험성 예측값이 계산되는 경우 사용된 기준의 개수가 적게 산정됨에 따라 신뢰도가 하락하는 방식으로 신뢰도 계산이 수행될 수 있다.
도 10은 본 발명의 일 실시예에 따른 부도 예측 장치(100)가 의사 결정 나무 알고리즘을 통해 특성 벡터들을 분류하는데 사용하는 교차 검증 방식을 설명하기 위한 도면이다.
도 10을 참조하면, 부도 예측 장치(100)는 의사 결정 나무 알고리즘을 통해 특성 벡터들을 분류함에 있어, 교차 검증(n-Cross Validation) 방식을 통해 분류를 수행할 수 있다. 상세하게는, 부도 예측 장치(100)는 분석 대상 기사들에 대해 산출된 위험 레벨 정보를 포함하는 데이터를 기초로 하여, 데이터들을 n개로 분류한 뒤 n개의 데이터 집합 중 하나의 집합을 시험용 데이터(Test set)로, 나머지 집합을 학습용 데이터(Training set 또는 Learning set)으로 사용하는 것을 n번 반복할 수 있다. 이와 같이, 교차 검증 방식에 의하면 반복 과정에서 시험용 데이터로 사용되는 데이터 집합이 계속하여 변경되어 상이한 시험용 데이터 및 학습용 데이터로 분석을 n번까지 반복할 수 있게 된다.
도 11은 본 발명의 일 실시예에 따른 부도 예측 장치(100)의 구성을 블록도로 나타낸 것이다.
도 11을 참조하면, 부도 예측 장치(100)는 뉴스 기사 수집부(110), 분석 기업 선정부(120), 분석 대상 기사 분류부(130), 위험 레벨 산출부(140), 특성 벡터 생성부(150), 부도 위험성 예측부(160), 통신부(170), 저장부(180) 및 제어부(190)를 포함하여 구성될 수 있다.
설명의 편의를 위하여 부도 예측 장치(100) 내에서 각각의 각각의 역할을 수행하는 주체들을 ~부의 형태로 표시하였으나, 각각의 부분들은 부도 예측 장치(100) 내에서 동작하는 서브 프로그램 모듈 또는 제어부(190)를 기능적으로 분류한 구성들일 수 있다. 이러한 프로그램 모듈들은 각 동작을 수행하거나, 특정 추상 데이터 유형을 실행하는 루틴, 서브루틴, 프로그램, 오브젝트, 컴포넌트, 데이터 구조 등을 포괄하는 개념이지만, 이에 제한되지는 않는다.
뉴스 기사 수집부(110)는 인터넷 상에서 뉴스 기사의 수집을 수행할 수 있다. 이를 위해, 뉴스 기사 수집부(110)는 다양한 종류의 외부 서버(300)에 접속할 수 있다. 뉴스 기사 수집부(110)는 웹 상에서 발행되는 뉴스 관련 데이터에 대해 크롤링을 수행하는 방식으로 뉴스 기사를 수집할 수 있다.
일 실시예에 따르면 뉴스 기사 수집부(110)는 분석 대상 기업이 선택되면 해당 기업과 관련된 기사만을 분류하여 수집할 수 있다. 뉴스 기사 수집부(110)는 이와 같은 기능을 수행함에 있어 후술할 분석 기업 선정부(120) 및 분석 대상 기사 분류부(130)의 기능을 이용할 수 있다.
분석 기업 선정부(120)는 분석 대상이 되는 기업을 선택할 수 있다. 전술한 바와 같이, 뉴스 기사 수집부(110)는 분석 기업 선정부(120)가 선택하는 기업과 관련된 기사들만을 수집할 수 있으며, 후술할 분석 대상 기사 분류부(130) 또한 분석 기업 선정부(120)가 선택하는 기업들에 대한 기사를 분류할 수 있다. 일 실시예에 따르면, 분석 기업 선정부(120)는 복수의 분석 대상 기업을 선택할 수도 있으며, 사용자 단말기(200)로부터 수신한 기업 정보에 해당하는 기업을 분석 대상 기업으로 선택할 수도 있다.
분석 대상 기사 분류부(130)는 수집된 뉴스 기사들 중 분석 대상 기업과 관련된 뉴스 기사들을 분석 대상 기사들로 분류할 수 있다. 이를 위하여, 분석 대상 기사 분류부(130)는 일차적으로 분석 대상 기업의 명칭이 포함된 뉴스 기사들을 선별하고, 선별된 뉴스 기사들 각각에 대해 분석 대상 기업과 관련 있는 기사인지 여부를 판단할 수 있다.
분석 대상 기사 분류부(130)는 분석 대상 기업의 명칭이 포함된 뉴스 기사를 선별함에 있어 형태소 분석 라이브러리를 활용할 수 있다. 또한, 분석 대상 기사 분류부(130)는 분석 대상 기업의 명칭이 포함된 뉴스 기사들이 선별되면, 선별된 뉴스 기사들 각각에 대한 문맥 또는 주제를 식별하고, 식별된 문맥 또는 주제가 분석 대상 기업 정보와 연관이 있는지 여부를 판단할 수 있다. 예를 들어, 분석 대상 기업이 장난감 제조업을 영위하는 기업인데, 해당 기업의 명칭이 포함되어 선별된 기사 중 하나가 이와 전혀 관련없는 반도체 관련 내용을 포함하고 있으면, 분석 대상 기사 분류부(130)는 해당 기사를 분석 대상 기업 정보와 관련없다고 판단하고 분석 대상 기사에서 제외시킬 수 있다.
위험 레벨 산출부(140)는 분석 대상 기사 분류부(130)가 분류한 분석 대상 기사들 각각에 대한 위험 레벨을 산출할 수 있다. 이 과정에서, 위험 레벨 산출부(140)는 특정 머신 러닝 알고리즘을 채택하고 해당 머신 러닝 알고리즘을 이용하여 수집된 뉴스 기사들에 대한 회귀 분석 또는 항목화 분석을 수행할 수 잇다. 위험 레벨 산출부(140)는 회귀 분석 또는 항목화 분석의 결과로 도출된 위험 산출 알고리즘을 이용하여 분석 대상 기사들 각각에 대한 위험 레벨을 산출할 수 있다.
위험 레벨 산출부(140)는 분석 대상 기업에 대한 뉴스뿐 아니라, 뉴스 기사 수집부(110)가 수집한 모든 뉴스 기사에 대해서 분석을 수행할 수 있다. 즉, 위험 레벨 산출부(140)는 머신 러닝 알고리즘을 이용함에 있어 해당 머신 러닝 알고리즘을 학습시켜야 하므로 학습용 데이터로 이와 같은 뉴스 기사들을 활용할 수 있다. 일 실시예에 따르면, 위험 레벨 산출부(140)는 뉴스 기사뿐 아니라, 기업의 부도 정보를 관리할 수 있다. 기업의 부도 정보는 부도가 발생한 기업 정보와 부도 발생의 시점과 관련된 정보를 포함할 수 있다.
위험 레벨 산출부(140)는 머신 러닝 알고리즘을 통해 수집된 뉴스 기사들에 대한 분석을 수행함에 있어, 부도가 발생한 기업들에 대한 뉴스 기사만을 그 대상으로 할 수 있으며, 부도가 발생한 기업에 대한 뉴스 기사들에 대해 해당 기업의 부도로부터 일정 시간 이내에 발행된 뉴스 기사만을 분석 대상으로 선택할 수도 있다. 예를 들어, 위험 레벨 산출부(140)는 특정 회사에 부도가 발생한 경우 부도 발생일 이전 2년 동안 발행된 뉴스 기사만을 분석 대상으로 할 수 있다.
이와 같이, 위험 레벨 산출부(140)가 부도가 발생한 기업에 대해, 기업의 부도 발생 전 일정 시간 이내에 발행된 뉴스 기사만을 머신 러닝 알고리즘을 통해 분석하고, 분석 결과에 따라 도출된 위험 산출 알고리즘을 이용하여 분석 대상 기사들 각각에 대한 위험 레벨을 산출함에 따라, 위험 레벨 산출의 정확도가 향상될 수 있다. 즉, 위험 레벨 산출부(140)는 머신 러닝 알고리즘의 학습을 수행하는 단계에서는 부도가 발생하였다는 사실이 인지된 기업들의 기사를 통해 학습을 수행하고, 머신 러닝 알고리즘을 통해 도출된 위험 산출 알고리즘을 이용하여 부도가 현재까지 발생하지 않은 분석 대상 기업의 뉴스 기사들 각각에 대한 위험 레벨을 산출할 수 있다.
특성 벡터 생성부(150)는 분석 대상 기사들 각각에 대해 산출된 위험 레벨을 기준으로 하여 분석 대상 기사들의 그룹화를 수행하고 각 그룹을 나타내는 특성 벡터들을 생성할 수 있다.
특성 벡터 생성부(150)는 분석 대상 기사들에 대해 산출된 위험 레벨의 구간에 따라 분석 대상 기사들을 복수의 그룹으로 분류하고, 각 그룹에 포함되는 분석 대상 기사들의 위험 레벨의 통계치를 토대로 그룹을 나타내는 특성 벡터들을 생성할 수 있다.
일 실시예에 따르면, 특성 벡터 생성부(150)가 특성 벡터들을 생성함에 있어 사용하는 분석 대상 기사들의 위험 레벨 통계치는 위험 레벨 수치들의 평균(Mean), 중앙값(Median), 최빈값(Mode), 최소값(Minimum), 최대값(Maximum) 등을 포함할 수 있다. 특성 벡터 생성부(150)는 이와 같은 통계치들 또는 이를 활용하여 산출된 다른 수치들을 특성 벡터의 원소로 하여 특성 벡터를 생성할 수 있다.
일 실시예에 따르면, 특성 벡터 생성부(150)는 위험 레벨을 복수의 구간으로 분류함에 있어 분석 대상 기업이 속하는 산업의 종류에 따라 상이한 방식으로 분류를 수행할 수 있다. 예를 들어, 특성 벡터 생성부(150)는 제조업, 의료업, 금융업, 통신업 등으로 산업을 분류하고 분석 대상 기업이 어디에 속하는지를 파악한 뒤, 각 산업의 종류에 맞춤형으로 위험 레벨의 구간 분류를 수행할 수 있다. 또다른 예를 들면, 특성 벡터 생성부(150)는 분석 대상 기업이 속하는 산업을 제조업 또는 비제조업으로 분류하고 그에 따라 위험 레벨의 구간 분류를 수행할 수 있다.
부도 위험성 예측부(160)는 분석 대상 기업에 대해 생성된 복수의 특성 벡터를 토대로, 해당 기업의 부도 위험성 예측값을 산출하고, 예측값 산출과 관련된 신뢰도를 계산할 수 있다.
일 실시예에 따르면, 부도 위험성 예측부(160)는 의사 결정 나무 알고리즘을 통해 특성 벡터들을 분류함으로써 부도 위험성 예측값을 계산할 수 있다. 부도 위험성 예측부(160)는 분석 대상 기사들의 그룹에 대해 생성된 특성 벡터들을 포함하는 데이터를 n개로 분류한 뒤 n개의 데이터 집합에 대해 n-Cross Validation 방식으로 의사 결정 나무(Decision)를 적용하여 특성 벡터들의 분류를 수행할 수 있다.
부도 위험성 예측부(160)는 의사 결정 나무 상에서 각 클래스의 확률 분포값을 기초로 하여 부도 위험성 예측값을 계산할 수 있다. 또한, 부도 위험성 예측부(160)는 부도 위험성 예측의 신뢰도를 계산함에 있어, 부도 위험성 예측값이 계산되는 과정에서 의사 결정 나무 알고리즘에 의해 검토된 특성의 개수를 기초로 하여 부도 위험성 예측의 신뢰도를 계산할 수 있다.
통신부(170)는 부도 예측 장치(100)가 사용자 단말기(200) 및 외부 서버(300)와의 통신을 수행할 수 있도록 한다. 통신부(170)가 통신을 수행하기 위해서 사용하는 통신망은 유선 및 무선 등과 같은 그 통신 양태를 가리지 않고 구성될 수 있으며, 다양한 종류의 통신망으로 구현될 수 있다.
저장부(180)는 부도 예측 장치(100)가 동작하는 과정에서 활용하는 데이터를 보관하는 역할을 수행할 수 있다. 예를 들어, 저장부(180)는 수집되는 뉴스 기사 데이터 및 이에 대한 분석 데이터를 저장하여 관리할 수 있다.
저장부(180)는 예를 들어, 메모리(memory), 캐시(cash), 버퍼(buffer) 등을 포함할 수 있으며, 소프트웨어, 펌웨어, 하드웨어 또는 이들 중 적어도 둘 이상의 조합으로 구성될 수 있다. 일실시예에 따르면, 저장부(180)는 ROM(Read Only Memory) 형태로 구현될 수 있다.
제어부(190)는 뉴스 기사 수집부(110), 분석 기업 선정부(120), 분석 대상 기사 분류부(130), 위험 레벨 산출부(140), 특성 벡터 생성부(150), 부도 위험성 예측부(160), 통신부(170) 및 저장부(180) 간의 데이터 흐름을 제어하는 기능을 수행할 수 있다. 즉, 본 발명에 따른 제어부(190)는 뉴스 기사 수집부(110), 분석 기업 선정부(120), 분석 대상 기사 분류부(130), 위험 레벨 산출부(140), 특성 벡터 생성부(150), 부도 위험성 예측부(160), 통신부(170) 및 저장부(180)에서 각각 고유한 기능을 수행하도록 제어할 수 있다.
도 11에서 뉴스 기사 수집부(110), 분석 기업 선정부(120), 분석 대상 기사 분류부(130), 위험 레벨 산출부(140), 특성 벡터 생성부(150) 및 부도 위험성 예측부(160)는 제어부(190)를 기능적으로 분류한 구성이므로 하나의 제어부(190)로 통합되어 구성될 수 있다.
도 12는 본 발명의 일 실시예에 따른 부도 예측 장치(100)가 분석 대상 기업의 부도 위험성 예측값을 도출하기 위한 과정을 나타낸 흐름도이다.
도 12를 참조하면, 부도 예측 장치(100)는 인터넷 상에서 뉴스 기사들에 대한 수집을 수행할 수 있다(S1201). 이와 같은 수집 단계에서 축척된 뉴스 기사 데이터는 추후 머신 러닝 알고리즘의 학습용 데이터 또는 시험용 데이터로 사용될 수 있으며, 분석 대상 기업으로 선택되는 기업과 관련된 뉴스 기사만이 별도로 분류되어 부도 위험성 예측에 사용될 수도 있다.
부도 예측 장치(100)는 머신 러닝 알고리즘을 통해 뉴스 기사 분석을 수행하고 위험 산출 알고리즘을 도출할 수 있다(S1203). 이 과정에서, 부도 예측 장치(100)는 다양한 종류의 머신 러닝 알고리즘을 통해 뉴스 기사 분석을 수행하고 그 결과를 비교하여 특정 머신 러닝 알고리즘을 채택할 수 있다. 부도 예측 장치(100)는 뉴스 기사 데이터와 별개로, 기업들의 부도 정보를 수집하여 관리할 수 있으며 이를 토대로 뉴스 기사 분석 결과를 평가할 수 있다.
부도 예측 장치(100)는 분석 대상이 되는 기업을 선택하고 해당 기업과 관련된 뉴스 기사들을 분석 대상 기사로 분류할 수 있다(S1205). 분석 대상 기업의 선택은 사용자에 의해 수행되어 선택 정보가 사용자 단말기(200)에서 부도 예측 장치(100)로 전달되는 방식으로 수행될 수도 있으며, 부도 예측 장치(100)의 관리자에 의해 수행될 수도 있다. 부도 예측 장치(100)는 미리 수집된 뉴스 기사들 중에서 해당 기업과 관련된 뉴스 기사들을 분류할 수도 있지만, 인터넷 상에서 해당 기업과 관련된 뉴스 기사들을 새롭게 검색하여 수집할 수도 있다. 부도 예측 장치(100)는 형태소 라이브러리를 활용하여 분석 대상 기업의 명칭을 포함하는 기사만을 수집할 수 있다.
부도 예측 장치(100)는 분석 대상이 되는 기업을 선택하고 해당 기업과 관련된 뉴스 기사들을 분석 대상 기사로 분류함에 있어, 형태소 라이브러리를 이용하여 수집된 전체 뉴스 기사들 중 분석 대상 기업의 명칭을 포함하는 뉴스 기사만을 선별할 수 있으며, NER 알고리즘을 이용하여 선별된 기사들 중 분석 대상 기업과 관련된 뉴스 기사들만을 분석 대상 기사들로 분류할 수 있다. 이와 달리, 부도 예측 장치(100)는 수집 단계에서 분석 대상 기업의 명칭을 포함하는 뉴스 기사들만이 수집된 경우 이에 대해서 NER 알고리즘을 이용하여 분석 대상 기업과 관련된 뉴스 기사들만을 분석 대상 기사들로 분류할 수 있다.
부도 예측 장치(100)는 분석 대상 기사를 분류한 이후, S1203 단계에서 도출된 위험 산출 알고리즘을 이용하여 분석 대상 기사들 각각에 대한 위험 레벨을 산출할 수 있다(S1207).
분석 대상 기사들 각각에 대한 위험 레벨이 산출되면, 부도 예측 장치(100)는 산출된 위험 레벨을 기준으로 분석 대상 기사들의 그룹화를 수행할 수 있다(S1209). 일 실시예에 다르면, 분석 대상 기사들의 그룹화는 각 기사에 대해 산출된 위험 레벨이 복수개의 구간 중 어느 구간에 속하는지에 기초하여 수행될 수 있다.
부도 예측 장치(100)는 분석 대상 기사들이 그룹화된 결과를 활용하여, 분석 대상 기사들의 그룹별로 특성 벡터들을 생성할 수 있다(S1211). 특성 벡터들이 포함하는 원소는, 각 그룹에 포함되는 분석 대상 기사들의 위험 레벨을 토대로 계산되는 각종 통계치 또는 이러한 통계치를 활용하여 산출된 수치일 수 있다.
부도 예측 장치(100)는 최종적으로, 생성된 특성 벡터들을 기초로 하여 분석 대상 기업의 부도 위험성을 계산할 수 있다(S1213). 분석 대상 기업의 부도 위험성 계산은 의사 결정 나무 알고리즘을 통해 특성 벡터들을 분류하는 과정을 통해 수행될 수 있다. 또한, 부도 예측 장치(100)는 부도 위험성 예측값을 계산하는 과정에서 부도 위험성 예측의 신뢰도를 별도로 계산할 수 있다.
이와 같이, 본 발명의 다양한 실시예들에 의하면 특정 기업에 대한 뉴스 기사 분석을 통해 해당 기업의 부도 위험성을 계산할 수 있으며, 은행은 이를 토대로 기업들에 대한 신용평가를 수행할 수 있으며 기업들에 대한 대출 리스크 관리를 보다 강화하여 수행할 수 있다. 또한, 다양한 머신 러닝 알고리즘 중 부도 위험성 계산에 적합한 알고리즘이 선택될 수 있으며, 각각의 뉴스 기사들을 통한 위험 레벨이 독립적으로 계산될 뿐 아니라 뉴스 기사들의 그룹화를 통해 총체적인 부도 위험성이 예측될 수 있다.
본 발명의 실시예와 관련하여 설명된 방법 또는 알고리즘의 단계들은 하드웨어로 직접 구현되거나, 하드웨어에 의해 실행되는 소프트웨어 모듈로 구현되거나, 또는 이들의 결합에 의해 구현될 수 있다. 소프트웨어 모듈은 RAM(Random Access Memory), ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리(Flash Memory), 하드 디스크, 착탈형 디스크, CD-ROM, 또는 본 발명이 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터 판독가능 기록매체에 상주할 수도 있다.
이상, 첨부된 도면을 참조로 하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야의 통상의 기술자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며, 제한적이 아닌 것으로 이해해야만 한다.
100: 부도 예측 장치
200: 사용자 단말기
300: 외부 서버
200: 사용자 단말기
300: 외부 서버
Claims (10)
- 컴퓨팅 시스템에 의해 수행되는, 뉴스 기사들을 기초로 하여 기업의 부도 위험성을 예측하는 방법에 있어서,
인터넷 상에서 복수의 뉴스 기사들을 수집하는 단계;
분석 대상이 되는 기업을 선택하는 단계;
수집된 복수의 뉴스 기사들 중 분석 대상 기업과 관련된 뉴스 기사들을 분석 대상 기사들로 분류하는 단계;
상기 분석 대상 기사들 각각에 대한 위험 레벨을 산출하는 단계;
산출된 위험 레벨을 기준으로 상기 분석 대상 기사들의 그룹화를 수행하여 각 그룹을 나타내는 특성 벡터들을 생성하는 단계; 및
생성된 특성 벡터들을 토대로 상기 분석 대상 기업의 부도 위험성을 계산하는 단계를 포함하며,
산출된 위험 레벨을 기준으로 상기 분석 대상 기사들의 그룹화를 수행하여 각 그룹을 나타내는 특성 벡터들을 생성하는 단계는,
상기 분석 대상 기사들에 대해 산출된 위험 레벨을 기초로 하여, 위험 레벨을 복수의 구간으로 분류하고 이를 통해 상기 분석 대상 기사들의 그룹화를 수행하는 단계를 더 포함하는, 기업의 부도 위험성 예측 방법.
- 제1항에 있어서,
상기 분석 대상 기사들 각각에 대한 위험 레벨을 산출하는 단계는,
특정 머신 러닝 알고리즘을 채택하고 채택한 머신 러닝 알고리즘을 이용하여 수집된 뉴스 기사들에 대해 회귀 또는 항목화 분석을 수행한 뒤, 상기 회귀 또는 항목화 분석을 통해 도출된 위험 산출 알고리즘을 이용하여 상기 분석 대상 기사들 각각에 대한 위험 레벨을 산출하는 것인, 기업의 부도 위험성 예측 방법.
- 제2항에 있어서,
수집된 뉴스 기사들에 대해 회귀 또는 항목화 분석을 수행함에 있어, 부도가 발생한 기업과 관련된 뉴스 기사들 중 해당 기업의 부도로부터 일정 시간 이내에 발행된 뉴스 기사들만을 분석 대상으로 선택하는 단계를 더 포함하는, 기업의 부도 위험성 예측 방법.
- 제1항에 있어서,
수집된 복수의 뉴스 기사들 중 분석 대상 기업과 관련된 뉴스 기사들을 분석 대상 기사들로 분류하는 단계는,
상기 분석 대상 기업의 명칭이 포함된 뉴스 기사들을 선별하는 단계; 및
선별된 뉴스 기사들 각각에 대해 상기 분석 대상 기업과 관련 있는 기사인지 판단하는 단계를 더 포함하는, 기업의 부도 위험성 예측 방법.
- 제4항에 있어서,
선별된 뉴스 기사들 각각에 대해 상기 분석 대상 기업과 관련 있는 기사인지 판단하는 단계는,
선별된 뉴스 기사들 각각에 대한 문맥 또는 주제를 식별하고, 식별된 문맥 또는 주제가 상기 분석 대상 기업 정보와 연관이 있는지 여부를 판단하는 단계를 더 포함하는, 기업의 부도 위험성 예측 방법.
- 삭제
- 제1항에 있어서,
상기 위험 레벨을 복수의 구간으로 분류하는 단계는,
상기 분석 대상 기업이 속하는 산업의 종류에 따라 상이한 방식으로 분류를 수행하는 것을 특징으로 하는, 기업의 부도 위험성 예측 방법.
- 제1항에 있어서,
생성된 특성 벡터들을 토대로 상기 분석 대상 기업의 부도 위험성을 계산하는 단계는,
그룹화가 수행된 분석 대상 기사들의 특성 벡터들을 의사 결정 나무 알고리즘을 통해 분류한 뒤 분류 결과를 기초로 하여 상기 분석 대상 기업의 부도 위험성 예측값을 산출함에 있어 의사 결정 나무의 같은 가지 내에서 동일한 클래스가 나타날 확률을 기초로 상기 분석 대상 기업의 부도 위험성 예측값을 산출하는 단계를 더 포함하는, 기업의 부도 위험성 예측 방법.
- 제8항에 있어서,
그룹화가 수행된 분석 대상 기사들의 특성 벡터들을 의사 결정 나무 알고리즘을 통해 분류하는 단계는,
상기 분석 대상 기사들의 그룹에 대해 생성된 특성 벡터들을 포함하는 데이터를 n개로 분류한 뒤 n개의 데이터 집합에 대해 교차 검증(n-Cross Validation) 방식으로 의사 결정 나무(Decision Tree) 알고리즘을 적용하여 특성 벡터들을 분류하는 단계를 더 포함하는, 기업의 부도 위험성 예측 방법.
- 뉴스 기사들을 기초로 하여 기업의 부도 위험성을 예측하는 컴퓨팅 시스템에 있어서,
인터넷 상에서 복수의 뉴스 기사들을 수집하는 뉴스 기사 수집부;
분석 대상이 되는 기업을 선택하는 분석 기업 선정부;
수집된 복수의 뉴스 기사들 중 분석 대상 기업과 관련된 뉴스 기사들을 분석 대상 기사들로 분류하는 분석 대상 기사 분류부;
상기 분석 대상 기사들 각각에 대한 위험 레벨을 산출하는 위험 레벨 산출부;
산출된 위험 레벨을 기준으로 상기 분석 대상 기사들의 그룹화를 수행하여 각 그룹을 나타내는 특성 벡터를 생성하는 특성 벡터 생성부; 및
생성된 특성 벡터를 토대로 상기 분석 대상 기업의 부도 위험성을 계산하는 부도 위험성 예측부를 포함하며,
상기 특성 벡터 생성부는, 상기 분석 대상 기사들에 대해 산출된 위험 레벨을 기초로 하여, 위험 레벨을 복수의 구간으로 분류하고 이를 통해 상기 분석 대상 기사들의 그룹화를 수행하는 것을 특징으로 하는, 컴퓨팅 시스템.
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180159763A KR102168198B1 (ko) | 2018-12-12 | 2018-12-12 | 기업 부도 예측 시스템 및 이의 동작 방법 |
JP2019197263A JP6783002B2 (ja) | 2018-12-12 | 2019-10-30 | 企業の債務不履行予測システム及びその動作方法 |
US16/667,934 US11481707B2 (en) | 2018-12-12 | 2019-10-30 | Risk prediction system and operation method thereof |
EP19816190.3A EP3726441A4 (en) | 2018-12-12 | 2019-12-02 | CORPORATE BANKRUPTCY PREDICTION SYSTEM AND CORRESPONDING METHOD OF OPERATION |
CN201980003011.6A CN111557011A (zh) | 2018-12-12 | 2019-12-02 | 企业破产预测系统及其运行方法 |
PCT/KR2019/016825 WO2020122487A1 (ko) | 2018-12-12 | 2019-12-02 | 기업 부도 예측 시스템 및 이의 동작 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180159763A KR102168198B1 (ko) | 2018-12-12 | 2018-12-12 | 기업 부도 예측 시스템 및 이의 동작 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200075120A KR20200075120A (ko) | 2020-06-26 |
KR102168198B1 true KR102168198B1 (ko) | 2020-10-20 |
Family
ID=71071654
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180159763A KR102168198B1 (ko) | 2018-12-12 | 2018-12-12 | 기업 부도 예측 시스템 및 이의 동작 방법 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11481707B2 (ko) |
EP (1) | EP3726441A4 (ko) |
JP (1) | JP6783002B2 (ko) |
KR (1) | KR102168198B1 (ko) |
CN (1) | CN111557011A (ko) |
WO (1) | WO2020122487A1 (ko) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102168198B1 (ko) * | 2018-12-12 | 2020-10-20 | 지속가능발전소 주식회사 | 기업 부도 예측 시스템 및 이의 동작 방법 |
CN113642819A (zh) * | 2020-05-11 | 2021-11-12 | 上海华力集成电路制造有限公司 | 连环许容时间区段站点异常时产品自动调度装置和方法 |
US20220180232A1 (en) * | 2020-12-08 | 2022-06-09 | Intuit Inc. | Forecasting based on bernoulli uncertainty characterization |
KR102505632B1 (ko) * | 2021-01-14 | 2023-03-03 | 사단법인 한국신용정보원 | 신용정보를 활용한 인공 지능 모형 기반 개인사업자 부도율 예측 방법 및 장치 |
WO2023097353A1 (en) * | 2021-12-03 | 2023-06-08 | Batnav Pty Ltd | A method for curating information |
CN116777608A (zh) * | 2023-08-25 | 2023-09-19 | 北京佳格天地科技有限公司 | 基于大数据的农业金融风险监管系统、方法及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003216804A (ja) * | 2002-01-24 | 2003-07-31 | Teikoku Databank Ltd | 定性データを使用した倒産確率予測システム |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5753164A (en) * | 1980-09-17 | 1982-03-30 | Mitsubishi Electric Corp | Bus terminating system |
US7325755B2 (en) * | 2004-09-02 | 2008-02-05 | Green Industry Innovators, L.L.C. | Rotary tool for spreading particulate materials and method of using the same |
KR100771506B1 (ko) * | 2006-02-13 | 2007-10-30 | 주식회사 디알에프앤 | 뉴스를 이용한 증권정보 제공시스템 |
KR20090001940A (ko) * | 2007-05-29 | 2009-01-09 | 주식회사 신한은행 | 부실여신 거래 기업의 사전 선정 방법 및 시스템과 이를위한 기록매체 |
JP5084587B2 (ja) * | 2008-03-31 | 2012-11-28 | 株式会社野村総合研究所 | 取引先リスク管理装置 |
US8266148B2 (en) | 2008-10-07 | 2012-09-11 | Aumni Data, Inc. | Method and system for business intelligence analytics on unstructured data |
US20120316916A1 (en) | 2009-12-01 | 2012-12-13 | Andrews Sarah L | Methods and systems for generating corporate green score using social media sourced data and sentiment analysis |
US8671040B2 (en) * | 2010-07-23 | 2014-03-11 | Thomson Reuters Global Resources | Credit risk mining |
US11257161B2 (en) * | 2011-11-30 | 2022-02-22 | Refinitiv Us Organization Llc | Methods and systems for predicting market behavior based on news and sentiment analysis |
US9400826B2 (en) | 2013-06-25 | 2016-07-26 | Outside Intelligence, Inc. | Method and system for aggregate content modeling |
CA2987838A1 (en) * | 2015-06-11 | 2017-02-02 | Jochen L. LEIDNER | Risk identification and risk register generation system and engine |
KR101741509B1 (ko) | 2015-07-01 | 2017-06-15 | 지속가능발전소 주식회사 | 뉴스의 데이터마이닝을 통한 기업 평판 분석 장치 및 방법, 그 방법을 수행하기 위한 기록 매체 |
KR101599675B1 (ko) | 2015-07-02 | 2016-03-03 | 한국기업데이터 주식회사 | 빅 데이터 기술에 기반한 기업 뉴스 검색 기술을 이용한 기업 신용 위험도 예측 장치 및 방법 |
EP3470865B1 (en) * | 2016-03-14 | 2020-03-11 | Jeol Ltd. | Inductive coupling in multiple resonance circuits in a nuclear magnetic resonance probe and methods of use |
US11195401B2 (en) * | 2017-09-27 | 2021-12-07 | Johnson Controls Tyco IP Holdings LLP | Building risk analysis system with natural language processing for threat ingestion |
KR102168198B1 (ko) * | 2018-12-12 | 2020-10-20 | 지속가능발전소 주식회사 | 기업 부도 예측 시스템 및 이의 동작 방법 |
KR102105319B1 (ko) * | 2019-09-20 | 2020-04-28 | 지속가능발전소 주식회사 | Esg 기반의 기업 평가 수행 장치 및 이의 작동 방법 |
US11175152B2 (en) * | 2019-12-03 | 2021-11-16 | Zendrive, Inc. | Method and system for risk determination of a route |
-
2018
- 2018-12-12 KR KR1020180159763A patent/KR102168198B1/ko active IP Right Grant
-
2019
- 2019-10-30 JP JP2019197263A patent/JP6783002B2/ja active Active
- 2019-10-30 US US16/667,934 patent/US11481707B2/en active Active
- 2019-12-02 CN CN201980003011.6A patent/CN111557011A/zh active Pending
- 2019-12-02 EP EP19816190.3A patent/EP3726441A4/en active Pending
- 2019-12-02 WO PCT/KR2019/016825 patent/WO2020122487A1/ko unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003216804A (ja) * | 2002-01-24 | 2003-07-31 | Teikoku Databank Ltd | 定性データを使用した倒産確率予測システム |
Also Published As
Publication number | Publication date |
---|---|
EP3726441A1 (en) | 2020-10-21 |
WO2020122487A1 (ko) | 2020-06-18 |
CN111557011A (zh) | 2020-08-18 |
JP2020095693A (ja) | 2020-06-18 |
JP6783002B2 (ja) | 2020-11-11 |
EP3726441A4 (en) | 2021-02-17 |
US20200193340A1 (en) | 2020-06-18 |
KR20200075120A (ko) | 2020-06-26 |
US11481707B2 (en) | 2022-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102168198B1 (ko) | 기업 부도 예측 시스템 및 이의 동작 방법 | |
US11093845B2 (en) | Tree pathway analysis for signature inference | |
CN106095942B (zh) | 强变量提取方法及装置 | |
CN111461216A (zh) | 一种基于机器学习的案件风险识别方法 | |
CN111738331A (zh) | 用户分类方法及装置、计算机可读存储介质、电子设备 | |
CN112561685B (zh) | 客户的分类方法和装置 | |
KR102330423B1 (ko) | 이미지 인식 딥러닝 알고리즘을 이용한 온라인 부도 예측 시스템 | |
CN111222994A (zh) | 客户风险评估方法、装置、介质和电子设备 | |
Xu et al. | A hybrid interpretable credit card users default prediction model based on RIPPER | |
Chern et al. | A decision tree classifier for credit assessment problems in big data environments | |
KR20190134934A (ko) | 딥 러닝과 부스티드 디시즌 트리를 활용한 고객이탈 예측장치 및 이를 이용한 고객이탈 예측방법 | |
Khademolqorani et al. | A hybrid analysis approach to improve financial distress forecasting: Empirical evidence from Iran | |
US20230385664A1 (en) | A computer-implemented method for deriving a data processing and inference pipeline | |
KR102409019B1 (ko) | 금융 거래 위험 평가 시스템과 방법 및 이를 위한 컴퓨터 프로그램 | |
CN117726426A (zh) | 信用评估方法、装置、电子设备及存储介质 | |
Kazemi et al. | Estimation of optimum thresholds for binary classification using genetic algorithm: An application to solve a credit scoring problem | |
CN117132383A (zh) | 一种信贷数据处理方法、装置、设备及可读存储介质 | |
US11449743B1 (en) | Dimensionality reduction for statistical modeling | |
CN114022712A (zh) | 用户分类方法、装置、计算机设备和存储介质 | |
CN112668796A (zh) | 回款预测方法及系统 | |
KR102714099B1 (ko) | 시계열 데이터 기반 금융 이상 탐지 시스템 | |
Kaisar et al. | Explainable Machine Learning Models for Credit Risk Analysis: A Survey | |
KR102395550B1 (ko) | 기밀정보 분석 방법 및 장치 | |
Liao et al. | Iicofdm: An Interpretable Initial Coin Offerings Fraud Detection Model Based on Random Forest and Shap | |
Booker et al. | Examining ensemble models to detect credit card fraudulent transactions. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |