KR102330423B1 - Online default forecasting system using image recognition deep learning algorithm - Google Patents
Online default forecasting system using image recognition deep learning algorithm Download PDFInfo
- Publication number
- KR102330423B1 KR102330423B1 KR1020200037979A KR20200037979A KR102330423B1 KR 102330423 B1 KR102330423 B1 KR 102330423B1 KR 1020200037979 A KR1020200037979 A KR 1020200037979A KR 20200037979 A KR20200037979 A KR 20200037979A KR 102330423 B1 KR102330423 B1 KR 102330423B1
- Authority
- KR
- South Korea
- Prior art keywords
- company
- default
- deep learning
- information
- model
- Prior art date
Links
- 238000013135 deep learning Methods 0.000 title claims abstract description 25
- 238000004422 calculation algorithm Methods 0.000 title abstract description 15
- 238000013136 deep learning model Methods 0.000 claims description 43
- 238000000034 method Methods 0.000 claims description 41
- 238000012549 training Methods 0.000 claims description 27
- 230000008569 process Effects 0.000 claims description 18
- 238000007781 pre-processing Methods 0.000 claims description 11
- 238000002372 labelling Methods 0.000 claims description 7
- 238000013256 Gubra-Amylin NASH model Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 5
- 238000012550 audit Methods 0.000 claims description 4
- 230000000306 recurrent effect Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 230000007774 longterm Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000002085 persistent effect Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000000491 multivariate analysis Methods 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000007473 univariate analysis Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000000611 regression analysis Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241000499489 Castor canadensis Species 0.000 description 1
- 235000011779 Menyanthes trifoliata Nutrition 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003042 antagnostic effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000059 patterning Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Tourism & Hospitality (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Technology Law (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
이미지 인식 딥러닝 알고리즘을 이용한 온라인 부도 예측 시스템은, 부도 기업의 재무제표 정보를 수집하고, 상기 부도 기업의 재무제표 정보를 이용하여 딥러닝 부도예측 모델을 훈련하고, 상기 딥러닝 부도예측 모델을 이용하여 의뢰 기업의 재무제표 정보에 대한 부도 예측 정보를 제공할 수 있다.An online default prediction system using an image recognition deep learning algorithm collects financial statement information of a bankrupt company, trains a deep learning default prediction model using the financial statement information of the defaulted company, and uses the deep learning default prediction model In this way, it is possible to provide information on forecasting defaults on the financial statement information of the client company.
Description
아래의 설명은 온라인 상에서 제공된 재무제표를 토대로 당해 기업의 부도 예측 가능성을 제공하는 기술에 관한 것이다.The description below relates to a technology that provides predictability of a company's default based on financial statements provided online.
1960년대 이후 꾸준히 회계정보를 활용한 부도예측기법이 시도되어 왔는데, 먼저, 비버(William Beaver)는 1966년 프로파일 분석(Profile Analysis)을 발표했다. 비버의 연구는 1954년부터 1964년까지를 연구설정기간으로 하고, 파산, 사채 원금의 미지급, 부도, 우선주 배당금의 미지급을 도산으로 정의하였다. 이를 통해 도산기업과 생존기업 간에 통계적으로 유의한 평균값이 차이가 나는 재무비율이 무엇인지를 파악하는 형태로 부도예측 모델을 수립하였다. 비버의 연구는 일변량 모형으로서 기업의 도산을 예측하기 위해 한번에 하나씩 재무제표비율을 사용한다.Since the 1960s, default prediction techniques using accounting information have been continuously tried. First, William Beaver published Profile Analysis in 1966. Bieber's study defined the period from 1954 to 1964 as the research period, and defined bankruptcy, non-payment of principal of bonds, bankruptcy, and non-payment of preferred stock dividends as bankruptcy. Through this, a model for predicting bankruptcy was established in the form of identifying the financial ratio with a statistically significant difference between the bankrupt company and the surviving company. Bieber's study is a univariate model that uses financial statement ratios one at a time to predict a company's bankruptcy.
그러나, 일변량 연구로는 예측의 정확도를 향상시킬 수 없고, 다양한 변수간의 복합적인 효과로 나타나는 기업부도 현상을 설명하기 힘들다. 즉, 일변량 분석은 파산을 예측하는데 있어서 개별 재무제표비율의 상대적인 중요성을 측정하거나 또는 이를 결합하는 수단을 제공하지는 못한다. 예를 들어, 유동비율과 부채비율이 높은 기업과 유동비율과 부채비율이 낮은 기업 중에서 어느 기업이 파산위험이 더 높은지에 대해서 일변량 분석은 어떤 결과도 제공하지 못한다.However, univariate studies cannot improve the accuracy of prediction, and it is difficult to explain the corporate bankruptcy phenomenon that appears as a complex effect among various variables. In other words, univariate analysis does not provide a means to measure or combine the relative importance of individual financial statement ratios in predicting bankruptcy. For example, a univariate analysis does not provide any results as to which company has a higher bankruptcy risk, a company with a high current and debt ratio and a company with a low current and debt ratio.
이후, 다변량 판별분석이 일종인 알츠만의 z-score를 시작으로 본격적인 다변량 모형의 개발이 이뤄졌다. 이는 판별분석의 일종으로서 그의 모형에서는 5개의 재무비율을 사용하며 모형의 설명력을 최대화하기 위해 각 비율에 대해 가중치가 부여되며, Z 점수라는 전반적인 판별점수가 계산된다. 이러한 장점에도 불구하고 다변량 분석은 다음과 같은 한계를 갖는다. 첫째, 일변량 분석에서와 마찬가지로 다변량 분석이 파산과 관련한 모든 관련된 재무제표비율을 포함하고 있다고 확신할 수 없다. 둘째, 파산한 기업과 그렇지 않은 기업을 구별할 수 있는 점수를 주관적으로 판단해야 한다. 셋째, 비상장기업의 경우에는 주주지분의 시장가치를 알 수 없기 때문에 적용이 불가능하다.After that, a full-scale multivariate model was developed, starting with Alzheimer's z-score, a type of multivariate discriminant analysis. This is a kind of discriminant analysis, and his model uses five financial ratios, weights are given to each ratio to maximize the explanatory power of the model, and an overall discriminant score called Z score is calculated. Despite these advantages, multivariate analysis has the following limitations. First, as with univariate analysis, we cannot be sure that multivariate analysis includes all relevant financial statement ratios related to bankruptcy. Second, it is necessary to subjectively judge the score that can distinguish between a bankrupt company and a non-bankrupt company. Third, it cannot be applied to unlisted companies because the market value of the shareholder's shares is unknown.
파산을 예측하는 연구의 방향은 1980년대와 1990년대 초에 걸쳐서 로짓 모형(logit model)을 사용하는 것으로 발전하고 있다. 로짓 분석은 다변량 분석과는 달리 파산가능성을 확률로 나타내기 때문에 보다 이해하기 쉽다는 장점이 있다. 1960년대의 비버의 연구와 다른 점은 다양한 변수를 독립변수로 활용한다는 점이다. 중회귀분석의 일종인 로지스틱 회귀분석은 종속변수가 두 개의 반응범주로 나타나는 질적변수(이변량)인 경우에 사용되는 회귀분석 방법인 로짓(logit) 회귀식을 이용하는 것이며, 계산된 로짓을 확률로 변환할 경우 그 값이 0.5를 넘을 경우 부도기업으로 분류되는 것이다.The direction of research for predicting bankruptcy is developing to use the logit model during the 1980s and early 1990s. Unlike multivariate analysis, logit analysis has the advantage of being easier to understand because it expresses the probability of bankruptcy as a probability. The difference from Beaver's research in the 1960s is that various variables are used as independent variables. Logistic regression analysis, a type of multiple regression analysis, uses the logit regression equation, a regression analysis method used when the dependent variable is a qualitative variable (bivariate) that appears in two response categories, and converts the calculated logit into probability. In the case of conversion, if the value exceeds 0.5, it is classified as a bankrupt company.
최근에는 이러한 로짓 모형을 다수 생성한 후 각 모형의 부도 또는 생존 판단을 집계하여 다수결로 부도를 예측하는 랜덤 포레스트(random forest) 등 앙상블(ensemble) 기법이 주류를 이루고 있다. 현재까지 개발된 기법 중에는 가장 높은 부도예측율을 나타내고 있다.Recently, ensemble techniques such as random forest, which predict default by majority vote by generating a plurality of such logit models and then accumulating default or survival judgments of each model, are mainstream. Among the techniques developed so far, it has the highest default prediction rate.
이상을 정리해보면, 그간의 부도예측 기법은 독립변수의 양을 늘리는 방향과 새로운 알고리즘을 개발하는 방식 등 크게 2가지 방향으로 전개되어 왔다. 그러나 최근 적용사례가 많아진 랜덤 포레스트 기법조차도 실상은 각 모형에서 이용하는 독립변수의 양은 제한적이며, 다만 저마다의 모형에서 다른 독립변수를 부분적으로 활용함으로써 간접적으로나마 전체 독립변수를 모두 포괄하고 있는 것이다. 이용 가능한 모든 변수를 부도예측에 활용하고자 하는 시도는 기업의 재무비율 중에서 어떤 요인으로 말미암아 기업이 부도에 이르게 되었는지를 확정적으로 단정하기 어렵기 때문이다. 따라서 전체 변수를 모두 고려하여 이들 간의 복합적인 상호작용에 의한 부도 발생을 예측하는 혁신적인 방식의 접근이 필요한 이유다.Summarizing the above, default prediction techniques have been developed in two major directions: increasing the amount of independent variables and developing new algorithms. However, even the random forest technique, which has recently been applied in many cases, is actually limited in the amount of independent variables used in each model. This is because it is difficult to definitively determine which factors among a company's financial ratio led to bankruptcy in an attempt to use all available variables for default prediction. Therefore, it is necessary to take an innovative approach to predict the occurrence of bankruptcy due to the complex interaction between them by considering all variables.
본 발명은 재무비율 및 비재무정보(거시경제 지표, 주가관련 지표, 회계감사, 기타의 외부평가 지표 등)를 포괄하여 독립변수로 삼고, 이들의 다년간 변화양상을 이미지 패턴으로 인식하여 장단기 부도가능성을 판단하는 알고리즘으로서 이미지 인식에 사용되는 딥러닝 기법을 부도예측에 맞게 구성하는 방식과 절차, 그리고 이를 온라인 서비스로 제공할 수 있는 모델을 제공한다.The present invention includes the financial ratio and non-financial information (macroeconomic indicators, stock price-related indicators, accounting audits, other external evaluation indicators, etc.) as independent variables, and recognizes their multi-year changes as image patterns to reduce the possibility of long-term and short-term default. It provides a method and procedure for configuring the deep learning technique used for image recognition as an algorithm to determine default according to default prediction, and a model that can provide it as an online service.
컴퓨터 시스템에 있어서, 메모리에 포함된 컴퓨터 판독 가능한 명령을 실행하도록 구현되는 적어도 하나의 프로세서를 포함하고, 상기 적어도 하나의 프로세서는, 부도 기업의 재무제표 정보를 수집하는 과정; 상기 부도 기업의 재무제표 정보를 이용하여 딥러닝 부도예측 모델을 훈련하는 과정; 및 상기 딥러닝 부도예측 모델을 이용하여 의뢰 기업의 재무제표 정보에 대한 부도 예측 정보를 제공하는 과정을 처리하는 컴퓨터 시스템을 제공한다.A computer system comprising: at least one processor implemented to execute computer readable instructions contained in a memory, the at least one processor comprising: collecting financial statement information of a bankrupt company; training a deep learning default prediction model using the financial statement information of the defaulted company; and using the deep learning default prediction model to provide a computer system for processing the process of providing default prediction information for the financial statement information of the client company.
일 측면에 따르면, 상기 적어도 하나의 프로세서는, 기업의 재무제표 정보를 보유한 기관의 데이터베이스 시스템과 연동하여 상기 데이터베이스 시스템으로부터 상기 부도 기업의 재무제표 정보를 수집할 수 있다.According to one aspect, the at least one processor may collect the financial statement information of the bankrupt company from the database system in conjunction with the database system of the institution holding the financial statement information of the company.
다른 측면에 따르면, 상기 적어도 하나의 프로세서는, 상기 부도 기업의 재무제표 정보를 이미지 인식용 딥러닝 모델에서 인식 가능한 2차원 평면 상의 이미지 픽셀 정보로 전처리할 수 있다. 또한, 재무제표 정보에 추가하여 기업 활동과 관련된 거시경제 지표, 주가관련 지표, 회계감사 또는 기타의 외부평가 지표 등을 별도의 채널(channel) 정보로 2차원 이미지 데이터의 각 픽셀에 추가할 수 있다. 이는 마치 2차원의 이미지라 하더라도 하나의 픽셀이 RGB 등 3개의 값을 가지는 채널 정보를 가지고 있어서 사실상 3차원의 정보를 가지는 것과 유사한 원리다.According to another aspect, the at least one processor may pre-process the financial statement information of the bankrupt company into image pixel information on a two-dimensional plane recognizable in a deep learning model for image recognition. In addition, in addition to financial statement information, macroeconomic indicators related to corporate activities, stock price indicators, accounting audit or other external evaluation indicators, etc. can be added to each pixel of the 2D image data as separate channel information. . This is similar to the principle that even if it is a two-dimensional image, one pixel has channel information having three values, such as RGB, so that it actually has three-dimensional information.
또 다른 측면에 따르면, 상기 적어도 하나의 프로세서는, 1년 단위 재무제표 정보 또는 적어도 2년 이상 연속된 재무제표 정보를 이용하여 1년 뒤의 부도 가능성 예측뿐만 아니라 2년 또는 그 이상의 중장기 예측에도 정확성이 향상된 부도예측 엔진을 생성할 수 있다.According to another aspect, the at least one processor is configured to be accurate not only in predicting the probability of default after one year, but also in the mid- to long-term forecast of two years or more, using the annual financial statement information or the financial statement information continuous for at least two years or more. This improved default prediction engine can be created.
또 다른 측면에 따르면, 상기 적어도 하나의 프로세서는, 상기 부도 기업의 연도 별 재무제표 정보를 입력으로 하고 부도 여부, 부도발생 예상시점, 부도 유형 중 적어도 하나에 대한 라벨링(labeling)을 출력으로 하여 딥러닝 모델을 훈련할 수 있다.According to another aspect, the at least one processor receives the financial statement information for each year of the defaulting company as an input and outputs labeling for at least one of default status, default occurrence time, and default type to dip You can train a learning model.
또 다른 측면에 따르면, 상기 적어도 하나의 프로세서는, GAN(generative adversarial network) 모델을 이용하여 상기 부도 기업의 일부 누락된 재무제표 정보를 생성할 수 있다. 가상의 이미지 생성에 사용되는 GAN 모델을 이용하여 부도예측 판별대상 기업의 재무비율 정보가 일부 누락이 있어도, 학습된 내용에 따라 누락부분을 생성할 수 있다. 이를 통해 일부 누락된 재무제표가 입력되거나 불충분한 재무비율정보가 입력되더라도 부도예측이 가능하게 하는 것 및 부도기업의 재무제표 전체를 가상으로 생성하여 CNN 등 다양한 딥러닝 모델에 입력하여 부도기업 판별력 향상을 도모할 수 있다. GAN 모델을 활용하여 일부 누락된 재무비율정보의 복원에 그치지 않고 부도기업과 유사한 가상기업의 재무비율 전체를 생성할 수 있다. 이러한 가상의 부도기업 재무비율 정보를 CNN기반의 딥러닝 모델에 입력하여 부도예측 엔진의 학습에 사용하도록 한다. 가상 기업의 재무비율 정보는 부도기업의 재무비율과 유사할 뿐 실제 부도기업은 아니므로, CNN은 이를 부도기업으로 분류하지 않도록 학습하도록 한다. 이처럼 GAN과 CNN은 서로를 속이거나 속지 않아야 하는 적대적 관계에 있도록 목적함수(loss function)를 설정하고, 그에 따라 GAN과 CNN이 상호 경쟁적으로 학습하는 과정에서 CNN의 부도예측 능력은 더욱 강화되는 효과를 기대할 수 있다.According to another aspect, the at least one processor may generate some missing financial statement information of the defaulted company using a generative adversarial network (GAN) model. Using the GAN model used to create a virtual image, even if there is some omission in the financial ratio information of the company subject to default prediction, it is possible to create the missing part according to the learned content. Through this, it is possible to predict default even if some missing financial statements are input or insufficient financial ratio information is input. can promote By using the GAN model, it is possible to create the entire financial ratio of a virtual company similar to a bankrupt company, rather than just restoring some missing financial ratio information. This virtual bankruptcy company financial ratio information is input to the CNN-based deep learning model and used for learning the default prediction engine. Since the financial ratio information of a hypothetical company is similar to that of a bankrupt company, but not an actual bankrupt company, CNN learns not to classify it as a bankrupt company. As such, the GAN and CNN set the loss function so that they are in an antagonistic relationship that should not deceive or deceive each other. can be expected
그리고, GAN 모델을 이용하여 잠재공간(latent space) 상에서 잠재변수들 간의 연산과정(arithmetic process)을 통해 부도예측을 추정하는 모델을 생성할 수 있다. 학습이 완료된 데이터 잠재공간 상에서 잠재변수들 간의 다양한 연산과정을 통해, 새롭게 합성된 잠재변수벡터를 구할 수 있는 GAN의 특성을 부도예측에 이용한다. 일례로, 학습이 완료된 중소기업 부도예측 잠재변수 벡터가 있다면, 중소기업의 일반적인 특성을 제거하고, 스타트업의 일반적인 특성을 가산하는 형태로 스타트업의 부도를 추정할 수 있는 대용(proxy) 모델을 도출할 수 있다. 이는 신생 스타트업 등 아직 부도 데이터가 축적되지 않아 부도율 예측이 불가능한 경우에 부도율을 추정할 수 있는 모델로 활용이 가능하다.And, it is possible to generate a model for estimating default prediction through an arithmetic process between latent variables in a latent space using the GAN model. In the latent space of data where learning has been completed, the characteristics of GAN that can obtain a newly synthesized latent variable vector through various computational processes between latent variables are used for default prediction. For example, if there is a latent variable vector for predicting bankruptcy of small and medium-sized enterprises (SMEs) that have been trained, it is possible to derive a proxy model that can estimate the default of startups in the form of removing general characteristics of small and medium-sized enterprises and adding general characteristics of startups. can This can be used as a model for estimating the default rate when it is impossible to predict the default rate because default data has not yet been accumulated, such as a new startup.
또 다른 측면에 따르면, 상기 적어도 하나의 프로세서는, RNN(recurrent neural network) 모델을 이용하여 상기 딥러닝 부도예측 모델의 딥러닝 모델 파라미터(model parameter)와 하이퍼 파라미터(hyper parameter)를 수정할 수 있다.According to another aspect, the at least one processor may modify a deep learning model parameter and a hyper parameter of the deep learning default prediction model using a recurrent neural network (RNN) model.
첫째, 기업의 재무비율지표 전체를 모두 포괄하여 직접적으로 부도 예측에 활용함으로써 높은 부도예측 정확도를 기대할 수 있다.First, high default forecasting accuracy can be expected by directly using the entire financial ratio index of a company to predict default.
둘째, 기업의 탄생에서부터 지속적으로 재무비율지표를 수집하고, 전체 수명주기 내에서 보여주는 재무비율지표의 변화양상을 마치 이미지의 변화로 인식하여, 딥러닝이 부도예상기업에 해당하는지를 알려주므로 부도예측의 조기경보가 가능하다. 이는 부도 직전에서야 예측이 가능한 현재의 부도예측시스템의 예측기간에 비해 월등한 능력을 기대할 수 있다. 이는 정보를 인위적으로 선별하거나 축약하여 입력하지 않고, 재무제표 정보 전체를 입력하여, 다양한 지표 간의 영향력 관계를 패턴화 하여 이미지 형태 그 자체로서 분석하는 알고리즘을 적용하기 때문이다. 일례로 부도기업의 재무비율에 있어서 특정연도에만 나타나고 이후에는 나타나지 않는 특이한 재무비율이 있거나, 부도시점보다 훨씬 이전에 발생하는 재무비율상의 고유 패턴 있는 경우에도 입력데이터. 전체를 하나의 연속적인 이미지로 판단하고 패턴을 발견해 나가는 이미지 인식 딥러닝에 있어서는 전혀 문제가 되지 않는다.Second, it continuously collects financial ratio indicators from the birth of a company and recognizes the changes in financial ratio indicators within the entire life cycle as if it is a change in image, and informs whether deep learning corresponds to a company expected to default, so Early warning is possible. This can be expected to have superior capabilities compared to the forecast period of the current default forecasting system, which can predict only just before bankruptcy. This is because the algorithm is applied to analyze the image itself by patterning the influence relationship between various indicators by inputting the entire financial statement information rather than artificially selecting or shortening the information. For example, in the case of a bankrupt company's financial ratio, input data even if there is a unique financial ratio that appears only in a specific year and does not appear thereafter, or if there is a unique pattern in the financial ratio that occurs long before the time of bankruptcy. It is not a problem at all in image recognition deep learning that judges the whole as one continuous image and discovers patterns.
셋째, 스타트업 및 비상장기업과 같은 재무비율정보가 일부만 존재하는 기업에 대한 부도예측에 대해서도 부도예측이 가능하다. 일례로 이미지 인식기법 중의 하나인 GAN(generative adversarial network)의 경우 일부 누락된 이미지 픽셀에 대한 생성과 조합이 가능하므로 이를 통해 부도예측알고리즘의 탐지에 활용할 수 있다.Third, it is possible to predict bankruptcy for companies with only partial financial ratio information, such as startups and unlisted companies. For example, in the case of a generative adversarial network (GAN), which is one of the image recognition techniques, it is possible to generate and combine some missing image pixels, so it can be used for the detection of a fraud prediction algorithm.
이처럼, 기업의 부도예측의 정확도를 높이고, 예측기간을 늘려서 조기경보를 가능케 하고, 부도예측 대상기업을 스타트업이나 비상장기업과 같은 재무비율지표의 부분적 확보기업에까지도 늘림으로써 부도예측의 범위를 늘릴 수 있다는 장점으로 인해 부도예측의 활용성을 크게 높일 수 있다.In this way, the scope of default forecasting can be increased by increasing the accuracy of corporate default forecasting, extending the forecast period to enable early warning, and extending the default forecast target companies to companies that have partially secured financial ratio indicators such as startups and unlisted companies. Due to the advantage of being able to do so, the utility of default forecasting can be greatly increased.
특히, 스타트업이나 비상장기업의 경우, 마땅한 부도예측 데이터 확보가 힘들어서 이들 기업은 대출심사에서 기업의 성장가능성에도 불구하고 대출이 거절되는 경우가 많다. 따라서 부분적 재무정보 하에서도 부도를 예측을 할 수 있는 본 특허로 말미암아 이들 기업에 대한 부도예측과 대출의 승인, 더 나아가 스타트업 활성화까지 기대할 수 있다.In particular, in the case of start-ups or unlisted companies, it is difficult to obtain adequate data for predicting bankruptcy, so loans are often rejected by these companies in the loan review despite the company's growth potential. Therefore, with this patent, which can predict default even under partial financial information, it can be expected to predict default for these companies, approve loans, and even vitalize startups.
이와 같은 방식으로, 현 시장 내에서 존재하는 스타트업이 온라인으로 일정 샘플 수 이상 평가에 참여하면 당해 기업이 실제로 부도가 나서 실제 부도율을 구해야 하는 불편을 피할 수 있고 현시점에서 즉시 부도율 산정이 가능하다.In this way, if startups existing in the current market participate in online evaluation of a certain number of samples or more, the inconvenience of having to find the actual default rate when the company actually goes bankrupt, and the default rate can be calculated immediately at this point.
도 1은 본 발명의 일실시예에 있어서 컴퓨터 시스템의 내부 구성의 일례를 설명하기 위한 블록도이다.
도 2는 본 발명의 일 실시예에 있어서 이미지 인식 딥러닝 알고리즘을 이용한 온라인 부도 예측 시스템의 내부 구성을 설명하기 위한 블록도이다.
도 3은 본 발명의 일 실시예에 있어서 이미지 픽셀과 재무비율 정보의 유사성을 설명하기 위한 예시 도면이다.
도 4는 본 발명의 일 실시예에 있어서 GAN을 이용한 재무제표 정보의 누락된 부분을 복원하는 원리를 설명하기 위한 예시 도면이다.
도 5 내지 도 9는 본 발명의 일 실시예에 있어서 부도예측 훈련 과정을 설명하기 위한 예시 도면이다.
도 10은 본 발명의 일 실시예에 있어서 딥러닝 모델을 이용하여 부도예측 결과를 제공하는 과정을 설명하기 위한 예시 도면이다.1 is a block diagram illustrating an example of an internal configuration of a computer system according to an embodiment of the present invention.
2 is a block diagram for explaining the internal configuration of an online default prediction system using an image recognition deep learning algorithm according to an embodiment of the present invention.
3 is an exemplary diagram for explaining the similarity between image pixels and financial ratio information according to an embodiment of the present invention.
4 is an exemplary view for explaining the principle of restoring the missing part of financial statement information using GAN in an embodiment of the present invention.
5 to 9 are exemplary views for explaining the default prediction training process in an embodiment of the present invention.
10 is an exemplary diagram for explaining a process of providing a default prediction result using a deep learning model in an embodiment of the present invention.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.
본 발명의 실시예들은 온라인 상에서 기업이 제공하는 자사의 재무제표를 토대로 부도 예측 가능성을 제공하는 기술에 관한 것이다. 온라인 상에서 기업이 제공하는 자사의 재무제표를 토대로 부도 예측 가능성을 제공하는 것이며, 이를 위해 이미지 인식에 활용되는 인공지능 기술을 응용하는 기술이다. 주로 이미지 인식에 활용되는 인공지능 기법의 하나인 딥러닝 기술은 다수의 입력데이터를 통해 이미지를 분류하는 메커니즘을 스스로 학습하는 방식이다. 종래에는 이를 이미지 인식에 활용했으나, 본 실시예에서는 이를 응용하여 기업의 부도예측에 이용할 수 있는 방식을 온라인 상에서 제공하는 것이다.Embodiments of the present invention relate to a technology for providing predictability of bankruptcy based on its financial statements provided by a company online. It is to provide predictability of bankruptcy based on its financial statements provided by companies online, and for this purpose, it is a technology that applies artificial intelligence technology used for image recognition. Deep learning technology, which is one of the artificial intelligence techniques mainly used for image recognition, is a method of self-learning a mechanism for classifying images through a large number of input data. Conventionally, this has been utilized for image recognition, but in this embodiment, a method that can be applied to predict bankruptcy of a company is provided online.
본 실시예에서는 재무비율 독립변수를 모두 포괄하면서 이들 간의 패턴을 인공지능이 인식하는 알고리즘으로서 이미지 인식에 사용되는 딥러닝 기법을 도입하는 방식과 절차, 그리고 이를 온라인으로 이용할 수 있는 모델을 제공한다.In this embodiment, a method and procedure for introducing a deep learning technique used for image recognition as an algorithm that AI recognizes patterns between them while encompassing all financial ratio independent variables, and a model that can be used online are provided.
이미지 인식에 사용되는 딥러닝 알고리즘의 기본적인 형태는 각 픽셀값 전체를 모두 고려하되, 부분적으로 추상화를 실시하여 정보를 요약하고, 이를 다시 합산하여 추상화를 반복하는 형태로 정보를 추출하는 과정을 담고 있다. 이러한 추상성에 기초하여 기업의 재무제표로부터 부도를 결정짓는 핵심 요인을 추출하여 부도예측정보를 IT 인프라와 유무선 장치를 이용하여 온라인으로 실시간으로 제공한다. 이를 위하여, 기업의 매년도 재무제표를 다년간 저장하여 2차원의 시계열 정보로 생성하고, 이를 이미지 인식 딥러닝 알고리즘에서 인식 가능한 2차원 평면 상의 이미지 픽셀정보로 활용할 수 있다. 아울러 비재무정보(거시경제 지표, 주가관련 지표, 회계감사, 기타의 외부평가 지표 등)도 시계열 정보로 저장하여 각 이미지 픽셀에 추가되는 채널정보 형태로 이미지 인식 딥러닝 알고리즘에서 활용하게 된다. 이를 통해 이미지 인식 딥러닝 모델이 기업의 부도판별에 최적화된다.The basic form of the deep learning algorithm used for image recognition includes the process of extracting information in the form of repeating abstraction by taking into account all pixel values, partially abstracting information to summarize information, and summing it again. . Based on this abstraction, the key factors determining default are extracted from the company's financial statements, and default forecast information is provided online in real time using IT infrastructure and wired/wireless devices. To this end, the company's annual financial statements are stored for many years, generated as two-dimensional time series information, and used as image pixel information on a two-dimensional plane recognizable by an image recognition deep learning algorithm. In addition, non-financial information (macroeconomic indicators, stock price indicators, accounting audits, other external evaluation indicators, etc.) is also stored as time series information and used in the image recognition deep learning algorithm in the form of channel information added to each image pixel. Through this, the image recognition deep learning model is optimized for corporate bankruptcy detection.
본 실시예에서는 획일화된 판단기준과 단기적인 예측에 머무르고 있는 기업부도예측의 한계를 극복하고자 아래와 같은 해결과제를 제시하고 있다.In this embodiment, the following solutions are presented in order to overcome the limitations of corporate bankruptcy prediction, which remains in the standardized judgment criteria and short-term prediction.
첫째, 기업의 부도예측에 있어서 중장기적인 부도예측이 가능토록 하고, 둘째, 부도 예측의 정확도를 높이며, 셋째, 상장기업 이외에도 개인사업자나 스타트업의 경우에는 다양한 업종과 기업규모 등 특성에 따른 맞춤형으로 세분화된 부도예측 모델을 개발하고자 한다. 넷째, 중장기 부도예측이 관측되면, 이를 역으로 활용하여 부도기업의 패턴을 따르지 않도록 예방적인 컨설팅 정보를 해당 기업에게 하는 것이다. 이상의 서비스를 IT기반의 모바일 및 PC솔루션으로 구축하여 고객에게 관련정보를 온라인으로 공급하는 것을 목표로 한다.First, it enables mid- to long-term forecasting of bankruptcy in corporate bankruptcy, secondly, it improves the accuracy of default forecasting, and thirdly, in the case of individual entrepreneurs and startups other than listed companies, it is customized according to the characteristics of various industries and corporate sizes, etc. We want to develop a detailed default prediction model. Fourth, when a mid- to long-term default forecast is observed, it is used in reverse to provide preventive consulting information to the relevant company so as not to follow the pattern of the defaulted company. It aims to supply related information to customers online by building the above services as IT-based mobile and PC solutions.
도 1은 본 발명의 일실시예에 있어서 컴퓨터 시스템의 내부 구성의 일례를 설명하기 위한 블록도이다. 예를 들어, 본 발명의 실시예들에 따른 온라인 부도 예측 시스템이 도 1의 컴퓨터 시스템(100)을 통해 구현될 수 있다. 도 1에 도시한 바와 같이, 컴퓨터 시스템(100)은 온라인 부도 예측 방법을 실행하기 위한 구성요소로서 프로세서(110), 메모리(120), 영구 저장 장치(130), 버스(140), 입출력 인터페이스(150), 및 네트워크 인터페이스(160)를 포함할 수 있다.1 is a block diagram illustrating an example of an internal configuration of a computer system according to an embodiment of the present invention. For example, an online default prediction system according to embodiments of the present invention may be implemented through the
프로세서(110)는 온라인 부도 예측을 위한 구성요소로서 명령어들의 시퀀스를 처리할 수 있는 임의의 장치를 포함하거나 그의 일부일 수 있다. 프로세서(110)는 예를 들어 컴퓨터 프로세서, 이동 장치 또는 다른 전자 장치 내의 프로세서 및/또는 디지털 프로세서를 포함할 수 있다. 프로세서(110)는 예를 들어, 서버 컴퓨팅 디바이스, 서버 컴퓨터, 일련의 서버 컴퓨터들, 서버 팜, 클라우드 컴퓨터, 컨텐츠 플랫폼 등에 포함될 수 있다. 프로세서(110)는 버스(140)를 통해 메모리(120)에 접속될 수 있다.
메모리(120)는 컴퓨터 시스템(100)에 의해 사용되거나 그에 의해 출력되는 정보를 저장하기 위한 휘발성 메모리, 영구, 가상 또는 기타 메모리를 포함할 수 있다. 메모리(120)는 예를 들어 랜덤 액세스 메모리(RAM: random access memory) 및/또는 다이내믹 RAM(DRAM: dynamic RAM)을 포함할 수 있다. 메모리(120)는 컴퓨터 시스템(100)의 상태 정보와 같은 임의의 정보를 저장하는 데 사용될 수 있다. 메모리(120)는 예를 들어 온라인 부도 예측을 위한 명령어들을 포함하는 컴퓨터 시스템(100)의 명령어들을 저장하는 데에도 사용될 수 있다. 컴퓨터 시스템(100)은 필요에 따라 또는 적절한 경우에 하나 이상의 프로세서(110)를 포함할 수 있다.
버스(140)는 컴퓨터 시스템(100)의 다양한 컴포넌트들 사이의 상호작용을 가능하게 하는 통신 기반 구조를 포함할 수 있다. 버스(140)는 예를 들어 컴퓨터 시스템(100)의 컴포넌트들 사이에, 예를 들어 프로세서(110)와 메모리(120) 사이에 데이터를 운반할 수 있다. 버스(140)는 컴퓨터 시스템(100)의 컴포넌트들 간의 무선 및/또는 유선 통신 매체를 포함할 수 있으며, 병렬, 직렬 또는 다른 토폴로지 배열들을 포함할 수 있다.
영구 저장 장치(130)는 (예를 들어, 메모리(120)에 비해) 소정의 연장된 기간 동안 데이터를 저장하기 위해 컴퓨터 시스템(100)에 의해 사용되는 바와 같은 메모리 또는 다른 영구 저장 장치와 같은 컴포넌트들을 포함할 수 있다. 영구 저장 장치(130)는 컴퓨터 시스템(100) 내의 프로세서(110)에 의해 사용되는 바와 같은 비휘발성 메인 메모리를 포함할 수 있다. 영구 저장 장치(130)는 예를 들어 플래시 메모리, 하드 디스크, 광 디스크 또는 다른 컴퓨터 판독 가능 매체를 포함할 수 있다.
입출력 인터페이스(150)는 키보드, 마우스, 음성 명령 입력, 디스플레이 또는 다른 입력 또는 출력 장치에 대한 인터페이스들을 포함할 수 있다. 구성 명령들 및/또는 온라인 부도 예측을 위한 입력이 입출력 인터페이스(150)를 통해 수신될 수 있다.The input/
네트워크 인터페이스(160)는 근거리 네트워크 또는 인터넷과 같은 네트워크들에 대한 하나 이상의 인터페이스를 포함할 수 있다. 네트워크 인터페이스(160)는 유선 또는 무선 접속들에 대한 인터페이스들을 포함할 수 있다. 구성 명령들 및/또는 온라인 부도 예측을 위한 입력이 네트워크 인터페이스(160)를 통해 수신될 수 있다.
또한, 다른 실시예들에서 컴퓨터 시스템(100)은 도 1의 구성요소들보다 더 많은 구성요소들을 포함할 수도 있다. 그러나, 대부분의 종래기술적 구성요소들을 명확하게 도시할 필요성은 없다. 예를 들어, 컴퓨터 시스템(100)은 상술한 입출력 인터페이스(150)와 연결되는 입출력 장치들 중 적어도 일부를 포함하도록 구현되거나 또는 트랜시버(transceiver), GPS(Global Positioning System) 모듈, 카메라, 각종 센서, 데이터베이스 등과 같은 다른 구성요소들을 더 포함할 수도 있다.Also, in other embodiments,
이하에서는 이미지 인식 딥러닝 알고리즘을 이용한 온라인 부도 예측 시스템의 구체적인 실시예를 설명하기로 한다.Hereinafter, a specific embodiment of an online default prediction system using an image recognition deep learning algorithm will be described.
도 2는 본 발명의 일 실시예에 있어서 이미지 인식 딥러닝 알고리즘을 이용한 온라인 부도 예측 시스템의 내부 구성을 설명하기 위한 블록도이다. 도 2는 온라인 부도 예측 시스템이 구현된 컴퓨터 시스템(100)의 프로세서(110)가 프로세서가 포함할 수 있는 구성요소의 예를 도시한 도면이다.2 is a block diagram for explaining the internal configuration of an online default prediction system using an image recognition deep learning algorithm according to an embodiment of the present invention. FIG. 2 is a diagram illustrating an example of components that the
도 2에 도시한 바와 같이, 프로세서(110)는 수집모듈(201), 전처리모듈(202), 훈련모듈(203), 서비스모듈(204), 및 피드백모듈(205)를 포함할 수 있다. 이러한 프로세서(110)의 구성요소들은 적어도 하나의 프로그램 코드에 의해 제공되는 제어 명령에 따라 프로세서(110)에 의해 수행되는 서로 다른 기능들(different functions)의 표현들일 수 있다. 예를 들어, 프로세서(110)가 재무제표 정보를 수집하도록 컴퓨터 시스템(100)을 제어하기 위해 동작하는 기능적 표현으로서 수집모듈(201)이 사용될 수 있다.As shown in FIG. 2 , the
프로세서(110) 및 프로세서(110)의 구성요소들은 도 3의 온라인 부도 예측 방법이 포함하는 단계들(S310 내지 S330)을 수행할 수 있다. 예를 들어, 프로세서(110) 및 프로세서(110)의 구성요소들은 메모리(120)가 포함하는 운영체제의 코드와 상술한 적어도 하나의 프로그램 코드에 따른 명령(instruction)을 실행하도록 구현될 수 있다. 여기서, 적어도 하나의 프로그램 코드는 온라인 부도 예측 방법을 처리하기 위해 구현된 프로그램의 코드에 대응될 수 있다.The
수집모듈(201)은 기업 또는 개인사업자의 재무제표 정보를 온라인으로 수집할 수 있다. 수집모듈(201)은 법인 기업이나 개인 사업자의 재무제표 또는 재무비율 등을 포함하는 재무제표 정보를 수집할 수 있다. 수집모듈(201)은 기업의 재무제표 정보를 보유한 기관의 데이터베이스 시스템과 연동하여 해당 기관의 데이터베이스 시스템으로부터 부도 기업의 재무제표 정보를 수집할 수 있다.The
전처리모듈(202)은 수집모듈(201)에서 수집된 재무제표 정보를 다양한 이미지인식용 딥러닝 모델에서 사용 가능한 형태로 전처리할 수 있다. 전처리모듈(202)은 각 기업의 재무제표 또는 재무비율을 이미지로 인식 가능하도록 2차원 시계열 정보로 변환할 수 있다. 딥러닝에 사용되는 이미지 픽셀의 RGB컬러값은 최대 최소값이 동일하다. 따라서, 각 재무비율지표의 변동범위를 고려하여 동일한 값으로 정규화하여 변환한다. 이는 이미지 픽셀의 RGB값을 재무비율지표값으로 대체하여 사용하는 딥러닝 기반의 부도예측에 있어서 일종의 전처리 작업에 해당된다. 또한, 전처리모듈(202)은 모델의 훈련과 선택을 위해서 훈련셋, 검증셋, 테스트셋으로 데이터를 나누는 역할도 담당한다.The
훈련모듈(203)은 전처리모듈(202)에서 전처리된 재무제표 정보를 이용하여 부도 예측을 위한 딥러닝 모델을 훈련하는 것으로, 부도예측율을 높이도록 다양한 딥러닝 모델들의 모델 파라미터와 하이퍼 파라미터를 수정할 수 있다. 훈련모듈(203)은 전처리된 재무제표 정보를 이용하여 딥러닝 알고리즘이 딥러닝 모델 파라미터와 하이퍼 파라미터를 수정하도록 훈련함으로써 부도예측을 담당할 수 있다.The
CNN과 같은 딥러닝 모델 내에는 예측의 정확도를 높이기 위한 다양한 파라미터가 존재한다. 훈련셋을 이용하여 딥러닝 모델 파라미터를 수정하며, 궁극적으로 모델의 예측도를 높일 수 있다. 아울러, 검증셋을 활용하여 훈련된 모델의 실제 예측성능을 검증할 수 있다. 첫째, CNN을 이용해서 부도의 예측기간을 늘리고, 사전예방을 돕는다. 이를 위해서는 다년도 재무제표를 입력으로 넣고, 부도발생 여부, 부도발생 예상시점, 다양한 부도유형(예컨대, 유동성 부족, 자본 잠식 등)을 라벨링해서 출력으로 하여 훈련한다. 따라서, 예측 결과로 단순이 부도 여부는 물론이고 부도 예측 시점이나 원인에 대해 확률을 제공할 수 있다. 둘째, GAN을 이용해서 판별 모델(D모듈)은 부도예측율을 높이고, 생성 모델(G모듈)은 단순한 기준이 아니라 잠재공간에서의 피처(feature) 연산에 의해 훈련셋에는 없는 기업유형(예: 신생스타트업)에 대한 판별여부를 유추할 수 있다. 또한, 훈련셋을 다양한 기준으로 분류하여 부도율을 조사하면 다양한 기준을 조합하여 여러가지 유형의 기업에 대한 부도발생 가능성을 추정할 수 있다. 따라서, 보다 상세한 기준으로 부도율을 예측할 수 있으며, 이를 통해 당장에 부도 데이터가 없어서 부도율 산정이 힘든 초기 신생기업에 대한 부도율 예측이나, 데이터가 있다 하더라도 좀더 다양한 기준에 의한 부도율 예측을 실시할 수 있어 은행대출시스템 등에서 기업에 대한 심사능력을 개선할 수 있다. 특히 SGAN, ACGAN은 부도/생존의 판별뿐만 아니라, 추가적인 one-hot vector형태로서 부도의 유형이나 기업의 규모 등으로 세분화하여 학습할 수 있고, 병행하여 생성 모델과 판별 모델의 경쟁적 학습에 의해 분류정확도를 더 높일 수가 있다.In deep learning models such as CNNs, various parameters exist to increase the accuracy of prediction. By using the training set, the parameters of the deep learning model can be modified, and ultimately the predictability of the model can be increased. In addition, the actual predictive performance of the trained model can be verified by using the verification set. First, it uses CNN to extend the prediction period of bankruptcy and helps prevent it. To do this, the multi-year financial statements are input, and the labeling of whether or not default occurs, the expected time of default, and various default types (eg, lack of liquidity, capital erosion, etc.) Accordingly, as a prediction result, not only simple default, but also a probability of a default prediction timing or cause can be provided. Second, the discriminant model (module D) using GAN increases the predictive rate of default, and the generative model (module G) is not a simple criterion, but a company type that is not in the training set (e.g., new Start-up) can be inferred. In addition, if the default rate is investigated by classifying the training set according to various criteria, it is possible to estimate the probability of default for various types of companies by combining various criteria. Therefore, the default rate can be predicted with a more detailed standard, and through this, it is possible to predict the default rate for early start-ups where it is difficult to calculate the default rate because there is no default data right away, or even if there is data, it is possible to predict the default rate based on more various criteria. It is possible to improve the screening ability of companies in the loan system, etc. In particular, SGAN and ACGAN can be learned not only for default/survival discrimination, but also as an additional one-hot vector type, which can be subdivided into types of default or company size. can be higher
GAN은 잠재공간에서의 연산을 통해서 새로운 엔진도 만들어 낼 수 있다. [부도난 기업 재무비율의 잠재공간 - 일반적인 기업 재무비율의 잠재공간 + 일반적인 스타트업 재무비율의 잠재공간 = 부도난 스타트업 재무비율 잠재공간]와 같이 스타트업이 비록 부도데이터가 축적되지 않아도 학습이 완료된 (이른바 잠재공간으로 축약된) 스타트업 부도의 전형적인 데이터를 산출할 수 있다.GAN can also create a new engine through computation in the latent space. As shown in [Potential space of defaulted company financial ratio - potential space of general corporate financial ratio + potential space of general startup financial ratio = potential space of defaulted startup financial ratio], even if default data is not accumulated for startups, learning is It is possible to produce typical data of completed startup bankruptcy (reduced to the so-called latent space).
하이퍼 파라미터 튜닝을 통해 모델 선택(model selection)을 구현할 수 있다. 하이퍼 파라미터는 딥러닝 모델에 있어서 레이어의 수와 같은 모델 구조를 결정하는 파라미터로서 이는 데이터의 종류와 특성에 따라 최적값을 찾아내는 것이다. 따라서, 본 실시예에에서는 테스트셋을 이용하여 하이퍼 파라미터를 확정하여 딥러닝 모델을 선택할 수 있다.Model selection can be implemented through hyperparameter tuning. A hyperparameter is a parameter that determines the model structure such as the number of layers in a deep learning model, and it is to find an optimal value according to the type and characteristics of data. Therefore, in this embodiment, the deep learning model can be selected by determining the hyperparameter using the test set.
특히, 부분적으로 상실되거나 작성되지 못한 관계로 재무제표가 일부만 제공된 경우에, 또는 착오 또는 허위에 의해 잘못 작성된 재무제표가 존재하는 경우에 이를 추론하여 원본 데이터를 생성할 수 있다. 일례로, GAN의 경우 손상된 이미지나 모자이크 처리된 이미지를 원래 이미지로 복원하는 기능을 포함하고 있어 이를 재무제표의 생성과 수정에 활용할 수 있다.In particular, when financial statements are partially provided due to partial loss or failure to prepare, or when erroneous financial statements exist due to errors or falsifications, original data can be generated by inferring them. For example, in the case of GAN, it includes a function to restore a damaged image or a mosaic-processed image to the original image, so it can be used for the creation and correction of financial statements.
서비스모듈(204)은 고객으로부터 재무제표 정보를 입력받아 훈련모듈(203)에서 훈련된 다양한 딥러닝 모델에 해당 고객의 재무제표 정보를 적용하여 해당 재무제표 정보에 따른 부도여부를 판별한 후 판별결과에 따른 부도예측(예방)정보를 통보할 수 있다. 서비스모듈(204)은 온라인 고객을 대상으로 모바일이나 PC 등의 IT 솔루션을 활용하여 부도예측 온라인 서비스를 제공할 수 있다. 이때, 서비스모듈(204)은 온라인 고객인 의뢰 기업이 부도 기업의 패턴을 따르지 않도록 기업경영 활동을 돕는 컨설팅 정보를 생성하여 제공할 수 있다.The
피드백모듈(205)은 추후 기업의 실제 부도발생데이터를 확보하여 부도예측의 정확도를 점검할 수 있고, 점검 결과를 바탕으로 부도예측의 정확도를 향상하도록 수집과정, 전처리과정, 훈련과정을 수정할 수 있다. 피드백모듈(205)은 실제 기업부도결과를 반영하여 파라미터를 수정하는 역할을 한다. 일례로, RNN(recurrent neural network) 모델을 활용하여 이전 시점의 모델 파라미터와 하이퍼 파라미터를 기억하고 있다가, 향후 실제 부도발생 기업이 보고되면, 이를 온라인으로 수집하여 기존에 학습된 모델의 모델 파라미터와 하이퍼 파라미터를 수정하여 변화된 기업 환경 내에서 실제 부도발생의 패턴이 변화하더라도 이를 반영할 수 있는 자동화된 메카니즘을 구현할 수 있다.The
도 3은 이미지 픽셀과 재무비율 정보의 유사성을 설명하기 위한 예시 도면이다.3 is an exemplary diagram for explaining the similarity between image pixels and financial ratio information.
도 3을 참조하면, 훈련모듈(203)에서의 훈련 대상인 부도 예측을 위한 딥러닝 모델의 일례로 CNN(convolution neural network)에 의해 각 연도별 재무비율 정보가 이미지 픽셀 값처럼 인식되어 정보가 축약될 수 있다.Referring to FIG. 3 , as an example of a deep learning model for predicting bankruptcy, which is a training target in the
미국 상장기업 데이터인 COMPUSTAT에 기록된 약 20,000개 기업 전체의 수명결정요인에 대한 실증분석자료로서 약 40년간(1095~2015)에 걸쳐 분석을 하였음에도 기업의 수명을 결정짓는 재무비율 지표가 여러 수명그룹 별로 공통적으로 영향을 미치고 있으며, 이러한 구조가 변함없이 안정적으로 존재한다. 이로써 재무비율지표는 기업의 수명에 미치는 영향력이 수명의 길고 짧음과 무관하게 안정적임을 알 수 있다. 다시 말해, 기업의 연령에 무관하게 기업부도예측의 지표로서 당해 재무비율지표들이 사용될 수 있음을 추론할 수 있다.As empirical analysis data on the lifespan determinants of all about 20,000 companies recorded in COMPUSTAT, the data of US listed companies, the financial ratio indicators that determine the lifespan of a company were analyzed over a period of about 40 years (1095~2015). It has a common influence on the stars, and this structure is stable and unchanging. This shows that the financial ratio indicator is stable regardless of the long or short life span of the company. In other words, it can be inferred that the financial ratio indicators can be used as an indicator of corporate default regardless of the age of the company.
종전의 부도는 전기예측으로 차기부도가능성을 예측하고 있다. 다양한 알고리즘으로 부도 판별율을 높일 수 있으나 장기적 예측은 여전히 난제다. 따라서, 장기적인 부도 위험의 예측을 알면 실제 부도가 발생하기 이전에 조치를 취할 수 있다.The previous bankruptcy forecasts the possibility of the next default based on the previous forecast. Various algorithms can increase the default detection rate, but long-term forecasting is still a challenge. Thus, knowing the forecast of long-term default risk allows action to be taken before actual default occurs.
부도원인에 따라 다양한 라벨링이 요구된다. 예를 들어, 흑자부도, 적자부도. 등을 대/중/소 기업으로 나누고 업종 등 세부 분류가 추가로 필요하나, 이는 GAN(generative adversarial network) 모델로 해결할 수 있다.Various labeling is required depending on the cause of default. For example, both a surplus and a deficit. It is necessary to divide the company into large/small/medium companies and additionally classify them in detail, such as industry, but this can be solved with a generative adversarial network (GAN) model.
또한, 부도시점 이전에 중장기적으로 부도 가능성을 예측하려면 부도기업의 재무비율 이미지를 창업 1년에서 n년으로 구분하여 라벨링을 해야 하나, 라벨링에 대한 기술적 한계나 제약은 CNN 모델을 사용하여 해결할 수 있다.In addition, in order to predict the possibility of bankruptcy in the mid- to long-term before the point of bankruptcy, it is necessary to label the financial ratio image of the bankrupt company by classifying it from 1 year to n years of founding. have.
부도 예측을 위한 GAN 모델의 일례로 DCGAN(deep convolutional generative adversarial network)을 활용하는 경우:When using a deep convolutional generative adversarial network (DCGAN) as an example of a GAN model for default prediction:
1. DCGAN의 출력은 잠재 공간(latent space)이므로 각 라벨링마다 잠재 공간을 구할 수 있다. 이들 각 라벨링 간에 잠재 공간을 적절히 가감하면 새로운 잠재 공간을 만들고 이미지를 생성할 수 있다.1. Since the output of DCGAN is a latent space, the latent space can be obtained for each labeling. By appropriately adding or subtracting the latent space between each of these labeling, it is possible to create a new latent space and generate an image.
2. GAN 모델의 원리를 이용하면 <(상장기업)부도난 기업의 재무비율 이미지 - 생존한 기업의 재무비율 이미지 = 부도이미지>와 같고, <부도이미지 + (비상장기업) 부도난 기업의 재무비율 이미지 = 비상장기업의 재무비율 이미지>와 같다. 부도 예측을 의뢰한 비상장기업의 재무비율 이미지가 얼마나 유사한지를 판별하는 형태로, 비상장기업의 부도예측에도 대용할 수 있다.2. Using the principle of the GAN model, it is the same as <image of financial ratio of (listed company) insolvent company - image of financial ratio of surviving company = image of bankruptcy>, <image of bankruptcy + (unlisted company) financial ratio of insolvent company> Image = Same as image of unlisted company's financial ratio>. It is a form of determining how similar the financial ratio images of unlisted companies that have requested default predictions are, and can be substituted for default predictions of unlisted companies.
3. 스타트업과 가장 유사한 소기업에 적용할 경우 소기업의 부도이미지를 추출할 수 있으며, 여기에 스타트업의 재무비율 이미지를 더해주면 스타트업의 부도예측도 대용치로서 가능하다.3. When applied to a small company that is most similar to a startup, the default image of the small company can be extracted, and if the financial ratio image of the startup is added to this, the prediction of the default of the startup is also possible as a proxy.
4. IT인프라를 이용하여 비상장재무비율데이터를 보유한 은행, 기관으로부터 데이터를 공급받고 실시간으로 업데이트하여 은행, 기관, 기업 등으로 결과를 전송함으로써 비즈니스모델을 구축할 수 있다.4. A business model can be built by receiving data from banks and institutions that have unlisted financial ratio data using IT infrastructure, updating them in real time, and transmitting the results to banks, institutions, and companies.
5. 스타트업 기업의 경우 일부 누락된 재무정보는 GAN을 이용하여 생성하고 이를 부도예측의 입력자료로서 활용할 수 있는 장점이 있다. GAN을 이용한 재무제표 정보의 누락된 부분을 복원하는 원리는 도 4와 같다.5. In the case of start-up companies, there is an advantage that some missing financial information can be generated using GAN and used as input data for default prediction. The principle of restoring the missing part of financial statement information using GAN is shown in FIG. 4 .
스타트업 기업의 경우 재무제표를 입력하고 이를 CNN으로 축약한 후 기존 부도기업 데이터와 얼마나 유사한지 비교하는 방식으로 스타트업의 부도를 예측할 수 있다.In the case of startup companies, the bankruptcy of startups can be predicted by inputting financial statements, condensing them with CNN, and comparing how similar they are to existing bankruptcy data.
미국상장기업DB(COMPUSTAT)는 45년간 저장되어 있어서 도산기업의 수명은 1년에서 45년 사이다. 따라서, 각 연도 별로 한 개의 딥러닝 모델이 필요하므로 총 1,035개의 딥러닝 모델이 필요하다. 이를 미리 훈련시켜놓고, 고객이 제시하는 재무제표 데이터에 맞는 딥러닝 모델을 매칭시켜서 즉시 결과를 알려주게 된다. 예를 들어 고객이 5년치의 재무제표를 입력했다면 클러스터 사이즈(cluster size)가 1~5년에 각각 해당하는 딥러닝 모델을 찾아서 고객의 재무제표를 최소 1년에서 최대 5년 연속으로 재무제표를 입력해서 부도예측결과를 알려주는 것이다.The U.S. public company DB (COMPUSTAT) is stored for 45 years, so the lifespan of a bankrupt company is between 1 and 45 years. Therefore, since one deep learning model is required for each year, a total of 1,035 deep learning models are needed. It is trained in advance, matches the deep learning model to the financial statement data presented by the customer, and immediately informs the result. For example, if a customer has entered five years' worth of financial statements, find a deep learning model with a cluster size of 1 to 5 years, and read the customer's financial statements for a minimum of 1 year and a maximum of 5 years in a row. Enter it and report the default prediction result.
도 5 내지 도 9는 부도예측 훈련 과정을 설명하기 위한 예시 도면이다.5 to 9 are exemplary views for explaining the default prediction training process.
도 5 내지 도 7은 클러스터 사이즈를 1로 하여 1년 단위 재무비율을 입력하여 부도예측 딥러닝 모델을 학습하는 과정을 나타내고 있다.5 to 7 show the process of learning the default prediction deep learning model by inputting the annual financial ratio with a cluster size of 1.
도 5에 도시한 바와 같이, 수집모듈(201)은 부도 기업을 대상으로 각 기업별 매년 재무비율 정보를 연도 별로 수집한다. 수집모듈(201)은 기업 수명에 따라 기업군을 나누어 각 기업군의 1년 단위 재무비율 정보를 수집할 수 있다.As shown in FIG. 5 , the
도 6을 참조하면, 훈련모듈(203)은 부도시점을 기준으로 기업 전체의 최근 1년 재무비율 정보를 이용하여 1년 후 부도예측 딥러닝 모델을 학습함으로써 부도예측 엔진(D)을 생성할 수 있다.Referring to FIG. 6 , the
마찬가지로, 도 7을 참조하면, 훈련모듈(203)은 부도시점을 기준으로 기업 전체의 2년전 재무비율 정보를 이용하여2년 후 부도예측 딥러닝 모델을 학습함으로써 부도예측 엔진(D)을 생성할 수 있다.Similarly, referring to FIG. 7 , the
상기한 과정을 반복하여 N개의 부도예측 엔진(D)까지 생성할 수 있으며, 다만 부도예측 엔진(D) 중 적어도 일부, 예컨대 부도 시점을 기준으로 사전에 정해진 시점 이후의 부도예측 엔진(D)을 유효 모델 대상에서 제외시킬 수 있다.By repeating the above process, up to N default prediction engines (D) can be generated, but at least some of the default prediction engines (D), for example, default prediction engines (D) after a predetermined time based on the default time It can be excluded from the valid model target.
상기에서는 1년 단위 재무비율 정보를 이용하여 딥러닝 모델을 학습하는 것으로 설명하고 있으나, 이에 한정되지 않으며, 적어도 2년 이상 연속된 재무비율 정보를 이용하여 딥러닝 모델을 학습하는 것 또한 가능하다.The above has been described as learning the deep learning model using annual financial ratio information, but it is not limited thereto, and it is also possible to learn the deep learning model using financial ratio information continuous for at least two years or more.
도 8과 도 9를 참조하면, 훈련모듈(203)은 클러스터 사이즈를 2로 하여, 즉 2년 단위로 2년 연속된 재무비율 정보를 이용하여 부도예측 딥러닝 모델을 학습할 수 있다. 도 9에 도시한 바와 같이, 훈련모듈(203)은 부도시점을 기준으로 기업 전체의 최근 2년 동안의 재무비율 정보를 이용하여 1년 후 부도예측 딥러닝 모델을 학습함으로써 부도예측 엔진(D)을 생성할 수 있다. 마찬가지로, 훈련모듈(203)은 부도시점을 기준으로 기업 전체의 2년전 재무비율 정보와 3년전 재무비율 정보를 이용하여 2년 후 부도예측 딥러닝 모델을 학습함으로써 부도예측 엔진(D)을 생성할 수 있다.Referring to FIGS. 8 and 9 , the
따라서, 훈련모듈(203)은 1년 단위 재무비율은 물론이고, 2년 단위, 3년 단위, 4년 단위 등 연속된 재무비율을 이용하여 부도예측 딥러닝 모델을 학습할 수 있으며, 이를 통해 부도예측을 위한 딥러닝 모델 전체집합을 구성할 수 있다.Accordingly, the
도 10은 딥러닝 모델을 이용하여 부도가능성을 예측하는 과정을 설명하기 위한 예시 도면이다.10 is an exemplary diagram for explaining a process of predicting default by using a deep learning model.
도 10을 참조하면, 서비스모듈(204)은 의뢰고객(기업)으로부터 재무제표 정보를 입력받으면 훈련모듈(203)에 의해 생성된 딥러닝 모델 전체집합 중에서 해당 고객에게 적용 가능한 딥러닝 모델을 선정하여 선정된 딥러닝 모델을 통해 부도시점을 판별할 수 있다. 고객이 2년간의 재무제표 정보를 입력하는 경우 연도 별 재무제표 정보에 대해 1년 단위 재무비율로 만들어진 딥러닝 모델을 선정하는 것은 물론이고, 2년치 재무제표 정보에 대해 2년 단위 재무비율로 만들어진 딥러닝 모델을 선정할 수 있다. 서비스모듈(204)은 의뢰고객의 재무제표 정보에 대응되는 부도예측 정보를 서비스 결과로 제공할 수 있다.Referring to FIG. 10 , the
이처럼 본 발명의 실시예들에 따르면, 기업의 재무비율지표 전체를 모두 포괄하여 직접적으로 부도 예측에 활용함으로써 높은 부도예측 정확도를 기대할 수 있다. 본 발명의 실시예들에 따르면, 기업의 탄생에서부터 지속적으로 재무비율지표를 수집하고, 전체 수명주기 내에서 보여주는 재무비율지표의 변화양상을 마치 이미지의 변화로 인식하여 딥러닝이 부도예상기업에 해당하는지를 알려주므로 부도예측의 조기경보가 가능하다. 본 발명의 실시예들에 따르면, 스타트업 및 비상장기업과 같은 재무비율정보가 일부만 존재하는 기업에 대한 부도예측에 대해서도 부도예측이 가능하다.As such, according to the embodiments of the present invention, high default prediction accuracy can be expected by directly using the entire financial ratio index of a company for default prediction. According to embodiments of the present invention, deep learning corresponds to a company expected to default by continuously collecting financial ratio indicators from the birth of a company, and recognizing changes in financial ratio indicators shown within the entire life cycle as if it were a change in image. It is possible to provide an early warning of default forecasting because it informs you whether According to embodiments of the present invention, default prediction is also possible for a company in which only some financial ratio information exists, such as startups and unlisted companies.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 어플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The device described above may be implemented as a hardware component, a software component, and/or a combination of the hardware component and the software component. For example, the devices and components described in the embodiments may include a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, a microcomputer, a field programmable gate array (FPGA), and a programmable logic unit (PLU). It may be implemented using one or more general purpose or special purpose computers, such as a logic unit, microprocessor, or any other device capable of executing and responding to instructions. The processing device may execute an operating system (OS) and one or more software applications executed on the operating system. The processing device may also access, store, manipulate, process, and generate data in response to execution of the software. For convenience of understanding, although one processing device is sometimes described as being used, one of ordinary skill in the art will recognize that the processing device includes a plurality of processing elements and/or a plurality of types of processing elements. It can be seen that can include For example, the processing device may include a plurality of processors or one processor and one controller. Other processing configurations are also possible, such as parallel processors.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.The software may comprise a computer program, code, instructions, or a combination of one or more thereof, which configures a processing device to operate as desired or is independently or collectively processed You can command the device. The software and/or data may be embodied in any type of machine, component, physical device, computer storage medium or device for interpretation by or providing instructions or data to the processing device. have. The software may be distributed over networked computer systems, and stored or executed in a distributed manner. Software and data may be stored in one or more computer-readable recording media.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 이때, 매체는 컴퓨터로 실행 가능한 프로그램을 계속 저장하거나, 실행 또는 다운로드를 위해 임시 저장하는 것일 수도 있다. 또한, 매체는 단일 또는 수 개의 하드웨어가 결합된 형태의 다양한 기록수단 또는 저장수단일 수 있는데, 어떤 컴퓨터 시스템에 직접 접속되는 매체에 한정되지 않고, 네트워크 상에 분산 존재하는 것일 수도 있다. 매체의 예시로는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등을 포함하여 프로그램 명령어가 저장되도록 구성된 것이 있을 수 있다. 또한, 다른 매체의 예시로, 어플리케이션을 유통하는 앱 스토어나 기타 다양한 소프트웨어를 공급 내지 유통하는 사이트, 서버 등에서 관리하는 기록매체 내지 저장매체도 들 수 있다.The method according to the embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded in a computer-readable medium. In this case, the medium may be to continuously store the program executable by the computer, or to temporarily store the program for execution or download. In addition, the medium may be a variety of recording means or storage means in the form of a single or several hardware combined, it is not limited to a medium directly connected to any computer system, and may exist distributed on a network. Examples of the medium include a hard disk, a magnetic medium such as a floppy disk and a magnetic tape, an optical recording medium such as CD-ROM and DVD, a magneto-optical medium such as a floppy disk, and those configured to store program instructions, including ROM, RAM, flash memory, and the like. In addition, examples of other media may include recording media or storage media managed by an app store for distributing applications, sites for supplying or distributing other various software, and servers.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.As described above, although the embodiments have been described with reference to the limited embodiments and drawings, various modifications and variations are possible from the above description by those skilled in the art. For example, the described techniques are performed in a different order than the described method, and/or the described components of the system, structure, apparatus, circuit, etc. are combined or combined in a different form than the described method, or other components Or substituted or substituted by equivalents may achieve an appropriate result.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.Therefore, other implementations, other embodiments, and equivalents to the claims are also within the scope of the following claims.
Claims (7)
메모리에 포함된 컴퓨터 판독 가능한 명령을 실행하도록 구현되는 적어도 하나의 프로세서
를 포함하고,
상기 적어도 하나의 프로세서는,
부도 기업의 재무제표 정보를 수집하는 수집모듈;
상기 부도 기업의 재무제표 정보를 이용하여 딥러닝 부도예측 모델을 훈련하는 훈련모듈; 및
상기 딥러닝 부도예측 모델을 이용하여 의뢰 기업의 재무제표 정보에 대한 부도 예측 정보를 제공하는 서비스모듈
을 포함하고,
상기 수집모듈은,
기업의 재무제표 정보를 보유한 기관의 데이터베이스 시스템과 연동하여 상기 데이터베이스 시스템으로부터 상기 부도 기업의 재무제표 정보를 수집하고,
상기 부도 기업을 대상으로 각 기업 별 매년 재무제표 정보를 연도 별로 수집하고,
기업 수명에 따라 기업군을 나누어 각 기업군의 1년 단위 재무제표 정보를 수집하고,
상기 훈련모듈은,
상기 부도 기업의 연도 별 재무제표 정보를 입력으로 하고 부도 여부와 부도발생 예상시점 및 부도 유형에 대한 라벨링(labeling)을 출력으로 하여 딥러닝 모델인 CNN(convolution neural network) 모델을 훈련하고,
GAN(generative adversarial network) 모델을 이용하여 각 라벨링마다 잠재공간(latent space)을 구한 후 잠재공간 상에서 잠재변수들 간의 연산과정(arithmetic process)을 통해 부도예측을 추정하는 모델을 생성하고,
1년 단위 재무제표 정보 또는 적어도 2년 이상 연속된 재무제표 정보를 이용하여 부도 시점 기준 연도 별 부도예측 엔진을 생성함으로써 부도예측을 위한 딥러닝 모델 집합을 구성하고,
상기 서비스모듈은,
상기 딥러닝 모델 집합 중에서 상기 의뢰 기업의 재무제표 정보에 대응되는 딥러닝 모델을 선정하여 선정된 딥러닝 모델을 통해 부도시점을 판별하고,
상기 적어도 하나의 프로세서는,
실제 부도발생 기업이 보고되면 해당 기업의 부도 예측 정보를 점검하여 점검 결과를 바탕으로 RNN(recurrent neural network) 모델을 이용하여 상기 딥러닝 부도예측 모델의 딥러닝 모델 파라미터와 하이퍼 파라미터를 수정하는 피드백모듈
을 더 포함하는 컴퓨터 시스템.In a computer system,
at least one processor implemented to execute computer readable instructions contained in a memory
including,
the at least one processor,
a collection module for collecting financial statement information of a bankrupt company;
a training module for training a deep learning default prediction model using the financial statement information of the defaulted company; and
A service module that provides default prediction information on the financial statement information of a client company using the deep learning default prediction model
including,
The collection module is
Collecting the financial statement information of the bankrupt company from the database system in conjunction with the database system of the institution holding the company's financial statement information,
For the above-mentioned bankrupt companies, annual financial statement information for each company is collected by year,
By dividing the company group according to the company lifespan, information on the annual financial statements of each company group is collected,
The training module is
A deep learning model CNN (convolution neural network) model is trained by inputting the financial statement information for each year of the defaulted company as an input and outputting labeling for default status, default occurrence time, and default type as output,
After obtaining a latent space for each labeling using a generative adversarial network (GAN) model, a model for estimating default prediction through an arithmetic process between latent variables in the latent space is generated,
Construct a set of deep learning models for default prediction by creating a default prediction engine by year based on the time of default by using annual financial statement information or financial statement information continuous for at least two years,
The service module is
Selecting a deep learning model corresponding to the financial statement information of the client company from the deep learning model set and determining the default point through the selected deep learning model,
the at least one processor,
When an actual default occurrence company is reported, a feedback module that checks the default prediction information of the corresponding company and corrects the deep learning model parameters and hyper parameters of the deep learning default prediction model using a recurrent neural network (RNN) model based on the check result
A computer system further comprising a.
상기 적어도 하나의 프로세서는,
상기 부도 기업의 재무제표 정보를 이미지 인식용 딥러닝 모델에서 인식 가능한 2차원 평면 상의 이미지 픽셀 정보로 전처리하는 전처리모듈
을 더 포함하고,
상기 전처리모듈은,
상기 부도 기업의 거시경제 지표, 주가관련 지표, 회계감사, 외부평가 지표를 포함하는 비재무 정보를 별도의 채널(channel) 정보로서 이미지 데이터의 각 픽셀에 추가하여 전처리하는 것
을 특징으로 하는 컴퓨터 시스템.According to claim 1,
the at least one processor,
A preprocessing module for preprocessing the financial statement information of the bankrupt company into image pixel information on a two-dimensional plane that can be recognized by a deep learning model for image recognition
further comprising,
The pre-processing module is
Pre-processing by adding non-financial information including macroeconomic indicators, stock price-related indicators, accounting audits, and external evaluation indicators of the bankrupt company to each pixel of image data as separate channel information
A computer system characterized by a.
상기 훈련모듈은,
상기 GAN 모델을 이용하여 상기 부도 기업의 일부 누락된 재무제표 정보를 복원하는 것
을 특징으로 하는 컴퓨터 시스템.According to claim 1,
The training module is
Restoring some missing financial statement information of the insolvent company using the GAN model
A computer system characterized by a.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20190036567 | 2019-03-29 | ||
KR1020190036567 | 2019-03-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200115369A KR20200115369A (en) | 2020-10-07 |
KR102330423B1 true KR102330423B1 (en) | 2021-11-24 |
Family
ID=72884710
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200037979A KR102330423B1 (en) | 2019-03-29 | 2020-03-30 | Online default forecasting system using image recognition deep learning algorithm |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102330423B1 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220086907A (en) | 2020-12-17 | 2022-06-24 | (주)276홀딩스 | Default prediction system and method |
CN112561688B (en) * | 2020-12-21 | 2024-10-15 | 第四范式(北京)技术有限公司 | Credit card overdue prediction method and device based on graph embedding and electronic equipment |
KR102505632B1 (en) * | 2021-01-14 | 2023-03-03 | 사단법인 한국신용정보원 | Method and apparatus of predicting default rate of individual business based on artificial intelligence model using credit information |
CN113537576A (en) * | 2021-06-25 | 2021-10-22 | 合肥工业大学 | Method and system for predicting financial predicament of listed enterprises |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101936029B1 (en) * | 2018-07-18 | 2019-01-11 | 한국과학기술정보연구원 | Valuation method based on deep-learning and apparatus thereof |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100914307B1 (en) * | 2007-07-11 | 2009-08-27 | 고려대학교 산학협력단 | System of constructing credit risk model, method of managing credit risk using credit risk model construction and Recording medium thereof |
KR101219173B1 (en) * | 2011-06-03 | 2013-01-22 | 고광이 | Credit exposure limit management method and system |
KR101666824B1 (en) * | 2015-01-30 | 2016-10-17 | 경일대학교산학협력단 | Chain bankruptcy risk management system and bankruptcy risk management method using the same |
KR102048240B1 (en) * | 2017-09-06 | 2019-11-25 | 주식회사 씨티아이랩 | System Anomaly Behavior Analysis Technology based on Deep Learning Using Imaged Data |
-
2020
- 2020-03-30 KR KR1020200037979A patent/KR102330423B1/en active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101936029B1 (en) * | 2018-07-18 | 2019-01-11 | 한국과학기술정보연구원 | Valuation method based on deep-learning and apparatus thereof |
Also Published As
Publication number | Publication date |
---|---|
KR20200115369A (en) | 2020-10-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102330423B1 (en) | Online default forecasting system using image recognition deep learning algorithm | |
US11436615B2 (en) | System and method for blockchain transaction risk management using machine learning | |
US20220067738A1 (en) | System and Method for Blockchain Automatic Tracing of Money Flow Using Artificial Intelligence | |
CN110400022B (en) | Cash consumption prediction method and device for self-service teller machine | |
CN108876600A (en) | Warning information method for pushing, device, computer equipment and medium | |
CN112053233B (en) | GRA-based dynamic medium and small enterprise credit scoring method and system | |
KR102344383B1 (en) | Method for analyzing loyalty of the customer to store based on artificial intelligence and system thereof | |
CN113986674B (en) | Time sequence data abnormality detection method and device and electronic equipment | |
US20190139144A1 (en) | System, method and computer-accessible medium for efficient simulation of financial stress testing scenarios with suppes-bayes causal networks | |
CN118037440B (en) | Trusted data processing method and system for comprehensive credit system | |
Khan | Particle swarm optimisation based feature selection for software effort prediction using supervised machine learning and ensemble methods: A comparative study | |
Khalid et al. | Predicting risk through artificial intelligence based on machine learning algorithms: a case of Pakistani nonfinancial firms | |
CN118134652A (en) | Asset configuration scheme generation method and device, electronic equipment and medium | |
Sousa et al. | Applying Machine Learning to Estimate the Effort and Duration of Individual Tasks in Software Projects | |
US20220222683A1 (en) | Labeling optimization through image clustering | |
Heistrene et al. | Explainability-based Trust Algorithm for electricity price forecasting models | |
Jiang et al. | Deep learning with regularized robust long‐and short‐term memory network for probabilistic short‐term load forecasting | |
Casimiro et al. | A probabilistic model checking approach to self-adapting machine learning systems | |
US20230229735A1 (en) | Training and implementing machine-learning models utilizing model container workflows | |
Zang | Construction of Mobile Internet Financial Risk Cautioning Framework Based on BP Neural Network | |
Marshan et al. | Exploring the Relationship Between News Articles and Stocks Market Movements: A Sentiment Analysis Perspective | |
CN118469715B (en) | Risk management method and system for cross-border e-commerce transaction behaviors | |
US12118019B1 (en) | Smart data signals for artificial intelligence based modeling | |
US20240256968A1 (en) | System and method for automated underwriting for application processing using machine learning models | |
US20240259408A1 (en) | Test case-based anomaly detection within a computing environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |