KR20240020166A - Method for learning machine-learning model with structured ESG data using ESG auxiliary tool and service server for generating automatically completed ESG documents with the machine-learning model - Google Patents
Method for learning machine-learning model with structured ESG data using ESG auxiliary tool and service server for generating automatically completed ESG documents with the machine-learning model Download PDFInfo
- Publication number
- KR20240020166A KR20240020166A KR1020230054731A KR20230054731A KR20240020166A KR 20240020166 A KR20240020166 A KR 20240020166A KR 1020230054731 A KR1020230054731 A KR 1020230054731A KR 20230054731 A KR20230054731 A KR 20230054731A KR 20240020166 A KR20240020166 A KR 20240020166A
- Authority
- KR
- South Korea
- Prior art keywords
- esg
- item
- document
- data
- text
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 238000010801 machine learning Methods 0.000 title claims abstract description 26
- 238000012545 processing Methods 0.000 claims abstract description 98
- 238000012216 screening Methods 0.000 claims abstract description 31
- 230000003213 activating effect Effects 0.000 claims abstract description 10
- 238000012549 training Methods 0.000 claims description 31
- 230000008569 process Effects 0.000 claims description 20
- 230000005856 abnormality Effects 0.000 claims description 15
- 238000012986 modification Methods 0.000 claims description 9
- 230000004048 modification Effects 0.000 claims description 9
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 238000012790 confirmation Methods 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 102100033763 Transducin-like enhancer protein 4 Human genes 0.000 claims 88
- 238000007726 management method Methods 0.000 description 121
- 238000004891 communication Methods 0.000 description 25
- 230000006870 function Effects 0.000 description 16
- 238000011156 evaluation Methods 0.000 description 12
- 238000007781 pre-processing Methods 0.000 description 11
- 230000014509 gene expression Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000003860 storage Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000008520 organization Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 238000013479 data entry Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000007639 printing Methods 0.000 description 2
- 238000004549 pulsed laser deposition Methods 0.000 description 2
- 239000004984 smart glass Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000005431 greenhouse gas Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2272—Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Development Economics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Databases & Information Systems (AREA)
- Educational Administration (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
Abstract
실시예들은 정형화 처리 대상의 ESG 문서를 파싱 처리하는 단계 - 상기 ESG 문서는 비정형 ESG 데이터를 포함함; 미리 저장된 복수의 ESG 관리 항목 중 적어도 하나에 대응하는 항목을 파싱된 ESG 문서가 포함하는지 스크리닝하는 단계; 상기 ESG 관리 항목에 대응한 항목이 문서 내에 포함되었는지 여부에 따라 ESG 문서 내 항목에 대해 선별 상태를 지정하는 단계; 선별 상태의 지정 결과에 따라 미리 저장된 복수의 ESG 관리 항목에 대한 최종 입력 필드 값의 입력 칸을 활성화하거나 또는 비활성화하는 단계; 및 문서에 포함된 것으로 판단된, ESG 관리 항목에 대응한 항목의 내용을 획득하여 정형화 데이터를 생성하는 단계를 포함한 ESG 보조 툴을 이용하여 정형화된 ESG 데이터를 기반으로, 기계학습 모델을 학습하는 방법 및 기계학습 모델로 자동완성된 ESG 문서를 생성하는 서비스 서버에 관한 것이다. .Embodiments include parsing and processing an ESG document subject to structured processing - the ESG document includes unstructured ESG data; Screening whether the parsed ESG document includes an item corresponding to at least one of a plurality of pre-stored ESG management items; Specifying a selection status for items in an ESG document according to whether an item corresponding to the ESG management item is included in the document; activating or deactivating an input box for the final input field value for a plurality of pre-stored ESG management items according to the result of specifying the selection state; And a method of learning a machine learning model based on standardized ESG data using an ESG auxiliary tool, including the step of generating standardized data by obtaining the contents of items corresponding to ESG management items determined to be included in the document. and a service server that generates ESG documents automatically completed with machine learning models. .
Description
본 출원의 실시 예들은 ESG 보조 툴을 이용하여 통일되지 않은 ESG 문서 내 다양한 비정형 포맷의 ESG 데이터를 정형화된 포맷의 ESG 데이터로 정리하고, 이 정형화된 ESG 데이터로 기계학습 모델을 학습하는 방법 및 기계학습 모델로 자동완성된 ESG 문서를 생성하는 서비스 서버에 관한 것이다.Embodiments of this application use ESG auxiliary tools to organize ESG data in various unstructured formats in non-unified ESG documents into ESG data in a standardized format, and a method and machine for learning a machine learning model with this standardized ESG data. It is about a service server that generates ESG documents automatically completed with learning models.
최근 기업들이 리스크 관리에 보다 많은 신경을 기울이면서, 기업들을 다방면으로 평가하고 이와 같은 평가 결과를 투자, 합병, 생산 라인에 대한 리스크 관리 등에 응용하고 있다.Recently, as companies pay more attention to risk management, they are evaluating companies in various aspects and applying the results of such evaluations to investment, merger, and risk management of production lines.
일반적으로 기업들은 정량적으로 획득할 수 있는 재무적인 데이터들을 토대로 기업들을 평가하는 것이 일반적이었으나, 최근 들어서 비재무적인 데이터를 토대로 기업을 평가하고 리스크를 분석하는 방법론이 부각되고 있다. 기업들이 공개하는 재무적 데이터에는 해당 기업에게 불리한 내용이 반영되지 않으며, 기업이 제공하는 재무 관련 보고서에 대한 신뢰성 또한 의문시되는 실정이다. 비재무 데이터를 통한 기업 분석이 필요한 이유를 살펴보면, 사람들의 인터넷을 통한 SNS 활동이 활발해지면서, 기업 또는 제품에 대한 특정한 소문이 퍼지거나 하는 사건 등에 의해 기업 평판이 흔들리는 경우도 있으며 기업 오너의 범죄나 건강 관련 소문들에 의해 해당 기업이 가지는 리스크가 높아지는 경우도 있으나 이와 같은 사건들은 재무적 데이터를 통해 분석하기 어려운 것이 현실이다. 따라서, 재무적인 데이터뿐 아니라 비재무적인 데이터를 통해 기업을 분석함으로써 보다 정밀한 기업 평가가 가능해질 수 있다. In general, it has been common for companies to evaluate companies based on quantitatively obtainable financial data, but recently, methodologies for evaluating companies and analyzing risks based on non-financial data have been gaining prominence. Financial data disclosed by companies does not reflect anything unfavorable to the company, and the reliability of financial reports provided by companies is also being questioned. Looking at the reasons why corporate analysis through non-financial data is necessary, as people's SNS activities on the Internet become more active, corporate reputations may be shaken due to incidents such as the spread of specific rumors about a company or product, and the company's owner's crime or health. In some cases, the risks of a company increase due to related rumors, but the reality is that such events are difficult to analyze through financial data. Therefore, more precise company evaluation can be possible by analyzing companies through not only financial data but also non-financial data.
이와 같은 흐름에서, 비재무 데이터들을 ESG(Environmnet, Social, Governance)의 세 주제로 나누어서 분석하는 방법론이 부각되고 있다. In this trend, a methodology that analyzes non-financial data by dividing it into three topics: ESG (Environment, Social, and Governance) is gaining prominence.
최근에는 기후변화 위기 등으로 인해 기업의 사회적 책임이 더욱 강조되어 ESG 평가 방식이 더욱 주목을 받고 있으며, 이는 범 글로벌 차원의 ESG 규제로 확인된다. Recently, corporate social responsibility has been more emphasized due to the climate change crisis, etc., and ESG evaluation methods are receiving more attention, which is confirmed by global ESG regulations.
이러한 급변하는 대외환경 변화에 따라 기업들은 다양한 이해관계자들의 공시 요구에 대응하여, ESG 평가 방식을 만족하기 위해 자신들의 ESG 경영활동에 대한 내용을 담은 데이터를 공시하고 있다. 이러한 데이터는 지속가능성 보고서(Sustainability report, SR)로 흔히 지칭되는, PDF 파일 형태의 문서로 발간되어 공시되고 있다. In response to these rapidly changing external environments, companies are responding to disclosure requests from various stakeholders and disclosing data containing details of their ESG management activities to satisfy ESG evaluation methods. These data are published and disclosed in PDF file format, commonly referred to as a sustainability report (SR).
이러한 기업들의 ESG 데이터 공개는 해가 갈수록 증가하고 있으며, 이를 통해 축적되는 기업들의 ESG 데이터가 많아지고 있다. 향후 기업의 ESG 경영이 갈수록 중요해질 것이기 때문에, 이렇게 축적된 ESG 데이터를 빅데이터 관점에서 활용하고자 하는 수요가 점차 증가하고 있다. The disclosure of ESG data by these companies is increasing every year, and through this, more and more ESG data of companies is being accumulated. As corporate ESG management will become increasingly important in the future, the demand to utilize accumulated ESG data from a big data perspective is gradually increasing.
하지만 기업들이 공시 및 발간하는 지속가능성 보고서와 같은 ESG 문서는 대부분 PDF 파일 형태의 비정형 데이터이다. 이러한 ESG 문서 내 비정형 데이터를 빅데이터 관점에서 활용하기 위해서는, 특히, 최근 발전 중인 AI 기술에 ESG 문서를 활용하기 위해서는 정형화된 포맷의 데이터베이스로 정리 및 저장할 필요가 있다. However, most ESG documents, such as sustainability reports disclosed and published by companies, are unstructured data in the form of PDF files. In order to utilize the unstructured data in these ESG documents from a big data perspective, especially in order to utilize ESG documents in recently developing AI technology, it is necessary to organize and store them in a database in a standardized format.
상술한 문제를 해결하기 위해, 본 출원의 실시 예들은 기업들의 정형화되지 않은 ESG 데이터를 정형화하여 저장 관리 가능한, ESG 보조 툴을 이용하여 정형화된 ESG 데이터로 이루어진 ESG 데이터베이스를 구축하는 방법 및 이를 수행하는 ESG 서비스 제공 시스템을 제공하고자 한다. In order to solve the above-described problem, embodiments of the present application provide a method for building an ESG database composed of standardized ESG data using an ESG auxiliary tool that can store and manage unstructured ESG data of companies, and how to perform this. We aim to provide an ESG service provision system.
또한, 본 출원의 실시 예들은 비정형 ESG 데이터를 정형 데이터로 정확하게 변환하기 위한 인터페이스 화면을 제공 가능한 ESG 보조 툴을 이용하여 정형화된, ESG 데이터로 기계학습 모델을 학습하는 방법 및 기계학습 모델로 자동완성된 ESG 문서를 생성하는 서비스 서버를 제공하고자 한다. In addition, embodiments of the present application include a method of learning a machine learning model with standardized ESG data using an ESG auxiliary tool that can provide an interface screen for accurately converting unstructured ESG data into structured data, and automatic completion of the machine learning model. We would like to provide a service server that generates ESG documents.
본 출원의 일 측면에 따른 ESG 보조 툴을 이용하여 정형화된, ESG 데이터로 기계학습 모델을 학습하는 방법은 전자 장치 및 서비스 서버에 의해 수행될 수 있다. 상기 전자 장치는 복수의 ESG 관리 항목을 미리 저장한 ESG 관리 항목 데이터베이스와 연결된 것이다. 상기 방법은, 정형화 처리 대상의 ESG 문서를 파싱 처리하는 단계 - 상기 ESG 문서는 비정형 ESG 데이터를 포함함; 미리 저장된 복수의 ESG 관리 항목 중 적어도 하나에 대응하는 항목을 파싱된 ESG 문서가 포함하는지 스크리닝하는 단계; 스크리닝 결과에 이상이 없는지 여부를 판단하는 단계; 상기 ESG 관리 항목에 대응한 항목이 문서 내에 포함되었는지 여부에 따라 ESG 문서 내 항목에 대해 선별 상태를 지정하는 단계; 선별 상태의 지정 결과에 따라 미리 저장된 복수의 ESG 관리 항목에 대한 최종 입력 필드 값의 입력 칸을 활성화하거나 또는 비활성화하는 단계; 문서에 포함된 것으로 판단된, ESG 관리 항목에 대응한 항목의 내용을 획득하여 정형화 데이터를 생성하는 단계; 및 파싱된 ESG 문서의 텍스트를 ESG 문서를 자동 완성하기 위한 기계학습 모델의 학습 데이터로 이용하여 상기 기계학습 모델을 학습하는 단계;를 포함할 수 있다. A method of learning a machine learning model with standardized ESG data using an ESG auxiliary tool according to an aspect of the present application may be performed by an electronic device and a service server. The electronic device is connected to an ESG management item database that stores a plurality of ESG management items in advance. The method includes parsing and processing an ESG document subject to structured processing, wherein the ESG document includes unstructured ESG data; Screening whether the parsed ESG document includes an item corresponding to at least one of a plurality of pre-stored ESG management items; Determining whether there are any abnormalities in the screening results; Specifying a selection status for items in an ESG document according to whether an item corresponding to the ESG management item is included in the document; activating or deactivating an input box for the final input field value for a plurality of pre-stored ESG management items according to the result of specifying the selection state; generating standardized data by obtaining the contents of items corresponding to ESG management items determined to be included in the document; and learning the machine learning model by using the text of the parsed ESG document as learning data for a machine learning model for automatically completing the ESG document.
상기 미리 저장된 복수의 ESG 관리 항목 중 적어도 하나에 대응하는 항목을 파싱된 ESG 문서가 포함하는지 스크리닝하는 단계는, 상기 ESG 관리 항목 데이터베이스에 저장된 각 ESG 관리 항목별 코드 값 및 데이터 세트 값 중 적어도 하나를 기준으로 파싱된 ESG 문서에 해당 항목을 포함하는지 여부를 판단하는 것이다. The step of screening whether the parsed ESG document includes an item corresponding to at least one of the plurality of pre-stored ESG management items includes at least one of a code value and a data set value for each ESG management item stored in the ESG management item database. The standard is to determine whether the parsed ESG document includes the relevant item.
상기 스크리닝 결과에 이상이 없는지 여부를 판단하는 단계는, 사용자의 확인 입력에 기초하거나 또는 ESG 문서 내에서 코드 값, 데이터 세트 값 중 적어도 하나에 매칭한 데이터에 대한 주변 데이터에 기초하여 스크리닝 결과의 이상 여부를 판단하는 것이다. The step of determining whether there is an abnormality in the screening result includes detecting an abnormality in the screening result based on the user's confirmation input or based on surrounding data for data matching at least one of a code value and a data set value in the ESG document. It is to determine whether or not.
상기 선별 상태를 지정하는 단계는, 파싱된 ESG 문서 내에 해당 항목이 포함되어 있으면 상기 ESG 문서를 제1 선별 상태로 지정하고, 해당 항목이 포함되어 있지 않으면 상기 ESG 문서를 제2 선별 상태로 지정하는 것이다. In the step of specifying the selection state, if the corresponding item is included in the parsed ESG document, the ESG document is designated as a first selection state, and if the corresponding item is not included, the ESG document is designated as a second selection state. will be.
상기 정형화 데이터를 생성하는 단계는, ESG 관리 항목에 대응한 항목의 내용을 획득하여 상기 정형화 데이터를 생성하기 위해, 제1 선별 상태로 지정된 ESG 관리 항목의 상기 ESG 문서 내 위치를 제공하는 단계; 제공된 위치에 기초하여 해당 ESG 관리 항목의 내용을 획득하는 단계; 및 선별된 ESG 관리 항목의 목록 및 획득된 각각의 ESG 관리 항목의 내용을 테이블 변환 처리하여 정형 데이터를 생성하는 단계를 포함한다. 상기 해당 ESG 관리 항목의 내용을 획득하는 단계는, 사용자의 내용 입력에 기초하거나 또는 제공된 위치에 대한 주변 데이터에 기초하여 최종 필드 입력 값의 내용을 획득하는 것이다. The step of generating the standardized data includes providing a location in the ESG document of an ESG management item specified in a first selection state to obtain content of the item corresponding to the ESG management item and generate the standardized data; Obtaining the contents of the corresponding ESG management item based on the provided location; and generating structured data by performing table conversion on the list of selected ESG management items and the contents of each obtained ESG management item. The step of obtaining the content of the corresponding ESG management item is to obtain the content of the final field input value based on the user's content input or based on surrounding data about the provided location.
상기 기계학습 모델은 입력 텍스트의 말뭉치와 잔여 텍스트의 말뭉치 간의 연관 관계를 추론하여 입력 텍스트의 말뭉치의 그 다음 순번으로 배치될 텍스트의 말뭉치를 예측하도록 학습된, 인공 신경망 구조를 포함한 모델인 것이다. The machine learning model is a model including an artificial neural network structure that is learned to predict the corpus of text to be placed in the next order of the corpus of the input text by inferring the relationship between the corpus of the input text and the corpus of the remaining text.
일 실시 예에서, 상기 전자 장치는 다른 ESG 문서의 비정형 ESG 데이터를 정형화하여 저장한 ESG 문서 데이터베이스와 더 연결될 수 있다. 상기 ESG 관리 항목에 대응한 항목의 내용을 획득하여 정형화 데이터를 생성하는 단계는, 기존 ESG 문서 내 데이터를 이용하겠다는 사용자 입력을 수신한 경우, 상기 다른 ESG 문서 내 데이터를 해당 항목에 대한 내용으로 획득하는 단계를 더 포함할 수 있다. In one embodiment, the electronic device may be further connected to an ESG document database that stores structured, unstructured ESG data from other ESG documents. The step of generating standardized data by obtaining the content of an item corresponding to the ESG management item includes, when receiving a user input to use data in an existing ESG document, acquiring data in the other ESG document as content for the item. Additional steps may be included.
일 실시 예에서, 상기 전자 장치는 출력부를 더 포함할 수 있다. 상기 방법은, 이미 저장된 ESG 관리 항목을 관리하는 단계를 더 포함하고 - 상기 ESG 관리 항목의 관리는 수정, 삭제 또는 생성하는 것이다. 상기 ESG 관리 항목을 관리하는 단계는, 이미 저장된 ESG 관리 항목이 저장되었는지 확인하는 단계; 저장된 경우, ESG 관리 항목에 대한 수정, 삭제 또는 생성 요청을 수신하는 단계; 상기 수정, 삭제 또는 생성 요청을 수신할 경우, 저장된 ESG 관리 항목 세트를 항목 레벨 구조로 나타낸 보조 툴 인터페이스 화면을 상기 출력부를 통해 표시하는 단계;를 포함할 수 있다. In one embodiment, the electronic device may further include an output unit. The method further includes the step of managing already stored ESG management items - the management of the ESG management items includes modifying, deleting or creating. The step of managing the ESG management items includes checking whether already saved ESG management items have been saved; If stored, receiving requests to modify, delete or create ESG management items; When receiving the modification, deletion or creation request, displaying an auxiliary tool interface screen showing the stored ESG management item set in an item level structure through the output unit.
일 실시 예에서, 상기 ESG 관리 항목을 관리하는 단계는, 요청 대상 항목이 최하위 레벨 항목이 아닐 경우 대상 항목의 내용에 대한 입력 칸을 비활성화하는 단계; 상기 요청 대상 항목이 최하위 레벨 항목일 경우 대상 항목의 내용에 대한 입력 칸을 활성화하는 단계; 활성화된 입력 칸을 통해 수정 또는 생성할 대상 항목의 내용을 입력받는 단계; 및 입력된 항목의 내용을 ESG 관리 항목 데이터베이스에 저장하는 단계를 더 포함할 수 있다. In one embodiment, the step of managing the ESG management item includes: deactivating an input box for the contents of the target item when the requested item is not the lowest level item; activating an input box for the contents of the target item when the request target item is a lowest level item; A step of inputting the contents of a target item to be modified or created through an activated input box; And it may further include the step of storing the contents of the entered items in the ESG management item database.
일 실시 예에서, 상기 활성화된 입력 칸을 통해 대상 항목의 내용을 입력받는 단계는, 상기 대상 항목의 내용을 입력받기 위한 보조 툴 인터페이스 화면을 제공하는 단계를 포함할 수 있다. 상기 보조 툴 인터페이스 화면은 활성화된 입력 칸을 포함한 제1 서브 영역 및 항목 구조 레벨을 포함한 제2 서브 영역을 포함하고, 상기 제2 서브 영역에는 대분류별 항목 세트를 각각의 동일한 항목 레벨별로 분류하여 표시된다. In one embodiment, the step of inputting the content of the target item through the activated input box may include providing an auxiliary tool interface screen for inputting the content of the target item. The auxiliary tool interface screen includes a first sub-area including an activated input box and a second sub-area including an item structure level, and in the second sub-area, a set of items for each major category is classified and displayed for each same item level. do.
본 출원의 다른 일 측면에 따른 컴퓨터 판독가능한 기록매체는 상술한 실시 예들에 따른 ESG 보조 툴을 이용하여 정형화된 ESG 데이터로 기계학습 모델을 학습하는 방법을 수행하기 위한 프로그램을 기록할 수 있다. A computer-readable recording medium according to another aspect of the present application may record a program for performing a method of learning a machine learning model with standardized ESG data using the ESG auxiliary tool according to the above-described embodiments.
본 출원의 또 다른 일 측면에 따른 기계학습 모델로 자동완성된 ESG 문서를 생성하는 서비스 서버는, ESG 보조 툴을 이용하여 정형화된 ESG 데이터로 이루어진 ESG 데이터베이스를 구축하기 위한 전자 장치와 연결된다. 상기 전자 장치는 복수의 ESG 관리 항목을 미리 저장한 ESG 관리 항목 데이터베이스와 연결된다. A service server that generates ESG documents automatically completed with a machine learning model according to another aspect of the present application is connected to an electronic device for building an ESG database consisting of standardized ESG data using an ESG auxiliary tool. The electronic device is connected to an ESG management item database that stores a plurality of ESG management items in advance.
상기 전자 장치는, 비정형 ESG 데이터를 포함한 ESG 문서 내에서 상기 ESG 관리 항목 데이터베이스에 미리 저장된 복수의 ESG 관리 항목 중 적어도 하나에 대응한 항목 및 해당 항목의 내용을 획득하여 상기 ESG 문서에 대한 정형화된 ESG 데이터를 생성하도록 구성된 정형 데이터 처리부; 및 ESG 문서의 비정형 데이터를 정형화된 데이터로 변경하기 위한 사용자 입력을 수신하는 보조 툴 인터페이스 화면을 출력부를 통해 제공하는 인터페이스 제공부를 포함한다. 상기 정형 데이터 처리부는, 정형화 처리 대상의 ESG 문서를 파싱 처리하고 - 상기 ESG 문서는 비정형 ESG 데이터를 포함함 -, 미리 저장된 복수의 ESG 관리 항목 중 적어도 하나에 대응하는 항목을 파싱된 ESG 문서가 포함하는지 스크리닝하며, 스크리닝 결과에 이상이 없는지 여부를 판단하고, 상기 ESG 관리 항목에 대응한 항목이 문서 내에 포함되었는지 여부에 따라 ESG 문서 내 항목에 대해 선별 상태를 지정하고, 선별 상태의 지정 결과에 따라 미리 저장된 복수의 ESG 관리 항목에 대한 최종 입력 필드 값의 입력 칸을 활성화하거나 또는 비활성화하며, 그리고 문서에 포함된 것으로 판단된, ESG 관리 항목에 대응한 항목의 내용을 획득하여 정형화 데이터를 생성하도록 구성되고, 또한, 상기 정형 데이터 처리부는, 미리 저장된 복수의 ESG 관리 항목 중 적어도 하나에 대응하는 항목을 파싱된 ESG 문서가 포함하는지 스크리닝하기 위해, 상기 ESG 관리 항목 데이터베이스에 저장된 각 ESG 관리 항목별 코드 값 및 데이터 세트 값 중 적어도 하나를 기준으로 파싱된 ESG 문서에 해당 항목을 포함하는지 여부를 판단한다. 또한, 상기 정형 데이터 처리부는, 스크리닝 결과에 이상이 없는지 여부를 판단하기 위해, 사용자의 확인 입력에 기초하거나 또는 ESG 문서 내에서 코드 값, 데이터 세트 값 중 적어도 하나에 매칭한 데이터에 대한 주변 데이터에 기초하여 스크리닝 결과의 이상 여부를 판단하는 것이다. 상기 정형 데이터 처리부는, 선별 상태를 지정하기 위해, 파싱된 ESG 문서 내에 해당 항목이 포함되어 있으면 상기 ESG 문서를 제1 선별 상태로 지정하고, 해당 항목이 포함되어 있지 않으면 상기 ESG 문서를 제2 선별 상태로 지정하는 것이다. 상기 정형 데이터 처리부는, 상기 정형화 데이터를 생성하기 위해, ESG 관리 항목에 대응한 항목의 내용을 획득하여 상기 정형화 데이터를 생성하기 위해, 제1 선별 상태로 지정된 ESG 관리 항목의 상기 ESG 문서 내 위치를 제공하는 단계; 제공된 위치에 기초하여 해당 ESG 관리 항목의 내용을 획득하는 단계; 및 선별된 ESG 관리 항목의 목록 및 획득된 각각의 ESG 관리 항목의 내용을 테이블 변환 처리하여 정형 데이터를 생성한다. 상기 정형 데이터 처리부는, 상기 해당 ESG 관리 항목의 내용을 획득하기 위해, 사용자의 내용 입력에 기초하거나 또는 제공된 위치에 대한 주변 데이터에 기초하여 '최종 필드 입력 값'의 내용을 획득한다. The electronic device obtains an item corresponding to at least one of a plurality of ESG management items pre-stored in the ESG management item database and the contents of the item within an ESG document containing unstructured ESG data, and generates a standardized ESG information for the ESG document. a structured data processing unit configured to generate data; and an interface providing unit that provides an auxiliary tool interface screen that receives user input for changing unstructured data of an ESG document into standardized data through an output unit. The structured data processing unit parses and processes an ESG document subject to structured processing - the ESG document includes unstructured ESG data - and the parsed ESG document includes an item corresponding to at least one of a plurality of pre-stored ESG management items. determines whether there are any abnormalities in the screening results, assigns a screening status to items in the ESG document depending on whether items corresponding to the above ESG management items are included in the document, and determines whether the screening status is correct. It is configured to activate or deactivate the input box for the final input field value for multiple pre-stored ESG management items, and to generate standardized data by obtaining the contents of the items corresponding to the ESG management items determined to be included in the document. In addition, the structured data processing unit provides a code value for each ESG management item stored in the ESG management item database to screen whether the parsed ESG document includes an item corresponding to at least one of a plurality of pre-stored ESG management items. And it is determined whether the parsed ESG document includes the corresponding item based on at least one of the data set values. In addition, the structured data processing unit is based on the user's confirmation input or based on surrounding data for data matching at least one of a code value and a data set value in an ESG document in order to determine whether there is an abnormality in the screening result. Based on this, it is determined whether there is an abnormality in the screening result. In order to specify a selection state, the structured data processing unit designates the ESG document as a first selection state if the corresponding item is included in the parsed ESG document, and designates the ESG document as a second selection state if the corresponding item is not included in the parsed ESG document. It is designated as a state. In order to generate the standardized data, the structured data processing unit acquires the contents of the item corresponding to the ESG management item and determines the location of the ESG management item specified in the first selection state within the ESG document in order to generate the structured data. providing steps; Obtaining the contents of the corresponding ESG management item based on the provided location; And the list of selected ESG management items and the contents of each acquired ESG management item are converted into tables to generate structured data. In order to obtain the contents of the corresponding ESG management item, the structured data processing unit acquires the contents of the 'final field input value' based on the user's contents input or based on surrounding data for the provided location.
상기 서비스 서버는 파싱된 ESG 문서의 텍스트를 ESG 문서를 자동 완성하기 위한 기계학습 모델의 학습 데이터로 이용하여 상기 기계학습 모델을 학습하도록 구성될 수 있다. The service server may be configured to learn the machine learning model by using the text of the parsed ESG document as training data for the machine learning model for automatically completing the ESG document.
본 발명의 일 측면에 따른 ESG 서비스 제공 시스템은 고유한 보조 툴 인터페이스 화면을 제공하는 ESG 보조 툴을 이용하여 기존 수작업의 비효율을 줄이고, 완전 자동화가 어려운 제약조건의 문제점을 극복할 수 있다. 상기 보조 툴 인터페이스 화면은 ESG 문서 내 데이터의 분류, 저장 및 관리를 효율적으로 수행하는 효과를 제공한다. The ESG service provision system according to one aspect of the present invention can reduce the inefficiency of existing manual work and overcome the problem of constraints that make full automation difficult by using an ESG auxiliary tool that provides a unique auxiliary tool interface screen. The auxiliary tool interface screen provides the effect of efficiently classifying, storing, and managing data in ESG documents.
그 결과, 상기 ESG 서비스 제공 시스템은 기업의 지속가능성 보고서로부터 ESG 데이터를 수집 변환하여 저장 관리하고 이에 기초한 기업의 ESG 경영현황을 파악할 수 있으며, 특히 비정형 ESG 데이터가 상기 보조 툴의 프로세스를 따라 파싱 및 정형화되어 데이터베이스로 구축됨으로써, 빅데이터 관점에서 분석 및 가공 처리에 따라 적절하게 ESG 데이터를 활용할 수 있다. As a result, the ESG service provision system can collect, convert, store and manage ESG data from the company's sustainability report and identify the company's ESG management status based on it. In particular, unstructured ESG data can be parsed and processed according to the process of the auxiliary tool. By being standardized and built into a database, ESG data can be appropriately utilized according to analysis and processing from a big data perspective.
또한, 상기 ESG 서비스 제공 시스템은 정형화된 ESG 데이터를 학습 데이터로 제공해, ESG 문서를 자동완성할 수 있는 기계학습 모델을 학습할 수 있다. In addition, the ESG service provision system can provide standardized ESG data as learning data to learn a machine learning model that can automatically complete ESG documents.
본 발명의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 청구범위의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.The effects of the present invention are not limited to the effects mentioned above, and other effects not mentioned will be clearly understood by those skilled in the art from the description of the claims.
본 발명 또는 종래 기술의 실시 예의 기술적 해결책을 보다 명확하게 설명하기 위해, 실시 예에 대한 설명에서 필요한 도면이 아래에서 간단히 소개된다. 아래의 도면들은 본 명세서의 실시 예를 설명하기 목적일 뿐 한정의 목적이 아니라는 것으로 이해되어야 한다. 또한, 설명의 명료성을 위해 아래의 도면들에서 과장, 생략 등 다양한 변형이 적용된 일부 요소들이 도시될 수 있다.
도 1은, 본 출원의 일 측면에 따른, ESG 서비스 제공 시스템의 개략도이다.
도 2a 및 도 2b는, 본 출원의 다른 일 측면에 다른, ESG 보조 툴을 이용하여 정형화된 ESG 데이터로 이루어진 ESG 데이터베이스를 구축하는 방법의 흐름도이다.
도 3은, 본 출원의 일 실시 예에 따른, 항목의 최종 입력 필드 값의 입력 칸을 포함한 보조 툴 인터페이스 화면을 도시한다.
도 4는, 본 출원의 일 실시 예에 따른, ESG 관리 항목을 관리하는 과정의 흐름도이다.
도 5는, 본 출원의 일 실시 예에 따른, 항목 레벨 구조를 표시한 보조 툴 인터페이스 화면을 도시한다.
도 6은, 본 출원의 일 측면에 따른, ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하도록 구성된 시스템의 개략도이다.
도 7은, 본 출원의 일 실시 예에 따른, ESG 자동완성 모델을 생성하는 과정의 개략도이다.
도 8은, 본 출원의 일 실시 예에 따른, ESG 자동완성 모델에서 출력 텍스트를 예측하는 동작의 개략도이다.
도 9는, 본 출원의 다른 일 측면에 따른, ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법의 흐름도이다.
도 10은, 본 출원의 일 실시 예예 따른, 추천 텍스트의 말뭉치의 출력 결과를 도시한다.In order to more clearly explain the technical solutions of the embodiments of the present invention or the prior art, drawings necessary in the description of the embodiments are briefly introduced below. It should be understood that the drawings below are for illustrative purposes only and not for limiting purposes of the present specification. Additionally, for clarity of explanation, some elements may be shown in the drawings below with various modifications, such as exaggeration or omission.
1 is a schematic diagram of an ESG service provision system, according to one aspect of the present application.
2A and 2B are flowcharts of a method for building an ESG database consisting of standardized ESG data using an ESG auxiliary tool, according to another aspect of the present application.
Figure 3 shows an auxiliary tool interface screen including an input box for the final input field value of an item, according to an embodiment of the present application.
Figure 4 is a flowchart of a process for managing ESG management items according to an embodiment of the present application.
Figure 5 shows an auxiliary tool interface screen displaying an item level structure according to an embodiment of the present application.
Figure 6 is a schematic diagram of a system configured to recommend text suitable for auto-completion of ESG documents, according to an aspect of the present application.
Figure 7 is a schematic diagram of a process for generating an ESG auto-complete model according to an embodiment of the present application.
Figure 8 is a schematic diagram of an operation for predicting output text in an ESG auto-completion model, according to an embodiment of the present application.
Figure 9 is a flowchart of a method for recommending text suitable for automatically completing an ESG document, according to another aspect of the present application.
Figure 10 shows the output result of a corpus of recommended text according to an embodiment of the present application.
이하에서, 도면을 참조하여 본 출원의 실시 예들에 대하여 상세히 살펴본다.Hereinafter, embodiments of the present application will be examined in detail with reference to the drawings.
그러나, 이는 본 개시(disclosure)를 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 개시의 실시 예의 다양한 변경(modification), 균등물(equivalent), 및/또는 대체물(alternative)을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다.However, this disclosure is not intended to limit the disclosure to specific embodiments, and should be understood to include various modifications, equivalents, and/or alternatives to the embodiments of the disclosure. . In connection with the description of the drawings, similar reference numbers may be used for similar components.
본 명세서에서, "가진다," "가질 수 있다,""포함한다," 또는 "포함할 수 있다" 등의 표현은 해당 특징(예: 수치, 기능, 동작, 단계, 부품, 요소 및/또는 성분 등의 구성요소)의 존재를 가리키며, 추가적인 특징의 존재나 부가를 제외시키는 것이 아니다. In this specification, expressions such as “have,” “may have,” “includes,” or “may include” refer to the corresponding features (e.g., numerical values, functions, operations, steps, parts, elements, and/or components). It refers to the presence of components such as etc.) and does not exclude the presence or addition of additional features.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.When a component is said to be "connected" or "connected" to another component, it is understood that it may be directly connected to or connected to the other component, but that other components may exist in between. It should be. On the other hand, when it is mentioned that a component is “directly connected” or “directly connected” to another component, it should be understood that there are no other components in between.
다양한 실시 예에서 사용된 "제 1", "제 2", "첫째" 또는 "둘째" 등의 표현들은 다양한 구성요소들을, 순서 및/또는 중요도에 상관없이 수식할 수 있고, 해당 구성요소들을 한정하지 않는다. 상기 표현들은 한 구성요소를 다른 구성요소와 구분하기 위해 사용될 수 있다. 예를 들면, 제1 구성요소와 제2 구성요소는, 순서 또는 중요도와 무관하게, 서로 다른 구성요소를 나타낼 수 있다. Expressions such as “first,” “second,” “first,” or “second” used in various embodiments may modify various elements regardless of order and/or importance, and limit the elements. I never do that. The above expressions can be used to distinguish one component from another. For example, the first component and the second component may represent different components, regardless of order or importance.
본 명세서에서 사용된 표현 "~하도록 구성된(또는 설정된)(configured to)"은 상황에 따라, 예를 들면, "~에 적합한(suitable for)," "~하는 능력을 가지는(having the capacity to)," "~하도록 설계된(designed to)," "~하도록 변경된(adapted to)," "~하도록 만들어진(made to),"또는 "~를 할 수 있는(capable of)"과 바꾸어 사용될 수 있다. 용어 "~하도록 구성(또는 설정)된"은 하드웨어적으로 "특별히 설계된(specifically designed to)"것만을 반드시 의미하지 않을 수 있다. 대신, 어떤 상황에서는, "~하도록 구성된 장치"라는 표현은, 그 장치가 다른 장치 또는 부품들과 함께 "~할 수 있는" 것을 의미할 수 있다. 예를 들면, 문구 "A, B, 및 C를 수행하도록 구성(또는 설정)된 프로세서"는 해당 동작을 수행하기 위한 전용 프로세서(예: 임베디드 프로세서), 또는 메모리 장치에 저장된 하나 이상의 소프트웨어 프로그램들을 실행함으로써, 해당 동작들을 수행할 수 있는 범용 프로세서(generic-purpose processor)(예: CPU 또는 application processor)를 의미할 수 있다.As used herein, the expression “configured to” may mean, for example, “suitable for,” “having the capacity to,” or “having the capacity to.” ," can be used interchangeably with "designed to," "adapted to," "made to," or "capable of." The term “configured (or set) to” may not necessarily mean “specifically designed to” in hardware. Instead, in some contexts, the expression “a device configured to” may mean that the device is “capable of” working with other devices or components. For example, the phrase "processor configured (or set) to perform A, B, and C" refers to a processor dedicated to performing the operations (e.g., an embedded processor), or executing one or more software programs stored on a memory device. By doing so, it may mean a general-purpose processor (eg, CPU or application processor) capable of performing the corresponding operations.
도 1은, 본 출원의 일 측면에 따른, ESG 서비스 제공 시스템의 개략도이다. 1 is a schematic diagram of an ESG service provision system, according to one aspect of the present application.
실시예들에 따른 ESG 서비스 제공 시스템(1)은 전적으로 하드웨어이거나, 전적으로 소프트웨어이거나, 또는 부분적으로 하드웨어이고 부분적으로 소프트웨어인 측면을 가질 수 있다. 예컨대, 시스템은 데이터 처리 능력이 구비된 하드웨어 및 이를 구동시키기 위한 운용 소프트웨어를 통칭할 수 있다. 본 명세서에서 "부(unit)", "시스템" 및 "장치" 등의 용어는 하드웨어 및 해당 하드웨어에 의해 구동되는 소프트웨어의 조합을 지칭하는 것으로 의도된다. 예를 들어, 하드웨어는 CPU(Central Processing Unit), GPU(Graphic Processing Unit) 또는 다른 프로세서(processor)를 포함하는 데이터 처리 기기일 수 있다. 또한, 소프트웨어는 실행중인 프로세스, 객체(object), 실행파일(executable), 실행 스레드(thread of execution), 프로그램(program) 등을 지칭할 수 있다.The ESG service provision system 1 according to embodiments may be entirely hardware, entirely software, or may have aspects that are partly hardware and partly software. For example, a system may collectively refer to hardware equipped with data processing capabilities and operating software for running it. In this specification, terms such as “unit,” “system,” and “device” are intended to refer to a combination of hardware and software driven by the hardware. For example, the hardware may be a data processing device that includes a Central Processing Unit (CPU), Graphics Processing Unit (GPU), or other processor. Additionally, software may refer to a running process, object, executable, thread of execution, program, etc.
도 1을 참조하면, 상기 ESG 서비스 제공 시스템(1)이 제공하는 ESG 서비스는 ESG 문서 내 비정형 형식의 ESG 데이터를 정형 형식으로 변경하는 정형화 보조 툴 제공 서비스를 포함한다. 상기 ESG 서비스 제공 시스템(1)은 이 서비스를 제공하기 위해, 데이터베이스 서버(200)와 연결된 전자 장치(100)를 포함한다. Referring to FIG. 1, the ESG service provided by the ESG service providing system 1 includes a standardization auxiliary tool providing service that changes ESG data in an unstructured format within an ESG document into a structured format. The ESG service providing system 1 includes an electronic device 100 connected to a database server 200 to provide this service.
상기 데이터베이스 서버(200)는 통신부(210) 및 하나 이상의 저장소를 포함한다. 특정 실시 예들에서, 상기 데이터베이스 서버(200)는 ESG 문서 DB(220), ESG 관리 항목 DB(230) 및 파싱 텍스트 DB(240) 중 하나 이상의 저장소를 포함할 수도 있다. The database server 200 includes a communication unit 210 and one or more storage units. In certain embodiments, the database server 200 may include one or more of an ESG document DB 220, an ESG management item DB 230, and a parsed text DB 240.
통신부(210)는 전자 장치(100)와 같은 외부 장치들과 데이터를 유/무선의 전기 통신으로 송수신하도록 구성된다. 상기 데이터베이스 서버(200)는 통신부(210)를 통해 하나 이상의 저장소에 데이터를 저장하거나 저장된 데이터를 외부 장치로 제공할 수도 있다. The communication unit 210 is configured to transmit and receive data with external devices such as the electronic device 100 through wired/wireless electrical communication. The database server 200 may store data in one or more storages or provide the stored data to an external device through the communication unit 210.
상기 통신부(210)는 송신기(transmitter), 수신기(receiver), 송수신기(transceiver), 통신부(communication unit), 통신 모뎀(communication model) 또는 통신 회로(communication circuit)로 지칭할 수 있다. 통신부(210)는 유선 접속 시스템 및 무선 접속 시스템들인 IEEE(institute of electrical and electronics engineers) 802.xx 시스템, IEEE Wi-Fi 시스템, 3GPP(3rd generation partnership project) 시스템, 3GPP LTE(long term evolution) 시스템, 3GPP 5G NR(new radio) 시스템, 3GPP2 시스템, 블루투스(Bluetooth) 등 다양한 무선 통신 규격 중 적어도 하나를 지원할 수 있다.The communication unit 210 may be referred to as a transmitter, receiver, transceiver, communication unit, communication modem, or communication circuit. The communication unit 210 uses wired access systems and wireless access systems such as the IEEE (institute of electrical and electronics engineers) 802.xx system, IEEE Wi-Fi system, 3rd generation partnership project (3GPP) system, and 3GPP LTE (long term evolution) system. , 3GPP 5G NR (new radio) system, 3GPP2 system, and Bluetooth can support at least one of various wireless communication standards.
ESG 문서 DB(220)는 아래에서 서술할, 정형 데이터 처리부(140)에 의해 획득된, ESG 문서를 정형화 처리한 데이터를 저장한다. 일부 실시 예들에서, ESG 문서 DB(220)는 정형 데이터 처리부(140)에 의해 테이블 변환 처리된 각각의 ESG 문서별 항목 및 그 값을 저장할 수도 있다. The ESG document DB 220 stores data obtained by formalizing and processing ESG documents, which will be described below, obtained by the structured data processing unit 140. In some embodiments, the ESG document DB 220 may store items and their values for each ESG document that has been table converted by the structured data processing unit 140.
ESG 문서 DB(220)에 저장되는 테이블 변환 처리 결과 데이터는 아래에서 정형 데이터 처리부(140)를 참조해 보다 상세히 서술한다. The table conversion processing result data stored in the ESG document DB 220 is described in more detail below with reference to the structured data processing unit 140.
ESG 관리 항목 DB(230)는 비정형 ESG 데이터를 정형화 데이터로 변환하는데 요구되는 관리 항목을 저장한다. The ESG management item DB 230 stores management items required to convert unstructured ESG data into standardized data.
일부 실시 예들에서, ESG 관리 항목 DB(230)는 하나 이상의 대분류에 대한 항목 세트를 저장할 수도 있다. 상기 대분류는 보고서의 작성 기준, ESG 주제 풀로 이루어진다. 일부 실시 예들에서, 상기 대분류는 지속가능성 보고서의 공시 기준인 GRI(Global Reporting Intiative) 또는 미국 지속가능회계기준위원회, SASB(Sustainability Accounting Standards Board), TCFD(Task Force on Climate-Related Financial Disclosures), UN SDGs(UN Sustainable Development Goals), 산업통상부의 ESG 가이드라인(또는 K-ESG로 지칭됨)가 제공하는 산업별로 구분한 중요성 주제, 기준을 포함할 수도 있다. In some embodiments, the ESG management item DB 230 may store item sets for one or more major categories. The above major categories are comprised of reporting standards and ESG topic pools. In some embodiments, the major categories are the Global Reporting Initiative (GRI), which is a disclosure standard for sustainability reports, or the U.S. Sustainability Accounting Standards Board (SASB), Task Force on Climate-Related Financial Disclosures (TCFD), and the United Nations. It may also include important topics and standards classified by industry provided by SDGs (UN Sustainable Development Goals) and the Ministry of Trade, Industry and Energy's ESG guidelines (or referred to as K-ESG).
예를 들어, 상기 ESG 관리 항목 DB(230)는 GRI, SASB, TCFD, UN-SDGs, K-ESG, 및/또는 기타 기준으로 이루어진 대분류를 저장할 수도 있다. For example, the ESG management item DB 230 may store major classifications based on GRI, SASB, TCFD, UN-SDGs, K-ESG, and/or other standards.
각 대분류에 대한 항목 세트는 해당 대분류의 기준, 주제에서 작성을 요구하는 ESG 키워드, ESG 주제 항목을 포함할 수도 있다. 각 대분류에 대한 항목 세트는 각각의 대분류가 공통으로 포함하는 주제 항목(공통 주제 항목)을 포함할 수도 있다. 또한, 각 대분류에 대한 항목 세트는 개별 대분류에 고유한 복수의 다른 항목을 포함할 수도 있다. 예를 들어, GRI 대분류의 항목 세트는 GRI200, GRI300, GRI400의 문서 항목을 포함할 수도 있다. The item set for each subcategory may include the criteria for that subcategory, ESG keywords required to be created in the topic, and ESG topic items. The item set for each major category may include topic items that each major category includes in common (common topic items). Additionally, the item set for each subcategory may include a plurality of other items that are unique to the individual subcategory. For example, the item set of the GRI major category may include document items of GRI200, GRI300, and GRI400.
상기 ESG 관리 항목DB(230)는 항목 세트 내 각각의 항목을 해당 코드 값 및/또는 데이터 세트 값으로 저장할 수도 있다. The ESG management item DB 230 may store each item in the item set as a corresponding code value and/or data set value.
일부 실시 예들에서, 상기 대분류에 대한 항목 세트는 평가 대상 기업의 산업에 기초하여 더 분류될 수도 있다. 동일 대분류가 적용되어도 평가 대상 기업의 산업 군에 따라 항목 세트가 상이할 수도 있다. 예를 들어, SASB는 헬스케어 산업에 대해서는 '정보 보안'을 중요 주제로 선정한 반면 전력 산업에 대해서는 중요 주제로 선정하지 않았다. 따라서, SASB가 헬스케어 산업에 속하는 평가 대상 기업에 적용될 경우 '정보 보안' 키워드, 관련 항목은 대응한 비정형 ESG 데이터를 추출하는데 이용되고, SASB가 전력 산업에 속하는 평가 대상 기업에 적용될 경우 '정보 보안' 키워드, 관련 항목은 대응한 비정형 ESG 데이터를 추출하는데 이용되지 않을 수도 있다. In some embodiments, the item sets for the major categories may be further classified based on the industry of the company being evaluated. Even if the same major classification is applied, the item set may be different depending on the industry group of the company being evaluated. For example, SASB selected 'information security' as an important topic for the healthcare industry, but did not select it as an important topic for the electric power industry. Therefore, when SASB is applied to companies subject to evaluation belonging to the healthcare industry, the 'information security' keyword and related items are used to extract corresponding unstructured ESG data, and when SASB is applied to companies subject to evaluation belonging to the electric power industry, 'information security' keywords and related items are used to extract corresponding unstructured ESG data. ' Keywords and related items may not be used to extract corresponding unstructured ESG data.
일부 실시 예들에서, 상기 ESG 문서 내 복수의 항목은 계층 구조로 지정될 수도 있다. 각각의 대분류의 항목 세트 내 각각의 항목은 최상위 레벨부터 최하위 레벨별로 추가 분류될 수도 있다. 예를 들어, GRI 대분류의 항목 세트에서 최상위 레벨(레벨 1)은 공통 주제, GRI200, GRI300, GRI400을 포함할 수도 있다. 공통 주제의 레벨 1에서 다음 레벨(레벨 2)은 조직프로필, 전략, 거버넌스를 포함할 수도 있다. 조직프로필의 레벨 2에서 다음 레벨(레벨 3)은 조직의 규모, 임직원을 포함할 수도 있다. 조직의 규모의 레벨 3에서 다음 레벨(레벨 4)은 국내 임직원 수, 해외 임직원 수, 사업장 수, 순매출액을 포함할 수도 있다. In some embodiments, multiple items in the ESG document may be specified in a hierarchical structure. Each item within the item set of each major category may be further classified from the highest level to the lowest level. For example, in the item set of a GRI major category, the highest level (level 1) may include common topics, GRI200, GRI300, and GRI400. The next level from level 1 of common topics (level 2) may include organizational profile, strategy, and governance. The next level (level 3) from level 2 of the organization profile may include the size of the organization and its employees. The next level from level 3 (level 4) of the size of the organization may include the number of domestic employees, number of overseas employees, number of business locations, and net sales.
상기 ESG 문서 항목 및 이를 저장하는 ESG 관리 항목 DB(230)에 대해서는 아래의 도 2a에서 보다 상세히 서술한다. The ESG document items and the ESG management item DB 230 that stores them are described in more detail in FIG. 2A below.
파싱 텍스트 DB(240)는 파싱된 ESG 문서의 텍스트를 저장한다. 일부 실시 예들에서, 상기 파싱된 ESG 문서의 텍스트는 아래에서 서술할, 정형 데이터 처리부(140)로부터 획득될 수도 있다. The parsed text DB 240 stores the text of the parsed ESG document. In some embodiments, the text of the parsed ESG document may be obtained from the structured data processor 140, which will be described below.
상기 파싱된 ESG 문서의 텍스트에 대해서는 정형 데이터 처리부(140)를 참조해 아래에서 보다 상세히 서술한다. The text of the parsed ESG document is described in more detail below with reference to the structured data processing unit 140.
상기 전자 장치(100)는 예를 들어, 랩탑 컴퓨터, 기타 컴퓨팅 장치, 태블릿, 셀룰러 폰, 스마트 폰, 스마트 워치, 스마트 글래스, 헤드 마운트 디스플레이(HMD), 기타 모바일 장치, 기타 웨어러블 장치일 수도 있다.The electronic device 100 may be, for example, a laptop computer, other computing device, tablet, cellular phone, smart phone, smart watch, smart glasses, head mounted display (HMD), other mobile device, or other wearable device.
상기 전자 장치(100)는 비정형 ESG 데이터를 정형화하는 보조 툴을 포함한다. 상기 전자 장치(100)는 획득한 ESG 문서에 포함된 비정형 ESG 데이터를 추출하고, 상기 보조 툴을 이용하여 추출된 비정형 ESG 데이터를 정형화하도록 구성된다. 또한, 상기 전자 장치(100)는 정형화된 ESG 데이터를 데이터베이스 서버(200)로 공급하여 데이터베이스를 구축하는 것을 지원하도록 구성된다. The electronic device 100 includes an auxiliary tool for standardizing unstructured ESG data. The electronic device 100 is configured to extract unstructured ESG data included in the obtained ESG document and standardize the extracted unstructured ESG data using the auxiliary tool. Additionally, the electronic device 100 is configured to support building a database by supplying standardized ESG data to the database server 200.
상기 전자 장치(100)는 데이터베이스 서버(200)와 통신하는 단말 장치로서, 데이터를 처리할 수 있는 적어도 하나의 프로세서, 데이터를 저장하는 메모리, 데이터를 송/수신하는 통신부를 포함한다. The electronic device 100 is a terminal device that communicates with the database server 200 and includes at least one processor capable of processing data, a memory for storing data, and a communication unit for transmitting/receiving data.
특정 실시 예들에서 상기 전자 장치(100)는 도 1에 도시된 것처럼, 통신부(110), 입력부(120), 인터페이스 제공부(130), 정형 데이터 처리부(140) 및 출력부(150)를 포함할 수도 있다. In certain embodiments, the electronic device 100 may include a communication unit 110, an input unit 120, an interface provider 130, a structured data processing unit 140, and an output unit 150, as shown in FIG. 1. It may be possible.
상기 통신부(110)는 데이터베이스 서버(200)와 같은 외부 장치들과 데이터를 유/무선의 전기 통신으로 송수신하도록 구성된다. 상기 전자 장치(100)는 통신부(110)를 통해 입력부(120), 인터페이스 제공부(130), 정형 데이터 처리부(140) 및 출력부(150)에 데이터를 제공하거나 처리 결과를 외부 장치로 제공할 수도 있다. The communication unit 110 is configured to transmit and receive data with external devices such as the database server 200 through wired/wireless electrical communication. The electronic device 100 provides data to the input unit 120, the interface provider 130, the structured data processing unit 140, and the output unit 150 through the communication unit 110, or provides processing results to an external device. It may be possible.
상기 통신부(110)는 통신부(210)와 유사하므로, 자세한 설명은 생략한다. 상기 통신부(110)에 대한 설명은 상기 통신부(210)와의 차이점을 위주로 서술한다. Since the communication unit 110 is similar to the communication unit 210, detailed description is omitted. The description of the communication unit 110 focuses on differences from the communication unit 210.
통신부(110)는 비정형 ESG 데이터를 포함한 ESG 문서를 수신하도록 구성된다. 사용자는 통신부(110)를 통해 복수의 ESG 문서를 웹 페이지에서 수집하고 상기 입력부(120)에 업로드할 수도 있다. The communication unit 110 is configured to receive ESG documents including unstructured ESG data. The user may collect a plurality of ESG documents from a web page through the communication unit 110 and upload them to the input unit 120.
상기 ESG 문서는 정부 웹 페이지, 기업 웹 페이지, 기타 웹 사이트 등에서 이미 공개되어 있는 국내외 평가 대상 기업의 ESG 지속가능 보고서, 또는 개별 기업의 ESG 담당자가 작성하여 배포한 기타 ESG 문서를 포함한다. 상기 평가 대상 기업은 사업체로서의 기업만을 지칭하지 않고 기관, 비영리 단체 등의 다양한 형태의 단체를 포괄하여 지칭할 수 있다.The above ESG documents include ESG sustainability reports of companies subject to domestic and foreign evaluation that are already publicly available on government web pages, corporate web pages, and other websites, or other ESG documents prepared and distributed by ESG managers of individual companies. The company subject to the evaluation may not only refer to a business as a business, but may also encompass various types of organizations such as institutions and non-profit organizations.
상기 ESG 문서는 해당 기업의 홈페이지, 정부 포털 등에서 공개된 DB로 수집할 수도 있다. The ESG documents can also be collected from a public database on the company's website, government portal, etc.
일부 실시 예들에서, 상기 ESG 문서는 정부 문서 DB(310), 고객 문서 DB(320), 및 웹 사이트 문서 DB(330) 중 하나 이상의 외부 DB로부터 획득될 수도 있다. In some embodiments, the ESG document may be obtained from one or more external DBs including government document DB 310, customer document DB 320, and website document DB 330.
상기 정부 문서 DB(310)는 정부 데이터 포털에 액세스하여 검색된 적어도 하나의 기업에 대한 ESG 문서를 수집할 수도 있다. The government document DB 310 may collect ESG documents for at least one searched company by accessing a government data portal.
상기 고객 문서 DB(320)는 상기 시스템(1)과 관련된 고객, 예를 들어, 상기 시스템(1)에서 제공하는 서비스에 가입한 고객 기업의 데이터 포털에 액세스하여 해당 고객에 대한 ESG 문서를 수집할 수도 있다. 단일 고객에 대해 다수의 ESG 문서가 수집될 수도 있다. The customer document DB 320 accesses the data portal of a customer related to the system 1, for example, a customer company that has subscribed to the service provided by the system 1, and collects ESG documents for the customer. It may be possible. Multiple ESG documents may be collected for a single customer.
상기 웹 사이트 문서 DB(330)는 주요 웹 사이트로 미리 지정된 하나 이상의 웹 사이트 각각에 액세스하고 액세스한 웹 사이트에서 공개된 ESG 문서를 검색하여 수집할 수도 있다. The website document DB 330 may collect ESG documents by accessing each of one or more websites pre-designated as major websites and searching for ESG documents disclosed in the accessed websites.
상기 ESG 데이터는 문서를 생성한 평가 대상 기업의 ESG 현황을 서술하는 정보를 나타낸다. 상기 ESG 문서는 Portable Document Format (PDF) 문서일 수도 있으나, 이에 제한되진 않는다. The ESG data represents information describing the ESG status of the company subject to evaluation that created the document. The ESG document may be a Portable Document Format (PDF) document, but is not limited thereto.
상기 비정형 ESG 데이터는 비정형 포맷으로 ESG 정보를 나타낸 데이터이다. 비정형 데이터는 데이터베이스 서버(200)에서 인식 가능한 구조를 가지지 않는 데이터이다. 상기 비정형 ESG 데이터는 구조화되지 않은 텍스트, 이미지를 포함할 수도 있다. The unstructured ESG data is data that represents ESG information in an unstructured format. Unstructured data is data that does not have a structure that can be recognized by the database server 200. The unstructured ESG data may include unstructured text and images.
**
입력부(120), 인터페이스 제공부(130), 정형 데이터 처리부(140)는 적어도 하나의 프로세서로 구현될 수도 있다. The input unit 120, the interface providing unit 130, and the structured data processing unit 140 may be implemented with at least one processor.
입력부(120)는 통신부(110)로부터 입력된 비정형 ESG 데이터를 포함한 ESG 문서를 정형 데이터 처리부(140)로 공급하도록 구성된다. The input unit 120 is configured to supply an ESG document including unstructured ESG data input from the communication unit 110 to the structured data processing unit 140.
인터페이스 제공부(130)는 ESG 문서의 비정형 데이터를 정형 데이터로 변경하기 위한 사용자의 입력을 수신하도록 구성된다. 상기 인터페이스 제공부(130)는 사용자가 ESG 항목, 코드 값, 데이터 세트 값, 답변 내용 및/또는 최종 입력 필드 값의 내용을 수정하도록 구성된다. The interface provider 130 is configured to receive a user's input for changing unstructured data of an ESG document into structured data. The interface providing unit 130 is configured to allow the user to modify the contents of ESG items, code values, data set values, answer contents, and/or final input field values.
일부 실시 예들에서, 상기 인터페이스 제공부(130)는 데이터베이스 서버(200)의 ESG 관리 항목 DB(230) 내 코드 값, 데이터 세트 값을 기준으로 문서 내에서 사용자 입력을 적용할 항목의 위치를 검색하고, 해당 위치 또는 이를 포함한 페이지로 화면을 이동하도록 출력장치를 제어하도록 구성될 수도 있다. In some embodiments, the interface provider 130 searches for the location of an item to apply user input in a document based on a code value and a data set value in the ESG management item DB 230 of the database server 200. , it may be configured to control the output device to move the screen to the corresponding location or the page containing it.
일부 실시 예들에서, 상기 인터페이스 제공부(130)는 선별 처리 결과에 이상이 있을 경우 사용자가 직접 항목을 수정하도록 보조 툴 인터페이스 화면을 제공할 수도 있다. 상기 보조 툴 인터페이스 화면은 항목 등에 대한 수정 입력을 수신하도록 구성된다. In some embodiments, the interface provider 130 may provide an auxiliary tool interface screen so that the user can directly edit the item if there is an error in the selection process result. The auxiliary tool interface screen is configured to receive correction input for items, etc.
인터페이스 제공부(130)의 동작에 대해서는 아래의 도 2를 참조해 보다 상세히 서술한다.The operation of the interface providing unit 130 will be described in more detail with reference to FIG. 2 below.
상기 정형 데이터 처리부(140)는 ESG 문서 내에 데이터베이스 서버(200)의 ESG 관리 항목 DB(230)에 미리 저장된 복수의 ESG 관리 항목에 대응한 항목 및 상기 항목의 내용을 획득하여 상기 ESG 문서에 대한 정형화된 ESG 데이터를 생성하도록 구성된다. The structured data processing unit 140 obtains items corresponding to a plurality of ESG management items pre-stored in the ESG management item DB 230 of the database server 200 in the ESG document and the contents of the items, and formats the ESG document. It is configured to generate ESG data.
상기 정형 데이터 처리부(140)는 상기 ESG 문서(예를 들어, 지속 가능성 보고서의 PDF 데이터)를 파싱 처리하도록 구성된다. The structured data processing unit 140 is configured to parse and process the ESG document (eg, PDF data of a sustainability report).
또한, 상기 정형 데이터 처리부(140)는 ESG 관리 항목 DB(230)에 미리 저장된 복수의 ESG 관리 항목을 기준으로 문서 내 대응한 항목을 검색하고, 보조 툴을 이용하여 해당 항목의 내용을 획득하도록 구성된다. In addition, the structured data processing unit 140 is configured to search for corresponding items in the document based on a plurality of ESG management items pre-stored in the ESG management item DB 230 and obtain the contents of the corresponding items using an auxiliary tool. do.
이러한 정형 데이터 처리부(140)의 동작에 대해서는 아래의 도 2를 참조해 보다 상세히 서술한다. The operation of this structured data processing unit 140 will be described in more detail with reference to FIG. 2 below.
출력부(150)는 디스플레이 또는 스피커 중에서 하나 이상을 포함할 수 있다. 출력부(150)는 프로세서, 또는 인터페이스 제공부(130), 정형 데이터 처리부(140)의 제어에 따라서 컨텐츠를 출력할 수 있다. 디스플레이는 전자 장치(110)에서 처리되는 정보를 화상으로 표시할 수 있다. 예컨대, 디스플레이는 전자 장치(100)에서 구동되는 응용 프로그램의 실행화면 정보, 또는 이러한 실행화면 정보에 따른 UI(User Interface), GUI(Graphic User Interface) 정보를 표시할 수 있다. 상기 디스플레이는 예를 들어, LCD, OLED, 플렉서블 디스플레이, 기타 디스플레이 구성요소 등을 포함할 수도 있다. The output unit 150 may include one or more of a display or a speaker. The output unit 150 may output content under the control of the processor, the interface providing unit 130, or the structured data processing unit 140. The display can display information processed by the electronic device 110 as an image. For example, the display may display execution screen information of an application running on the electronic device 100, or user interface (UI) and graphic user interface (GUI) information according to the execution screen information. The display may include, for example, an LCD, OLED, flexible display, or other display components.
많은 실시 예들에서, 디스플레이는 터치 센서와 상호 레이어 구조를 이루거나 일체형으로 형성된 터치 패널로 구현되어, 입력 인터페이스 화면과 출력 인터페이스 화면을 동시에 제공할 수도 있다. 터치 입력은 (예컨대, 사용자의 신체, 또는 도구 등을 포함한) 포인팅 객체에 의해 입력된다.In many embodiments, the display may be implemented as a touch panel formed in a layered structure or integrated with a touch sensor, and may simultaneously provide an input interface screen and an output interface screen. Touch input is input by a pointing object (eg, including the user's body, a tool, etc.).
출력부(150)는 인터페이스 제공부(130)에서 제공하는 보조 툴 인터페이스 화면을 표시하도록 구성된다. 상기 출력부(150)는 항목 등에 대한 정보를 수정하는 입력칸을 표시할 수도 있다. The output unit 150 is configured to display an auxiliary tool interface screen provided by the interface provider 130. The output unit 150 may display an input box for modifying information about items, etc.
또한, 상기 출력부(150)는 ESG 이미지를 출력할 수도 있다. 또한, 상기 출력부(150)는 파싱 텍스트를 출력할 수도 있다. 일부 실시 예들에서, 상기 출력부(150)는 출력부(150)의 화면 일 부분(예컨대, 일 측면)에 ESG 문서의 이미지를 배치해 출력하고, 다른 일부분 (예컨대, 상단)에 파싱 텍스트를 배치해 출력할 수도 있다. Additionally, the output unit 150 may output an ESG image. Additionally, the output unit 150 may output parsed text. In some embodiments, the output unit 150 places and outputs an image of an ESG document on a portion (e.g., one side) of the screen of the output portion 150, and arranges parsed text on another portion (e.g., the top). You can also print it out.
상기 전자 장치(100), 데이터베이스 서버(200) 또는 시스템(1)이 다른 구성요소를 포함할 수도 있다는 것이 통상의 기술자에게 명백할 것이다. 예를 들어, 상기 데이터베이스 서버(200)는 데이터 엔트리를 위한 입력 장치, 및 인쇄 또는 다른 데이터 표시를 위한 출력 장치를 포함하는, 본 명세서에 서술된 동작에 필요한 다른 하드웨어 요소를 포함할 수도 있다. 또한, 상기 시스템(1)은 데이터베이스 서버(200)와 외부 장치(예를 들어, 사용자 단말, 또는 외부 데이터베이스 등) 사이를 연결하는 네트워크, 네트워크 인터페이스 및 프로토콜 등을 더 포함할 수 있다. It will be apparent to those skilled in the art that the electronic device 100, database server 200, or system 1 may include other components. For example, the database server 200 may include other hardware elements necessary for the operations described herein, including input devices for data entry and output devices for printing or other data presentation. In addition, the system 1 may further include a network, network interface, and protocol connecting the database server 200 and an external device (eg, a user terminal, an external database, etc.).
도 2a 및 도 2b는, 본 출원의 다른 일 측면에 다른, ESG 보조 툴을 이용하여 정형화된 ESG 데이터로 이루어진 ESG 데이터베이스를 구축하는 방법의 흐름도이다. 2A and 2B are flowcharts of a method for building an ESG database consisting of standardized ESG data using an ESG auxiliary tool, according to another aspect of the present application.
도 2a 및 도 2b의 방법은 도 1의 ESG 서비스 제공 시스템과 같은 하나 이상의 컴퓨팅 장치에 의해 수행될 수도 있다. The methods of FIGS. 2A and 2B may be performed by one or more computing devices, such as the ESG service providing system of FIG. 1.
도 2a를 참조하면, 상기 방법은, (예컨대, 통신부(110)에 의해) ESG 문서를 수신하는 단계(S100);를 포함한다. Referring to FIG. 2A, the method includes receiving an ESG document (eg, by the communication unit 110) (S100).
단계(S100)에서 복수의 ESG 문서가 수집될 수도 있다. A plurality of ESG documents may be collected in step S100.
또한, 상기 방법은, (예컨대, 정형 데이터 처리부(140)에 의해) 단계(S100)에서 수신한 ESG 문서를 파싱 처리하고, 파싱된 ESG 문서에 포함되어 있는, 미리 저장된 관리 항목에 해당한 항목의 데이터를 획득하여 정형화된 ESG 데이터를 생성하는 단계(S200)를 포함할 수도 있다. In addition, the method parses the ESG document received in step S100 (e.g., by the structured data processing unit 140), and stores items corresponding to pre-stored management items included in the parsed ESG document. It may also include a step (S200) of acquiring data and generating standardized ESG data.
상기 단계(S200)는, 단계(S100)에서 수신한 ESG 문서를 상기 정형 데이터 처리부(140)로 업로드 하는 단계(S210); 및 상기 ESG 문서를 파싱 처리하는 단계(S220)를 포함한다. The step (S200) includes uploading the ESG document received in step (S100) to the structured data processing unit 140 (S210); and parsing the ESG document (S220).
상기 정형 데이터 처리부(140)는 상기 ESG 문서(예를 들어, 지속 가능성 보고서의 PDF 데이터)를 파싱 처리도록 구성된다. 일부 실시 예들에서, 상기 정형 데이터 처리부(140)는 파싱 툴(parsing tool)을 포함할 수도 있다. 상기 정형 데이터 처리부(140)는 파싱 툴을 이용하여 비정형 데이터를 파싱 처리할 수도 있다. 상기 파싱 툴은 PDFMiner일 수도 있으나, 이에 제한되진 않는다. The structured data processing unit 140 is configured to parse and process the ESG document (eg, PDF data of a sustainability report). In some embodiments, the structured data processing unit 140 may include a parsing tool. The structured data processing unit 140 may parse unstructured data using a parsing tool. The parsing tool may be, but is not limited to, PDFMiner.
예를 들어, 상기 정형 데이터 처리부(140)는 상기 파싱 툴을 PDF 포맷의 ESG 문서에 적용하여 파싱된 PDF 데이터를 생성할 수도 있다. 상기 파싱 툴은 PDF 포맷의 ESG 문서로부터 하나 이상의 텍스트 줄을 포함한 텍스트 블록, 이미지, 및/또는 기하학 형상(geometric shapes)을 추출할 수도 있다. For example, the structured data processing unit 140 may apply the parsing tool to an ESG document in PDF format to generate parsed PDF data. The parsing tool may extract text blocks containing one or more lines of text, images, and/or geometric shapes from an ESG document in PDF format.
일부 실시 예들에서, 추출된 텍스트 블록은 텍스트, 바운딩 박스, 텍스트 라인의 속성 중 적어도 하나의 속성을 가질 수도 있다. 예를 들어, 파싱된 PDF 데이터는 추출된 텍스트 블록을 포함하며, 각 텍스트 블록은 하나 이상의 텍스트 라인을 포함할 수도 있다. In some embodiments, the extracted text block may have at least one attribute among text, bounding box, and text line attributes. For example, parsed PDF data may contain extracted text blocks, each text block containing one or more lines of text.
일부 실시 예들에서, 각각의 텍스트 라인은 해당 라인의 텍스트, 및 라인을 둘러싼 바운딩 박스의 속성 중 적어도 하나의 속성을 가질 수도 있다. 상기 텍스트 블록 또는 텍스트 라인의 바운딩 박스는 각각의 텍스트 블록 또는 텍스트 라인이 일반적으로 차지하는 페이지의 영역을 정의하는, 텍스트 블록 주위의 박스이다. 상기 바운딩 박스는 직사각형 형상의 박스를 지칭할 수도 있다. In some embodiments, each text line may have at least one attribute among the text of the line and the attribute of a bounding box surrounding the line. The bounding box of the text block or text line is the box around the text block, defining the area of the page that each text block or text line generally occupies. The bounding box may also refer to a rectangular box.
일부 실시 예들에서, 상기 비정형 ESG 데이터가 이미지 데이터를 포함할 경우, 상기 정형 데이터 처리부(140)는 파싱 처리 이전에 ESG 문서의 이미지 데이터를 OCR(Optical Character Recognition) 처리하여 비정형 텍스트를 인식하도록 더 구성될 수도 있다. 일부 실시 예들에서, 상기 파싱 툴은 OCR 처리 가능하도록 구성될 수도 있다. 그러면, 파싱 툴을 이용하여 OCR 처리 및 파싱 처리를 동시에 수행함으로써, 텍스트 박스 내 텍스트를 인식하고 텍스트가 인식된 PDF 페이지 내 구조(예컨대, 텍스트 속성)를 분석할 수도 있다.In some embodiments, when the unstructured ESG data includes image data, the structured data processing unit 140 is further configured to recognize the unstructured text by OCR (Optical Character Recognition) processing of the image data of the ESG document prior to parsing processing. It could be. In some embodiments, the parsing tool may be configured to enable OCR processing. Then, by simultaneously performing OCR processing and parsing processing using a parsing tool, the text in the text box can be recognized and the structure (eg, text attributes) in the PDF page where the text is recognized can be analyzed.
파싱 툴에 의해 추출된 이미지는 각각의 바운딩 박스와 연관될 수도 있다. Images extracted by a parsing tool may be associated with each bounding box.
파싱 툴에 의해 추출되는 기하학적 형상은, 예를 들어 테이블, 벡터 그림에 나타난 선, 곡선, 직사각형, 기타 도형 객체를 포함할 수도 있다. 파싱 툴은 PDF 페이지의 이미지, 테이블 주변의 바운딩 박스를 찾아 추출할 수도 있다. Geometric shapes extracted by a parsing tool may include, for example, lines, curves, rectangles, and other geometric objects shown in tables or vector drawings. The parsing tool can also find and extract bounding boxes around images and tables on PDF pages.
이와 같이 정형 데이터 처리부(140)의 파싱 결과는 텍스트 블록, 텍스트 라인, 이미지, 및/또는 기하학적 형상이 차지하는 ESG PDF 문서의 페이지의 영역, 부분을 정의하는 다양한 바운딩 박스를 포함할 수도 있다. In this way, the parsing result of the structured data processing unit 140 may include various bounding boxes that define the area or portion of the page of the ESG PDF document occupied by text blocks, text lines, images, and/or geometric shapes.
일부 실시 예들에서, 상기 정형 데이터 처리부(140)는 파싱 결과에 포함된 파싱된 ESG 문서의 텍스트를 데이터베이스 서버(200)로 전송하여 파싱 텍스트 DB(240)에 저장할 수도 있다. In some embodiments, the structured data processing unit 140 may transmit the text of the parsed ESG document included in the parsing result to the database server 200 and store it in the parsed text DB 240.
또한, 상기 방법은, 미리 저장된 복수의 ESG 관리 항목 중 적어도 하나에 대응하는 항목을 단계(S220)에서 파싱된 ESG 문서가 포함하는지 스크리닝하는 단계(S230)를 포함한다. Additionally, the method includes a step (S230) of screening whether the ESG document parsed in step (S220) includes an item corresponding to at least one of a plurality of pre-stored ESG management items.
일부 실시 예들에서, 상기 단계(S230)는, ESG 관리 항목 DB(230)에 저장된 각 ESG 관리 항목별 코드 값 및/또는 데이터 세트 값을 기준으로 파싱된 ESG 문서에 해당 항목을 포함하는지 여부를 판단하는 것일 수도 있다. In some embodiments, the step (S230) determines whether the parsed ESG document includes the corresponding item based on the code value and/or data set value for each ESG management item stored in the ESG management item DB 230. It may be that you do it.
상기 일부 실시 예들에서, 정형 데이터 처리부(140)는 ESG 관리 항목 DB(230)에 저장된 코드 값 및/또는 데이터 세트 값을 기준으로 파싱된 ESG 문서에 해당 항목을 포함하는지 여부를 판단하는, 스크리닝 동작을 수행하도록 구성된다. In some of the above embodiments, the structured data processing unit 140 performs a screening operation to determine whether the parsed ESG document includes the corresponding item based on the code value and/or data set value stored in the ESG management item DB 230. It is configured to perform.
상기 ESG 관리 항목 DB(230)는 복수의 ESG 관리 항목을 저장한다. 각각의 ESG 관리 항목은 적어도 하나의 코드 값 및/또는 적어도 하나의 데이터 세트 값을 포함할 수도 있다. 그러면, 상기 ESG 관리 항목 DB(230)에 저장된 ESG 문서 항목을 구성하는 코드 값, 데이터 세트 값은 파싱된 ESG 문서가 저장된 해당 항목을 포함하고 있는 지를 판단하기 위한 기준으로 이용될 수도 있다.The ESG management item DB 230 stores a plurality of ESG management items. Each ESG management item may include at least one code value and/or at least one data set value. Then, the code value and data set value constituting the ESG document item stored in the ESG management item DB 230 may be used as a standard for determining whether the parsed ESG document includes the stored item.
상기 정형 데이터 처리부(140)는 코드 값, 데이터 세트 값이 파싱된 ESG 문서에서 검색된 경우, 파싱된 ESG 문서가 ESG 관리 항목 DB(230)에 저장된 ESG 문서 항목 중 적어도 하나를 갖고 있는 것으로 판단한다. 검색된 코드 값, 데이터 세트 값에 대응한 항목이 상기 파싱된 ESG 문서에 포함된 것으로 판단된다. When the code value and data set value are retrieved from the parsed ESG document, the structured data processing unit 140 determines that the parsed ESG document has at least one of the ESG document items stored in the ESG management item DB 230. It is determined that items corresponding to the searched code value and data set value are included in the parsed ESG document.
그러면, 단계(S230)에서 정형 데이터 처리부(140)는 파싱된 ESG 문서가 포함하는 것으로 추정되는, ESG 관리 항목에 대응한 항목의 목록을 획득할 수도 있다. Then, in step S230, the structured data processing unit 140 may obtain a list of items corresponding to ESG management items that are estimated to be included in the parsed ESG document.
일부 실시 예들에서, 상기 방법은, 스크리닝 결과에 이상이 없는지 여부를 판단하는 단계(S240)를 더 포함할 수도 있다. 상기 단계(S240)는 아래에서 서술할 단계(S250) 이전에 수행될 수도 있다. In some embodiments, the method may further include determining whether there is an abnormality in the screening result (S240). The step (S240) may be performed before the step (S250) described below.
여기서 이상 스크리닝 결과는 ESG 문서 내 ESG 관리 항목이 아닌데도 ESG 관리 항목으로 잘못 선별된 것을 나타낸다. Here, the abnormal screening result indicates that it was incorrectly selected as an ESG management item even though it was not an ESG management item in the ESG document.
ESG 문서 내에 미리 저장된 ESG 관리 항목에 대응한 코드 값 및/또는 데이터 세트 값에 매칭되는 코드 값 및/또는 데이터 세트 값이 검색되어도, 검색된 값이 실제로는 문서 내 ESG 관리 항목과 관련이 없는 데이터일 수도 있다. 예를 들어, GRI 기준에 따른 ESG 관리 항목은 102-1과 같이 '3자리 숫자', '붙임표(hyphen, -)', '1 또는 2자리 숫자'가 순차적으로 배열된 구조를 가진다. ESG 문서 내에 GRI 기준에 따른 ESG 관리 항목이 아닌, 별도의 동일 구조의 데이터가 우연히 포함되어 있을 수가 있다. 이 경우, ESG 관리 항목과 관련이 없는 데이터가 코드 값 및/또는 데이터 세트 값에 매칭되는 결과로 검색될 수도 있고, 그러면 정형 데이터 처리부(140)는 ESG 문서가 ESG 관리 항목을 포함한 스크리닝 결과가 산출될 수도 있다. Even if code values and/or data set values matching code values and/or data set values corresponding to ESG management items pre-stored in the ESG document are searched, the searched values may actually be data unrelated to the ESG management items in the document. It may be possible. For example, ESG management items according to GRI standards have a structure of '3-digit number', 'hyphen (-)', and '1 or 2-digit number' arranged sequentially, such as 102-1. ESG documents may accidentally contain separate data with the same structure rather than ESG management items according to GRI standards. In this case, data unrelated to ESG management items may be searched as a result matching the code value and/or data set value, and then the structured data processing unit 140 produces a screening result in which the ESG document includes the ESG management item. It could be.
일부 실시 예들에서, 상기 단계(S240)는, 사용자의 확인 입력 및/또는 ESG 문서 내에서 코드 값 및/또는 데이터 세트 값에 매칭한 데이터에 대한 주변 데이터에 기초하여 스크리닝 결과의 이상 여부를 판단할 수도 있다. In some embodiments, the step (S240) determines whether the screening result is abnormal based on the user's confirmation input and/or surrounding data for data matching the code value and/or data set value in the ESG document. It may be possible.
정형 데이터 처리부(140)는 미리 저장된 ESG 관리 항목에 대응한 코드 값 및/또는 데이터 세트 값에 매칭한 데이터의 위치를 제공하고, 제공된 위치에 대해 확인 입력이 수신되면 이상이 없는 것으로 판단할 수도 있다(S240). 정형 데이터 처리부(140)가 매칭한 데이터의 위치를 인터페이스 제공부(130)로 공급하면, 인터페이스 제공부(130)는 매칭한 데이터의 위치를 포함한 보조 툴 인터페이스 화면을 표시하여, 각 위치의 데이터가 ESG 관리 항목인지를 확인하는 사용자 입력을 유도할 수도 있다(S240). The structured data processing unit 140 provides the location of data matching the code value and/or data set value corresponding to the pre-stored ESG management item, and may determine that there is no abnormality when a confirmation input is received for the provided location. (S240). When the structured data processing unit 140 supplies the location of the matched data to the interface provider 130, the interface provider 130 displays an auxiliary tool interface screen including the location of the matched data, and the data at each location is displayed. User input may be induced to check whether it is an ESG management item (S240).
또한, 정형 데이터 처리부(140)는 미리 저장된 ESG 관리 항목에 대응한 코드 값 및/또는 데이터 세트 값에 매칭한 데이터의 위치를 기준으로 일정 범위 이내에 배치된, 주변 데이터에 기초하여 매칭한 데이터가 실제로 ESG 관리 항목에 대응하는 지를 판단할 수도 있다(S240). In addition, the structured data processing unit 140 may determine that the data matched based on surrounding data, placed within a certain range based on the location of the data matching the code value and/or data set value corresponding to the pre-stored ESG management item, is actually It is also possible to determine whether it corresponds to ESG management items (S240).
또한, 상기 단계(S240)는, 이상이 있을 경우 ESG 문서에 포함된 것으로 선별된 결과 중 적어도 일부를 수정하는 단계를 포함할 수도 있다. Additionally, the step (S240) may include a step of modifying at least some of the results selected to be included in the ESG document if there is an error.
상기 단계(S240)에서 정형 데이터 처리부(140)에서 스크리닝 결과에 이상이 있다고 판단된 경우 인터페이스 제공부(130)는 이상 스크리닝 결과를 갖는 데이터를 수정하기 위한 보조 툴 인터페이스 화면을 제공할 수도 있다. 상기 보조 툴 인터페이스 화면은 ESG 관리 항목으로 잘못 선별된 데이터를 선별 결과에서 제거하는 입력을 수신하도록 구성된다. 정형 데이터 처리부(140)는 이 제거 입력을 수신하여 선별 결과를 수정하고, 정형 데이터로 변환할 ESG 관리 항목 목록을 최종 선별할 수도 있다. If the structured data processing unit 140 determines that there is an abnormality in the screening result in step S240, the interface providing unit 130 may provide an auxiliary tool interface screen for modifying data with the abnormal screening result. The auxiliary tool interface screen is configured to receive an input for removing data incorrectly selected as ESG management items from the selection results. The structured data processing unit 140 may receive this removal input, modify the selection result, and finally select a list of ESG management items to be converted to structured data.
또한, 상기 방법은, ESG 관리 항목 DB(230)에 저장하고 있는 ESG 관리 항목에 대응한 항목이 문서 내에 포함되었는지 여부에 따라 ESG 문서 내 항목에 대해 선별 상태를 지정하는 단계(S250)를 포함한다. 일부 실시 예들에서, 상기 단계(S250)는 단계(S240)에서 스크리닝 결과에 이상이 없는 경우에 수행될 수도 있다. In addition, the method includes a step (S250) of specifying a selection status for items in the ESG document depending on whether an item corresponding to the ESG management item stored in the ESG management item DB 230 is included in the document. . In some embodiments, step S250 may be performed when there is no abnormality in the screening result in step S240.
상기 단계(S250)에서 상기 데이터 처리부(140)는, 파싱된 ESG 문서의 선별 상태를 지정하기 위해, 파싱된 ESG 문서 내에 해당 항목이 포함되어 있으면 상기 ESG 문서를 제1 선별 상태로 지정하고, 해당 항목이 포함되어 있지 않으면 상기 ESG 문서를 제2 선별 상태로 지정할 수도 있다. In the step (S250), in order to specify the selection status of the parsed ESG document, the data processing unit 140 designates the ESG document as the first selection status if the parsed ESG document contains the corresponding item, and If the item is not included, the ESG document may be assigned a second screening status.
일부 실시 예들에서, 상기 ESG 문서의 선별 상태를 지정하는 단계(S250)는, 선별 여부를 가리키는 체크 박스를 온/오프 처리하는 것으로 구현될 수도 있다. 상기 일부 실시 예들에서, 상기 제1 선별 상태 또는 제2 선별 상태의 지정은 선별 여부를 가리키는 체크 박스를 온/오프 처리하는 것으로 구현될 수도 있다. 예를 들어, 상기 정형 데이터 처리부(140)는 파싱된 ESG 문서 내에 해당 항목이 포함되어 있으면 체크 박스를 온 처리하여 상기 ESG 문서를 제1 선별 상태로 지정하고, 해당 항목이 포함되어 있지 않으면 체크 박스를 오프 처리하여 상기 ESG 문서를 제2 선별 상태로 지정할 수도 있다.In some embodiments, the step of specifying the selection status of the ESG document (S250) may be implemented by turning on/off a check box indicating whether the ESG document is selected. In some of the above embodiments, designation of the first selection state or the second selection state may be implemented by turning on/off a check box indicating whether to select. For example, if the corresponding item is included in the parsed ESG document, the structured data processing unit 140 turns on a check box to designate the ESG document as the first selection state, and if the corresponding item is not included, the The ESG document may be designated as a second selection state by processing off.
또한, 상기 방법은, 선별 상태의 지정 결과에 따라 미리 저장된 복수의 ESG 관리 항목에 대한 최종 입력 필드 값의 입력 칸을 활성화하거나 또는 비활성화하는 단계(S260)를 포함한다.Additionally, the method includes a step (S260) of activating or deactivating the input box of the final input field value for a plurality of pre-stored ESG management items according to the result of specifying the selection state.
*일부 실시 예들에서, 상기 정형 데이터 처리부(140)는 인터페이스 제공부(130)로부터 선별 처리 결과에 이상이 없음을 나타낸 신호를 수신할 수도 있다. 상기 정형 데이터 처리부(140)는 해당 항목의 '최종 입력 필드 값'의 입력 칸의 활성화/비활성화는 상기 신호의 수신에 반응하여 수행될 수도 있다(S260). *In some embodiments, the structured data processing unit 140 may receive a signal from the interface providing unit 130 indicating that there is no abnormality in the selection processing result. The structured data processing unit 140 may activate/deactivate the input box of the 'final input field value' of the corresponding item in response to receiving the signal (S260).
상기 정형 데이터 처리부(140)는 선별 처리가 이상 없음을 나타낸 신호를 수신하면, 체크박스를 온 처리하여 제1 선별 상태로 지정한 경우 해당 항목의 '최종 입력 필드 값'의 입력 칸을 활성화하거나, 또는 체크박스를 오프 처리하여 제2 선별 상태로 지정한 경우 해당 항목의 '최종 입력 필드 값'의 입력 칸을 비활성화할 수도 있다. When the structured data processing unit 140 receives a signal indicating that the selection process is normal, it turns on the checkbox and activates the input box of the 'final input field value' of the corresponding item when it is designated as the first selection state, or If the checkbox is turned off and the second selection state is set, the input box of the 'final input field value' of the corresponding item can be deactivated.
상기 단계(S260)에서 상기 정형 데이터 처리부(140)는 문서에 포함된 것으로 판단된 해당 항목의 '최종 입력 필드 값'의 입력 칸을 활성화 또는 비활성화할 수도 있다. 상기 입력 칸의 활성화 또는 비활성화 결과는 보조 툴 인터페이스 화면을 통해 제공될 수도 있다. In step S260, the structured data processing unit 140 may activate or deactivate the input box for the 'final input field value' of the corresponding item determined to be included in the document. The result of activating or deactivating the input box may be provided through the auxiliary tool interface screen.
도 3은, 본 출원의 일 실시 예에 따른, 항목의 최종 입력 필드 값의 입력 칸을 포함한 보조 툴 인터페이스 화면을 도시한다. Figure 3 shows an auxiliary tool interface screen including an input box for the final input field value of an item, according to an embodiment of the present application.
도 3을 참조하면, 상기 보조 툴 인터페이스 화면은 문서에 포함된 것으로 판단된 해당 항목을 포함할 수도 있다.. Referring to FIG. 3, the auxiliary tool interface screen may include corresponding items determined to be included in the document.
다시 도 2를 참조하면, 상기 방법은, 문서에 포함된 것으로 판단된, ESG 관리 항목에 대응한 항목의 내용을 획득하는 단계(S270)를 포함한다. Referring again to FIG. 2, the method includes a step (S270) of obtaining content of an item corresponding to an ESG management item determined to be included in the document.
도 2b는, 도 2a의 단계(S270)의 세부 흐름도이다. FIG. 2B is a detailed flowchart of step S270 of FIG. 2A.
정형 데이터 처리부(140)는 제1 선별 상태로 지정된 ESG 관리 항목의 입력 값을 획득하도록 구성된다. The structured data processing unit 140 is configured to obtain the input value of the ESG management item specified in the first selection state.
정형 데이터 처리부(140)는 제1 선별 상태로 지정된 ESG 관리 항목에 대응한 항목에 대해서, 그 내용을 획득하기 위해 파싱된 ESG 문서 또는 등록된 다른 ESG 문서 내 데이터를 추출할 수도 있다. The structured data processing unit 140 may extract data from the parsed ESG document or another registered ESG document to obtain the contents of the item corresponding to the ESG management item designated in the first selection state.
*정형 데이터 처리부(140)는, ESG 문서 DB(220) 내 등록된 항목 중 상기 문서에 포함된 항목에 대응한 ESG 관리 항목에 매칭하는 등록 항목의 등록 값을 상기 파싱된 ESG 문서에 포함된 항목 내용의 입력 값으로 복사할 수도 있다. 그러면, 정형 데이터 처리부(140)는 상기 특정 항목에 대해서는, 파싱된 ESG 문서에서 인식된 데이터(예컨대, 기록 값) 대신 데이터베이스 서버(200)에 저장된 다른 ESG 문서 내 상기 특정 항목의 등록 데이터를 그대로 활용할 수 있다. *The structured data processing unit 140 selects the registration value of the registered item matching the ESG management item corresponding to the item included in the document among the registered items in the ESG document DB 220 as the item included in the parsed ESG document. You can also copy it as an input value for the content. Then, for the specific item, the structured data processing unit 140 utilizes the registration data of the specific item in another ESG document stored in the database server 200 instead of the data (e.g., recorded value) recognized in the parsed ESG document. You can.
또는, 정형 데이터 처리부(140)는 인터페이스 제공부(130)가 제공한 보조 툴 인터페이스 화면을 통해 상기 ESG 문서의 항목에 대한 입력 값을 입력받을 수도 있다. Alternatively, the structured data processing unit 140 may receive input values for items of the ESG document through an auxiliary tool interface screen provided by the interface providing unit 130.
일부 실시 예들에서, 상기 단계(S270)는, 제1 선별 상태로 지정된 ESG 관리 항목의 상기 ESG 문서 내 위치를 제공하는 단계(S271); 및 제공된 위치에 기초하여 해당 ESG 관리 항목의 내용을 획득하는 단계(S273)를 포함한다. In some embodiments, the step (S270) includes providing a location in the ESG document of an ESG management item designated as a first selection state (S271); and a step (S273) of acquiring the contents of the corresponding ESG management item based on the provided location.
또한, 일부 실시 예들에서, 상기 단계(S273)는, 사용자의 내용 입력에 기초하거나 또는 제공된 위치에 대한 주변 데이터에 기초하여 '최종 필드 입력 값'의 내용을 획득하는 것일 수도 있다. Additionally, in some embodiments, the step (S273) may be to obtain the content of the 'final field input value' based on the user's content input or based on surrounding data for the provided location.
정형 데이터 처리부(140)는 미리 저장된 ESG 관리 항목에 대응한 코드 값 및/또는 데이터 세트 값에 매칭한 데이터의 위치를 제공하고, 제공된 위치의 ESG 관리 항목에 대한 사용자의 내용 입력이 수신되면 해당 입력 값을 '최종 필드 입력 값'의 내용으로 획득할 수도 있다. 정형 데이터 처리부(140)가 매칭한 데이터의 위치를 인터페이스 제공부(130)로 공급하면, 인터페이스 제공부(130)는 매칭한 데이터의 위치를 포함한 보조 툴 인터페이스 화면을 표시하여, 해당 항목의 내용에 대한 사용자 입력을 유도할 수도 있다(S270).The structured data processing unit 140 provides the location of data matching the code value and/or data set value corresponding to the pre-stored ESG management item, and when a user's content input for the ESG management item at the provided location is received, the corresponding input is received. The value can also be obtained as the contents of the ‘final field input value’. When the structured data processing unit 140 supplies the location of the matched data to the interface providing unit 130, the interface providing unit 130 displays an auxiliary tool interface screen including the location of the matched data, and displays the contents of the corresponding item. User input may be induced (S270).
또한, 상기 정형 데이터 처리부(140)는 제공된 위치를 기준으로 일정 범위 이내에 배치된, 주변 데이터에 기초하여 매칭한 데이터가 실제로 ESG 관리 항목에 대응하는 지를 판단할 수도 있다(S270). 상기 범위는 해당 위치 주변의 텍스트 배치 구조(예컨대, 텍스트 블록, 텍스트 라인 등), 텍스트의 수에 기초하여 설정된다. 예를 들어, 상기 범위는 제공된 위치 하단의 텍스트 블록일 수도 있다. 그러면, 해당 항목의 내용은 상기 하단의 텍스트 블록 내 텍스트의 일부 또는 전부로 획득될 수도 있다. In addition, the structured data processing unit 140 may determine whether data matched based on surrounding data placed within a certain range based on the provided location actually corresponds to an ESG management item (S270). The range is set based on the text arrangement structure (eg, text block, text line, etc.) around the location, and the number of texts. For example, the range may be a block of text below a given location. Then, the content of the item may be obtained as part or all of the text in the text block at the bottom.
일부 실시 예들에서, 상기 단계(S270)는, 기존 ESG 문서 내 데이터를 이용하겠다는 사용자 입력을 수신한 경우, 상기 기존 ESG 문서 내 데이터를 해당 항목에 대한 내용으로 획득하는 단계(S275);를 더 포함할 수도 있다. 상기 단계(S271, S273)는 기존 ESG 문서 내 데이터를 이용하지 않겠다는 사용자 입력을 수신한 이후에 수행될 수도 있다. In some embodiments, the step (S270) further includes, when a user input to use data in an existing ESG document is received, obtaining the data in the existing ESG document as content for the corresponding item (S275). You may. The steps (S271, S273) may be performed after receiving a user input indicating not to use data in an existing ESG document.
상기 기존 ESG 문서는 평가 대상 기업의 이전 ESG 문서를 포함한다. The existing ESG documents include previous ESG documents of the company being evaluated.
ESG 문서는 단일 평가 대상 기업이 시계열 순서에 따라 생성하는 것이 일반적이다. 평가 대상 기업의 변화는 상대적으로 느리므로, 근시일 단위(예컨대, 분기, 반기, 년도) 차이의 ESG 문서는 부분적으로 동일한 항목에 대해 동일한 내용을 가질 수도 있다. 이 경우, 상기 정형 데이터 처리부(140)는 기존 ESG 문서의 데이터를 이번에 새롭게 생성할 ESG 문서에 그대로 이용할 수도 있다. ESG documents are typically created by a single company subject to evaluation in a time series sequence. Because changes in the companies being evaluated are relatively slow, ESG documents that differ by a short period of time (e.g., quarter, half-year, or year) may have partially identical content on the same items. In this case, the structured data processing unit 140 may use the data of the existing ESG document as is in the newly created ESG document.
또한, 상기 방법은, 단계(S250)에서 선별된 ESG 관리 항목의 목록 및 단계(S270)에서 획득된 각각의 ESG 관리 항목의 내용을 테이블 변환 처리하여 정형 데이터를 생성하는 단계(S280)를 포함한다. In addition, the method includes a step (S280) of generating structured data by performing table conversion on the list of ESG management items selected in step (S250) and the contents of each ESG management item obtained in step (S270). .
상기 단계(S280)에서 생성된 정형 데이터는 비정형 ESG 데이터가 ESG 서비스 제공 시스템(1)에서 인식 가능한 데이터 구조를 갖도록 변환된 것이다. The structured data generated in step S280 is unstructured ESG data converted to have a data structure recognizable by the ESG service providing system 1.
단계(S270)에서 획득된 내용은 단계(S250)에서 선별된 각각의 ESG 관리 항목에 매핑된다. 그러면, 정형 데이터 처리부(140)에서 항목/내용 값으로 이루어진 테이블로 변환 처리됨으로써 정형화된 데이터로 변환될 수도 있다. The information obtained in step S270 is mapped to each ESG management item selected in step S250. Then, the structured data processing unit 140 may convert the data into a table consisting of item/content values, thereby converting it into structured data.
정형 데이터 처리부(140)는 테이블 변환 처리 결과를 정형화된 데이터로 데이터베이스 서버(200)로 전송하여 ESG 관리 항목 DB(230)에 저장할 수도 있다. The structured data processing unit 140 may transmit the table conversion processing result as structured data to the database server 200 and store it in the ESG management item DB 230.
다시 도 1을 참조하면, 상기 ESG 서비스 제공 시스템(1)은 이미 저장된 ESG 관리 항목을 수정, 삭제 또는 생성하는, 일련의 관리 동작을 수행하도록 더 구성될 수도 있다. Referring again to FIG. 1, the ESG service providing system 1 may be further configured to perform a series of management operations, such as modifying, deleting, or creating already stored ESG management items.
도 4는, 본 출원의 일 실시 예에 따른, ESG 관리 항목을 관리하는 과정의 흐름도이다. Figure 4 is a flowchart of a process for managing ESG management items according to an embodiment of the present application.
도 4를 참조하면, 상기 과정은, ESG 관리 항목에 대한 수정, 삭제 또는 생성 요청을 수신하기 위해 보조 툴 인터페이스 화면을 표시하는 단계(S291)를 포함한다. Referring to FIG. 4, the process includes a step (S291) of displaying an auxiliary tool interface screen to receive a request for modification, deletion, or creation of an ESG management item.
일부 실시 예들에서, 상기 보조 툴 인터페이스 화면의 표시는 ESG 관리 항목에 대한 관리 기능을 개시하는 동작에 따라 수행될 수도 있다. In some embodiments, display of the auxiliary tool interface screen may be performed according to an operation of initiating a management function for an ESG management item.
상기 보조 툴 인터페이스 화면은 수정 또는 삭제 대상 항목의 선택을 유도하거나 및/또는 기존의 항목과의 관계 구조에 기초하여 신규 대상 항목을 생성하는 것을 유도하기 위해 구성된다. The auxiliary tool interface screen is configured to guide selection of an item to be modified or deleted and/or to create a new target item based on the relationship structure with existing items.
도 5는, 본 출원의 일 실시 예에 따른, 항목 레벨 구조를 표시한 보조 툴 인터페이스 화면을 도시한다. Figure 5 shows an auxiliary tool interface screen displaying an item level structure according to an embodiment of the present application.
도 5를 참조하면, 상기 보조 툴 인터페이스 화면은 대분류별 항목 세트를 각각의 동일한 항목 레벨별로 분류하여 표시할 수도 있다.Referring to FIG. 5, the auxiliary tool interface screen may display a set of items for each major category, categorized by the same item level.
다시 도 4를 참조하면, 상기 과정은, 이미 저장된 ESG 관리 항목이 저장되었는지 확인하는 단계(S292); ESG 관리 항목이 저장되어 있는 경우, ESG 관리 항목에 대한 수정, 삭제 또는 생성 요청을 수신하는 단계(S293); 및 ESG 관리 항목이 저장되어 있지 않는 경우, ESG 관리 항목에 대한 생성 요청을 수신하는 단계(S294)를 포함한다. Referring again to FIG. 4, the process includes checking whether already saved ESG management items have been saved (S292); If the ESG management item is stored, receiving a request to modify, delete, or create the ESG management item (S293); and, if the ESG management item is not stored, receiving a request to create the ESG management item (S294).
상기 전자 장치(100)는 도 5의 보조 툴 인터페이스 화면을 통해 수정 또는 삭제 대상 항목을 선택받고, 대상 항목의 내용을 수정하거나 대상 항목을 ESG 관리 항목 DB(230)에서 삭제할 수도 있다. 또는, 항목 레벨 구조에 기초하여 신규 대상 항목이 추가될 수도 있다.The electronic device 100 may select an item to be modified or deleted through the auxiliary tool interface screen of FIG. 5, and may modify the contents of the target item or delete the target item from the ESG management item DB 230. Alternatively, new target items may be added based on the item level structure.
단계(S293)에서 전자 장치(100)는 도 5의 보조 툴 인터페이스 화면 상에 표시된 '항목 레벨 구조'에서 수정할 항목을 선택하여 항목 수정 요청을 수신할 수도 있다. In step S293, the electronic device 100 may select an item to be modified in the 'item level structure' displayed on the auxiliary tool interface screen of FIG. 5 and receive a request to modify the item.
단계(S293)에서 생성 요청은 기존의 ESG 관리 항목 세트에 새로운 관리 항목을 추가하는 것이다. 상기 전자 장치(100)는 도 5의 보조 툴 인터페이스 화면 상에 표시된 '항목 레벨 구조'에 따라 항목 추가 요청을 수신할 수도 있다. The creation request in step S293 is to add a new management item to the existing set of ESG management items. The electronic device 100 may receive a request to add an item according to the 'item level structure' displayed on the auxiliary tool interface screen of FIG. 5.
상기 항목 수정 요청, 항목 추가 요청 등은 보조 툴 인터페이스 화면을 통해 수신하며, 그러면, 상기 전자 장치(100)는 선택된 항목의 항목 레벨을 획득한다.The item modification request, item addition request, etc. are received through the auxiliary tool interface screen, and then the electronic device 100 obtains the item level of the selected item.
단계(S294)에서 생서 요청은 ESG 관리 항목을 신설하는 것이다. 이는 단계(S293)의 항목 추가와 유사하므로, 자세한 설명은 생략한다. In step S294, the request is to create a new ESG management item. Since this is similar to adding items in step S293, detailed description is omitted.
또한, 일부 실시 예들에서, 도 5의 상기 과정은, 단계(S293)의 요청 대상 항목이 최하위 레벨 항목인지 여부에 따라 입력칸을 활성화 또는 비활성화하는 단계를 더 포함할 수도 있다. Additionally, in some embodiments, the process of FIG. 5 may further include activating or deactivating an input box depending on whether the requested item in step S293 is the lowest level item.
상기 활성화 또는 비활성화하는 단계는, 단계(S293, S294)의 요청 대상 항목이 최하위 레벨 항목이 아닐 경우 대상 항목의 내용에 대한 입력 칸을 비활성화하는 단계(S295); 및 단계(S293, S294)의 요청 대상 항목이 최하위 레벨 항목일 경우 대상 항목의 내용에 대한 입력 칸을 활성화하는 단계(S296)를 포함한다. The activating or deactivating step includes: deactivating the input box for the contents of the target item when the requested target item in steps S293 and S294 is not the lowest level item (S295); and a step (S296) of activating an input box for the contents of the target item when the request target item in steps (S293, S294) is the lowest level item.
상기 단계(S296)에서 상기 입력 칸을 통해 항목에 대한 '답변유형', 항목 내용의 '최종 입력 필드 값', 항목을 나타낼 '코드 값', '데이터 세트 값' 중 하나 이상의 항목 정보를 입력받을 수도 있다. In the step (S296), one or more item information of 'answer type' for the item, 'final input field value' of the item content, 'code value' to represent the item, and 'data set value' may be input through the input box. It may be possible.
상기 인터페이스 제공부(130)는 항목에 대한 '답변유형', 항목 내용의 '최종 입력 필드 값', 항목을 나타낼 '코드 값', '데이터 세트 값' 중 하나 이상의 항목 정보와 같이 대상 항목의 내용을 입력받기 위한 보조 툴 인터페이스 화면을 제공할 수도 있다. The interface providing unit 130 provides the content of the target item, such as one or more item information among the 'answer type' for the item, 'final input field value' of the item content, 'code value' to represent the item, and 'data set value'. An auxiliary tool interface screen may be provided to receive input.
일부 실시 예들에서, 상기 보조 툴 인터페이스 화면은 활성화된 입력 칸을 포함한 제1 서브 영역 및 항목 구조 레벨을 포함한 제2 서브 영역을 포함할 수도 있다. '답변유형', '최종 입력 필드 값', '코드 값, '데이터 세트 값'에 대한 입력은 도 5의 보조 툴 인터페이스 화면의 하단(즉, 제1 서브 영역)에 위치할 수도 있다. 제2 서브 영역에는 대분류별 항목 세트를 각각의 동일한 항목 레벨별로 분류하여 표시된다. In some embodiments, the auxiliary tool interface screen may include a first sub-area including an activated input box and a second sub-area including an item structure level. Inputs for 'answer type', 'final input field value', 'code value', and 'data set value' may be located at the bottom (i.e., first sub-area) of the auxiliary tool interface screen in FIG. 5. In the second sub-area, item sets for each major category are classified and displayed for each same item level.
또한, 상기 과정은 단계(S296) 이후, 활성화된 입력 칸을 통해 수정 또는 생성할 대상 항목의 내용을 입력받는 단계(S297); 및 단계(S297)에서 입력된 항목의 내용을 ESG 관리 항목 DB(230)에 저장하는 단계(S298)를 더 포함할 수도 있다. In addition, the above process includes, after step S296, a step of receiving input of the contents of the target item to be modified or created through the activated input box (S297); And it may further include a step (S298) of storing the contents of the item entered in step (S297) in the ESG management item DB 230.
이와 같이 상기 ESG 서비스 제공 시스템(1)에 의해 비정형 ESG 데이터가 파싱 및 정형화되어 데이터베이스로 구축됨으로써, 빅데이터 관점에서 분석 및 가공 처리에 따라 적절하게 ESG 데이터를 활용할 수 있다.In this way, the unstructured ESG data is parsed and standardized by the ESG service provision system 1 and built into a database, so that the ESG data can be appropriately utilized according to analysis and processing from a big data perspective.
추가적으로, 파싱된 ESG 문서의 텍스트는 ESG 문서를 자동완성하기 위한 기계학습 모델의 학습 데이터로 이용될 수도 있다. 이를 위해, 상기 ESG 서비스 제공 시스템(1)은 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하도록 구성된 시스템에 연결되어, 상기 파싱된 ESG 문서의 텍스트를 제공할 수도 있다.Additionally, the text of the parsed ESG document can be used as training data for a machine learning model to automatically complete the ESG document. To this end, the ESG service providing system 1 may be connected to a system configured to recommend text suitable for automatically completing ESG documents and provide the text of the parsed ESG document.
도 6은, 본 출원의 일 측면에 따른, ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하도록 구성된 시스템의 개략도이고, 도 7은, 본 출원의 일 실시 예에 따른, ESG 자동완성 모델을 생성하는 과정의 개략도이다. Figure 6 is a schematic diagram of a system configured to recommend text suitable for automatically completing ESG documents, according to an aspect of the present application, and Figure 7 is a process for generating an ESG auto-complete model, according to an embodiment of the present application. This is a schematic diagram.
도 6 및 도 7을 참조하면, 상기 ESG 서비스 제공 시스템(1)은 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하도록 구성된 시스템과 연결됨으로써, 상기 ESG 서비스 제공 시스템(1)이 제공하는 ESG 서비스는 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하는 서비스를 더 포함한다. 상기 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하도록 구성된 시스템은 데이터 웨어하우스 시스템(300)과 연결된 서비스 서버(200-1)를 포함한다. 6 and 7, the ESG service providing system 1 is connected to a system configured to recommend text suitable for automatically completing ESG documents, so that the ESG service provided by the ESG service providing system 1 is ESG. It further includes a service that recommends text suitable for automatically completing documents. A system configured to recommend text suitable for automatically completing the ESG document includes a service server 200-1 connected to the data warehouse system 300.
데이터 웨어하우스 시스템(300)는 클라우드 데이터 웨어하우스 시스템 또는 기타 데이터 웨어하우스 시스템을 간단히 지칭하는 것으로서, 데이터 분석 및 보고를 위해, 하나 이상의 다른 소스(disparate sources)로부터 통합된 데이터의 중앙 저장소를 포함한 네트워크-기반 저장 시스템이다. 상기 데이터 웨어하우스 시스템(300)는 기업용 분석 보고서를 생성하기 위해 사용될 수 있는 현재, 과거 데이터를 저장할 수도 있다. 이를 위해, 데이터 웨어하우스 시스템(300)는 비즈니스 인텔리전스 도구(business intelligence tools), 데이터를 추출하고, 변환하며, 이를 저장소로 로드하기 위한 도구, 및 메타데이터를 관리하고 검색하기 위한 도구를 제공한다. Data warehouse system 300 refers simply to a cloud data warehouse system or other data warehouse system, which is a network containing a central repository of integrated data from one or more disparate sources for data analysis and reporting. It is a -based storage system. The data warehouse system 300 may store current and historical data that can be used to generate analysis reports for businesses. To this end, the data warehouse system 300 provides business intelligence tools, tools for extracting data, transforming it, and loading it into storage, and tools for managing and retrieving metadata.
상기 데이터 웨어하우스 시스템(300)는 함수(예를 들어, 구조화된 질의 언어(structured Query Langague, SQL) 함수), 테이블 함수, 또는 프로시저(procedure)를 데이터 웨어하우스 시스템 외부에 있고, 웹 애플리케이션 프로그램 인터페이스(Web application programming interface)로서 노출된 원격 소프트웨어 코드로 바인딩(bind)하기 위한 기능을 제공하도록 구성될 수도 있다. The data warehouse system 300 provides functions (e.g., structured query language (SQL) functions), table functions, or procedures outside the data warehouse system and in a web application program. It may be configured to provide functionality for binding to remote software code exposed as an interface (Web application programming interface).
상기 데이터 웨어하우스 시스템(300)는 외부에서 관리되는 웹 API 관리 시스템 제공된 클라우드 컴퓨팅 서비스 플랫폼(예를 들어, Amazon Web Services®(AWS), Microsoft Azure® 또는 Google Cloud Services®)에서 외부에서 구현된 웹 엔드포인트(web endpoint)(예를 들어, 하이퍼텍스트 전송 프로토콜(HyperText Transfer Protocol, HTTP) 표현 상태 변경(Representational State Transfer, REST) 엔드포인트)에 의해 지원되는(backed) 함수 및 저장된 프로시저를 작성하기(author) 위한 메커니즘을 사용자에게 제공한다. 사용자는 웹 엔드포인트를 제공하고(provisioning), 저장 플랫폼 내의 비즈니스 로직을 기초로 엔드포인트를 구성할 책임이 있다. 일부 경우에서, 웹 API 관리 시스템은 람다 함수(Lambda functions)에 대한 요청을 프록시하고, 다른 경우에서, 웹 API 관리 시스템은 요청을 변환하며, 이를 데이터 웨어하우스 시스템 외부에 있는 제3자 소프트웨어 구성요소로 전달한다. 데이터 웨어하우스 시스템(300)은 이의 외부 소프트웨어 구성요소에 의해 제공되는 외부 함수가 사용자 정의 함수, 사용자-정의 테이블 함수 및 저장된 프로시저와 같이 질의에서 사용되는 것을 가능하게 한다.The data warehouse system 300 is an externally managed web API management system provided by an externally implemented web service platform (e.g., Amazon Web Services® (AWS), Microsoft Azure®, or Google Cloud Services®). Writing functions and stored procedures backed by an endpoint (for example, a HyperText Transfer Protocol (HTTP) Representational State Transfer (REST) endpoint) (author) Provides a mechanism for users. The user is responsible for provisioning the web endpoint and configuring the endpoint based on the business logic within the storage platform. In some cases, the web API management system proxies the request to Lambda functions, and in other cases, the web API management system transforms the request and sends it to a third-party software component outside of the data warehouse system. Pass it to Data warehouse system 300 enables external functions provided by its external software components to be used in queries, such as user-defined functions, user-defined table functions, and stored procedures.
데이터 웨어하우스 시스템(300)은 원격 소프트웨어 구성요소에 의해 제공된 외부 기능의 호출을 가능 하게 하기 위해 다양한 데이터 객체를 저장한다. 데이터 객체는 클라우드 컴퓨팅 플랫폼에 의해 제공되는 웹 API 관리 시스템을 통해 외부 기능을 호출하는 데 사용될 임시 보안 크리덴셜(credentials)을 획득하기 위해 네트워크-기반 데이터 웨어하우스에서 사용하는 정보를 저장한다. 질의의 실행 중에, 네트워크-기반 데이터 웨어 하우스 시스템은 임시 보안 크리덴셜을 사용하여 클라우드 컴퓨팅 서비스 플랫폼의 인증 시스템을 통해 타겟 엔 드포인트로 인증하고, 질의에서 정의된 타겟 데이터의 배치(batches)로 엔드포인트에서 기능을 호출한다. 타겟 데이터는 예를 들어, 이진 데이터, 자바스크립트 객체 표기법(JavaScript Object Notation, JSON) 인코딩된 데 이터, 또는 확장 가능한 마크업 언어(extensible Markup Language, XML)와 같은 다른 텍스트 포맷을 포함한다. 타겟 데이터는 HTTP 요청/응답과 함께 인라인으로(inline) 전달되거나, 또는 클라우드 컴퓨팅 서비스 플랫폼(예를 들어, Amazon® Simple Storage Service(S3®))에 의해 제공되는 일반적으로 액세스되는 저장소에 기록될 수 있다. 데이터 웨어하우스 시스템(300)에 저장된 사용자 데이터는 HTTP 요청 및 응답을 통해 전달하기에 적합한 포맷으로 인코딩된다.Data warehouse system 300 stores various data objects to enable invocation of external functions provided by remote software components. Data objects store information used by network-based data warehouses to obtain temporary security credentials to be used to call external functions through a web API management system provided by the cloud computing platform. During execution of a query, the network-based data warehouse system uses temporary security credentials to authenticate to the target endpoint through the cloud computing service platform's authentication system and sends the endpoint to batches of target data defined in the query. Call a function from a point. Target data includes, for example, binary data, JavaScript Object Notation (JSON) encoded data, or other text formats such as extensible Markup Language (XML). Target data can be passed inline with HTTP requests/responses, or written to commonly accessed storage provided by a cloud computing service platform (e.g., Amazon® Simple Storage Service (S3®)). there is. User data stored in the data warehouse system 300 is encoded into a format suitable for transmission through HTTP requests and responses.
도 7을 참조하면, 상기 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하도록 구성된 시스템에서 국문, 영문 또는 제3 언어로 기재된 ESG 문서로부터 ESG 텍스트를 추출하고 이를 상기 데이터 웨어하우스 시스템(300)에 저장한다. Referring to FIG. 7, a system configured to recommend text suitable for automatically completing the ESG document extracts ESG text from an ESG document written in Korean, English, or a third language and stores it in the data warehouse system 300. .
상기 ESG 텍스트는 ESG 문서로부터 추출되었기 때문에, ESG 형식에 맞는 의미 및 표현을 가지는 텍스트이다. 상기 ESG 형식에 맞는 텍스트는 ESG 형식의 카테고리로 분류될 수도 있다. 상기 ESG 텍스트는 ESG 분야에서 활용되는 단어(예컨대, 키워드) 또는 문장을 포함할 수도 있다. 또한, 상기 ESG 텍스트는 ESG 분야와 관련된 타-분야에서 활용되는 단어, 문구(phrase) 또는 문장을 더 포함할 수도 있다. ESG 분야와 관련된 타-분야는 ESG 문서를 생성하는데 활용된 참조 문서의 분야일 수도 있다. Because the ESG text is extracted from an ESG document, it is a text that has meaning and expression suitable for the ESG format. Text matching the ESG format may be classified into an ESG format category. The ESG text may include words (eg, keywords) or sentences used in the ESG field. In addition, the ESG text may further include words, phrases, or sentences used in other fields related to the ESG field. Other-fields related to the ESG field may be those whose reference documents were utilized to create the ESG document.
상기 ESG 문서는 정부 웹 페이지, 기업 웹 페이지, 기타 웹 사이트 등에서 이미 공개되어 있는 국/내외 평가 대상 기업의 ESG 지속가능 보고서, 또는 개별 기업의 ESG 담당자가 작성하여 배포한 기타 ESG 문서를 포함한다. 상기 평가 대상 기업은 사업체로서의 기업만을 지칭하지 않고 기관, 비영리 단체 등의 다양한 형태의 단체를 포괄하여 지칭할 수 있다.The above ESG documents include ESG sustainability reports of companies subject to domestic and foreign evaluation that are already publicly available on government web pages, corporate web pages, and other websites, or other ESG documents prepared and distributed by ESG managers of individual companies. The company subject to the evaluation may not only refer to a business as a business, but may also encompass various types of organizations such as institutions and non-profit organizations.
일부 실시 예들에서, 상기 ESG 문서는, 도 1 및 도 6에 도시된, 정부 문서 DB(310), 고객 문서 DB(320), 및 웹 사이트 문서 DB(330) 중 하나 이상의 외부 DB로부터 획득되어 상기 데이터 웨어하우스 시스템(300)에 저장될 수도 있다. In some embodiments, the ESG document is obtained from one or more external DBs of government document DB 310, customer document DB 320, and website document DB 330, shown in FIGS. 1 and 6. It may also be stored in the data warehouse system 300.
상기 정부 문서 DB(310)는 정부 데이터 포털에 액세스하여 검색된 적어도 하나의 기업에 대한 ESG 문서를 수집할 수도 있다. The government document DB 310 may collect ESG documents for at least one searched company by accessing a government data portal.
상기 고객 문서 DB(320)는 상기 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하도록 구성된 시스템과 관련된 고객, 예를 들어, 상기 시스템(1)에서 제공하는 서비스에 가입한 고객 기업의 데이터 포털에 액세스하여 해당 고객에 대한 ESG 문서를 수집할 수도 있다. 단일 고객에 대해 다수의 ESG 문서가 수집될 수도 있다. The customer document DB 320 accesses the data portal of a customer associated with a system configured to recommend text suitable for automatically completing the ESG document, for example, a customer company that has subscribed to the service provided by the system 1. You can also collect ESG documentation for that customer. Multiple ESG documents may be collected for a single customer.
상기 웹 사이트 문서 DB(330)는 주요 웹 사이트로 미리 지정된 하나 이상의 웹 사이트 각각에 액세스하고 액세스한 웹 사이트에서 공개된 ESG 문서를 검색하여 수집할 수도 있다. The website document DB 330 may collect ESG documents by accessing each of one or more websites pre-designated as major websites and searching for ESG documents disclosed in the accessed websites.
서비스 서버(200-1)는 네트워크 서버로 구현되는 다수의 컴퓨터 시스템 또는 컴퓨터 소프트웨어이다. 여기서, 네트워크 서버란, 사설 인트라넷 또는 인터넷과 같은 컴퓨터 네트워크를 통해 다른 네트워크 서버와 통신할 수 있는 하위 장치와 연결되어 작업 수행 요청을 접수하고 그에 대한 작업을 수행하여 수행 결과를 제공하는 컴퓨터 시스템 및 컴퓨터 소프트웨어(네트워크 서버 프로그램)를 의미한다. 그러나 이러한 네트워크 서버 프로그램 이외에도, 네트워크 서버 상에서 동작하는 일련의 응용 프로그램과 경우에 따라서는 내부에 구축되어 있는 각종 데이터베이스를 포함하는 넓은 개념으로 이해되어야 할 것이다. 상기 서비스 서버(200-1)는 네트워크 서버, 웹 서버, 파일 서버, 슈퍼컴퓨터, 데스크탑 컴퓨터 등과 같은 컴퓨팅 장치들의 임의의 유형 또는 유형들의 조합으로 구현될 수도 있다. 이를 위해, 서비스 서버(200-1)는 데이터를 처리할 수 있는 적어도 하나의 프로세서, 데이터를 저장하는 메모리, 데이터를 송/수신하는 통신부를 포함한다.The service server 200-1 is a plurality of computer systems or computer software implemented as network servers. Here, a network server is a computer system and computer that is connected to a sub-device that can communicate with other network servers through a computer network such as a private intranet or the Internet, receives a request to perform a task, performs the task, and provides a performance result. Refers to software (network server program). However, in addition to these network server programs, it should be understood as a broad concept that includes a series of application programs operating on a network server and, in some cases, various databases built within it. The service server 200-1 may be implemented as any type or combination of types of computing devices, such as a network server, web server, file server, supercomputer, desktop computer, etc. To this end, the service server 200-1 includes at least one processor capable of processing data, a memory for storing data, and a communication unit for transmitting/receiving data.
서비스 서버(200-1)는 사용자의 ESG 문서를 보다 쉽게 작성하기 위해 ESG 형식에 맞는 텍스트(예컨대, 문장)을 추천하는, ESG 문서 자동완성 서비스를 제공할 수도 있다. 이를 위해, 서비스 서버(200-1)는 사용자의 전자 장치(100-1)로부터 수신한 입력 값을 미리 학습된 ESG 자동완성 모델에 적용하여 입력 값 다음 순서에 배치될 텍스트, 단어(예컨대, 키워드) 또는 문장을 예측한다. 또한, 상기 서비스 서버(200-1)는 예측 결과를 상기 사용자의 전자 장치(100-1)로 전달하도록 구성될 수도 있다. The service server 200-1 may provide an ESG document auto-completion service that recommends text (eg, sentences) suitable for the ESG format to make it easier for users to write ESG documents. To this end, the service server 200-1 applies the input value received from the user's electronic device 100-1 to a pre-learned ESG auto-completion model to place text or words (e.g., keywords) to be placed in the order following the input value. ) or predict the sentence. Additionally, the service server 200-1 may be configured to deliver the prediction result to the user's electronic device 100-1.
일부 실시 예들에서, 상기 서비스 서버(200-1)는 학습부(210-1)를 더 포함할 수도 있다. 도 7에 도시된 것처럼, 상기 데이터 웨어하우스 시스템(300)은 저장한 ESG 텍스트 데이터를 ESG 자동완성 모델을 생성하기 위한 샘플 텍스트 데이터로 학습부(210-1)로 공급할 수도 있다. In some embodiments, the service server 200-1 may further include a learning unit 210-1. As shown in FIG. 7, the data warehouse system 300 may supply the stored ESG text data to the learning unit 210-1 as sample text data for generating an ESG auto-completion model.
학습부(210-1)는 샘플 텍스트 데이터를 자연어 처리하여 미리 설계된 ESG 자동완성 모델을 학습할 수도 있다. 특정 실시 예들에서, 상기 학습부(210-1)는 샘플 텍스트 데이터를 자연어 처리하는 전처리 동작, 샘플 텍스트의 토큰에 기초하여 트래이닝 데이터 세트를 형성하는 동작, 및 상기 트래이닝 데이터 세트를 이용하여 미리 설계된 신경망 구조를 갖는 ESG 자동완성 모델을 학습하는 동작을 수행하도록 구성될 수도 있다. The learning unit 210-1 may learn a pre-designed ESG auto-completion model by processing sample text data in natural language. In certain embodiments, the learning unit 210-1 may perform a preprocessing operation of natural language processing sample text data, an operation of forming a training data set based on tokens of the sample text, and a pre-designed neural network using the training data set. It may be configured to perform an operation of learning an ESG auto-completion model with a structure.
도 7에 도시된 것처럼, 학습부(210-1)는 수신한 샘플 텍스트의 말뭉치(예컨대, 문장)를 자연어 처리하는, 학습을 위한 전처리 동작을 수행한다. As shown in FIG. 7, the learning unit 210-1 performs a pre-processing operation for learning, such as processing a corpus (eg, sentence) of the received sample text into natural language.
상기 전처리 동작은, 토큰화 처리 동작 및/또는 특수 토큰 부가 동작을 포함할 수도 있다. The preprocessing operation may include a tokenization processing operation and/or a special token addition operation.
토큰화 처리 동작은 전처리 대상 텍스트의 말뭉치를 미리 설정된 최소 분할 단위인 토큰 단위로 분할하여 복수의 토큰을 생성하는 동작이다. 상기 토큰 단위는, 예를 들어 단어 단위 또는 형태소 단위로 미리 설정될 수도 있다. 문장이 학습부(210-1)로 제공되면, 상기 학습부(210-1)는 문장을 토큰 단위로 분할하여 해당 문장의 토큰 세트를 형성할 수도 있다. 각 토큰 세트는 단일 말뭉치로부터 생성된 복수의 토큰으로 이루어진다. The tokenization processing operation is an operation that generates a plurality of tokens by dividing the corpus of text subject to preprocessing into token units, which are the preset minimum division units. The token unit may be preset, for example, in word units or morpheme units. When a sentence is provided to the learning unit 210-1, the learning unit 210-1 may divide the sentence into token units to form a token set of the sentence. Each token set consists of multiple tokens generated from a single corpus.
상기 특수 토큰 부가 동작은 미리 정의된 복수의 특수 토큰 중 하나 이상의 특수 토큰을 전처리 대상 텍스트의 말뭉치에 부가하는 동작이다. 상기 특수 토큰은 상기 ESG 자동완성 모델의 출력 텍스트가 보다 자연스러운 텍스트 스타일로 표현되는데 사용되는 특수 토큰이다. 텍스트를 가리키는 상기 토큰과 달리, 상기 특수 토큰은 텍스트를 가리키지 않을 수도 있다. 이하, 설명의 명료성을 위해, 말뭉치의 텍스트를 토큰 단위로 분할하여 생성된 토큰을 텍스트 토큰으로 지칭하여, 본 출원의 실시 예들을 보다 상세히 서술한다. The special token addition operation is an operation of adding one or more special tokens among a plurality of predefined special tokens to the corpus of text subject to preprocessing. The special token is a special token used to express the output text of the ESG auto-complete model in a more natural text style. Unlike the token that points to text, the special token may not point to text. Hereinafter, for clarity of explanation, tokens generated by dividing the text of the corpus into token units will be referred to as text tokens, and embodiments of the present application will be described in more detail.
상기 특수 토큰은, 예를 들어, 모르는 단어에 대한 토큰, 배치 데이터의 길이를 맞추기 위한 토큰, 문장의 시작을 가리키는 토큰, 문장의 종결을 가리키는 토큰, 및/또는 문장 텍스트 이외 기타 토큰을 포함할 수도 있다. 특수 토큰이 샘플 텍스트에 부가되고 특수 토큰이 부가된 샘플 텍스트의 말뭉치가 토큰화될 경우, 특수 토큰이 부가된 샘플 텍스트의 말뭉치의 토큰 세트가 입력되는 상기 ESG 자동완성 모델은 입력 토큰의 텍스트를 보다 용이하게 디코딩할 수도 있다. The special tokens may include, for example, tokens for unknown words, tokens for matching the length of batch data, tokens indicating the beginning of a sentence, tokens indicating the end of a sentence, and/or tokens other than the sentence text. there is. When a special token is added to a sample text and the corpus of the sample text to which the special token has been added is tokenized, the ESG autocomplete model, to which a set of tokens from the corpus of sample text to which the special token has been added, is input, looks at the text of the input token. It can also be easily decoded.
일부 실시 예들에서, 상기 특수 토큰 부가 동작은 상기 전처리 대상 텍스트의 말뭉치를 토큰으로 분할할 필요가 없거나 또는 ESG 자동완성 모델의 출력 텍스트가 표현되는 언어에 대해 미리 연관된 언어 규칙이 있을 경우에 수행될 수도 있다. In some embodiments, the special token addition operation may be performed when there is no need to split the corpus of text to be preprocessed into tokens or when there are pre-associative language rules for the language in which the output text of the ESG auto-completion model is expressed. there is.
이러한 전처리 동작을 통해, 상기 학습부(210-1)는 샘플 텍스트의 말뭉치가 토큰 단위로 분할된 텍스트 토큰으로 이루어진 토큰 세트, 분할 없이 특수 토큰만이 부가된 토큰(들)로 이루어진 토큰 세트, 또는 특수 토큰이 샘플 텍스트의 말뭉치에 부가된 뒤 분할된 텍스트 토큰으로 이루어진 토큰 세트를 이용하여 트래이닝 데이터 세트를 형성한다. Through this preprocessing operation, the learning unit 210-1 generates a corpus of sample text into a token set consisting of text tokens divided into token units, a token set consisting of token(s) to which only special tokens are added without division, or Special tokens are added to the corpus of sample text, and then a token set consisting of segmented text tokens is used to form a training data set.
일부 실시 예들에서, 상기 학습부(210-1)는 복수의 트래이닝 샘플로 이루어진 트래이닝 데이터 세트를 형성할 수도 있다. 각각의 트래이닝 샘플은 트래이닝 데이터 및 레이블 데이터를 포함한다.In some embodiments, the learning unit 210-1 may form a training data set consisting of a plurality of training samples. Each training sample includes training data and label data.
상기 복수의 트래이닝 샘플 각각은 복수의 샘플 텍스트의 말뭉치로부터 획득된 토큰 세트로부터 각각 형성될 수도 있다. 각 트래이닝 샘플의 트래이닝 데이터, 레이블 데이터는 동일한 샘플 텍스트의 말뭉치에 대응한 토큰 세트로부터 획득된다. Each of the plurality of training samples may be formed from a token set obtained from a corpus of a plurality of sample texts. The training data and label data of each training sample are obtained from a set of tokens corresponding to a corpus of the same sample text.
상기 트래이닝 데이터는 샘플 텍스트의 말뭉치로부터 획득된 토큰 세트에 포함된 토큰(들)을 해당 샘플 텍스트의 말뭉치 상의 순서대로 배열한 토큰 배열을 포함할 수도 있다. 예를 들어, 트래이닝 데이터는 해당 샘플 문장에서 맨 처음의 토큰으로부터 맨 끝의 토큰까지의 토큰 배열을 포함할 수도 있다. 트래이닝 데이터의 토큰 배열은 입력 텍스트(즉, 샘플 텍스트)의 말뭉치의 전부에 대응한다. The training data may include a token array in which the token(s) included in the token set obtained from the corpus of the sample text are arranged in order on the corpus of the sample text. For example, training data may include an array of tokens from the first token to the last token in the sample sentence. The token array of training data corresponds to the entire corpus of input text (i.e., sample text).
상기 레이블 데이터는 트래이닝 데이터와 동일한 샘플 텍스트의 말뭉치로부터 획득된 토큰 세트에 포함된 토큰(들) 중 일부 토큰을 제거하고 나머지 토큰을 샘플 텍스트의 말뭉치 상의 순서대로 배열한 토큰 배열을 포함할 수도 있다. 즉, 레이블 데이터의 토큰 배열은 트래이닝 데이터의 토큰 배열에서 일부 토큰이 제거된 것이므로, 잔여 토큰 배열로 지칭될 수도 있다. The label data may include a token arrangement in which some of the token(s) included in the token set obtained from the same sample text corpus as the training data are removed and the remaining tokens are arranged in order in the sample text corpus. That is, the token array of label data is one in which some tokens are removed from the token array of training data, and may therefore be referred to as a residual token array.
상기 잔여 토큰 배열을 이루는 토큰은 샘플 텍스트의 말뭉치 상에서 미리 설정된 순번의 텍스트 토큰부터 맨 끝의 텍스트 토큰을 포함할 수도 있다. 일부 실시예 들에서, 상기 미리 설정된 순번은 맨 처음의 다음 순번일 수도 있다. 그러면, 레이블 데이터는 해당 샘플 텍스트의 말뭉치(예컨대, 샘플 문장)에서 맨 처음의 텍스트 토큰의 다음 텍스트 토큰으로부터 맨 끝의 텍스트 토큰을 포함한 잔여 토큰 배열을 포함할 수도 있다. 즉, 레이블 데이터의 잔여 토큰 배열은 입력 텍스트(즉, 샘플 텍스트)의 말뭉치의 전부에서 상기 미리 설정된 순번의 직전 순번의 텍스트 토큰까지가 제거된, 일부 텍스트의 말뭉치에 대응한다. Tokens constituting the remaining token arrangement may include text tokens from the last text token in a preset order on the sample text corpus. In some embodiments, the preset turn number may be the next turn number from the very first. The label data may then include an array of remaining tokens, including the last text token from the text token following the very first text token in the corpus of sample text (e.g., sample sentence). That is, the remaining token arrangement of the label data corresponds to a corpus of some text in which the text tokens of the immediately preceding sequence of the preset sequence are removed from the entire corpus of input text (i.e., sample text).
학습부(210-1)에 의해 생성된 상기 트래이닝 데이터, 레이블 데이터를 포함한 트래이닝 데이터 세트는 ESG 자동완성 모델을 학습하는데 이용된다. The training data set including the training data and label data generated by the learning unit 210-1 is used to learn the ESG auto-completion model.
상기 ESG 자동완성 모델은 입력 텍스트를 자연어 처리하여 적어도 부분적으로 복원하도록 설계된 뉴럴 네트워크를 포함한다. 예를 들어, 상기 ESG 자동완성 모델은 PLM 또는 기타 자연어 처리 기반 네트워크 모델일 수도 있다. 상기 ESG 자동완성 모델은 입력 텍스트의 말뭉치의 다음 순번에 배치되기에 적합한 텍스트의 말뭉치를 복원하도록 구성될 수도 있다. 일 예에서, 상기 ESG 자동완성 모델은 인코더 및 디코더를 포함할 수도 있다.The ESG auto-completion model includes a neural network designed to at least partially restore input text by processing it in natural language. For example, the ESG autocomplete model may be a PLM or other natural language processing-based network model. The ESG auto-completion model may be configured to restore a corpus of text suitable for being placed in the next order of the corpus of input text. In one example, the ESG autocomplete model may include an encoder and decoder.
학습부(210-1)에 의해, 상기 ESG 자동완성 모델은 입력 텍스트의 말뭉치와 잔여 텍스트의 말뭉치 간의 연관 관계를 추론하여 입력 텍스트의 말뭉치의 그 다음 순번으로 배치되기 적합한 텍스트의 말뭉치를 예측하도록 학습된다. 여기서 텍스트의 말뭉치는 단어(예컨대, 키워드), 문구 또는 문장일 수도 있다. 잔여 텍스트의 말뭉치는 전술한 미리 설정된 순번의 텍스트 토큰으로부터 맨 끝의 텍스트 토큰까지의 잔여 토큰 배열이 나타낸 텍스트의 말뭉치이다. By the learning unit 210-1, the ESG auto-completion model learns to predict a corpus of text suitable to be placed in the next order of the corpus of the input text by inferring the relationship between the corpus of the input text and the corpus of the remaining text. do. Here, the corpus of text may be words (eg, keywords), phrases, or sentences. The corpus of the remaining text is a corpus of text represented by the arrangement of the remaining tokens from the text tokens in the above-mentioned preset order to the last text token.
상기 학습부(210)에 의해, ESG 자동완성 모델은 학습을 위한 샘플 텍스트의 말뭉치에서 특정 텍스트 말뭉치의 다음에 위치한 텍스트 말뭉치를 적절하게 복원하는 동작을 반복함으로써, 모델 내 파라미터가 특정 텍스트 말뭉치의 다음에 위치하기 적합한 텍스트 말뭉치를 예측하도록 학습된다. By the learning unit 210, the ESG auto-completion model repeats the operation of appropriately restoring the text corpus located next to the specific text corpus in the corpus of sample texts for learning, so that the parameters in the model are adjusted to the next text corpus of the specific text corpus. It is learned to predict text corpora suitable for location.
이하, 인코더 및 디코더를 포함한 상기 일 예시의 ESG 자동완성 모델을 이용하여 학습 과정에 대해 보다 상세히 서술한다. Hereinafter, the learning process will be described in more detail using the example ESG autocompletion model including the encoder and decoder.
학습부(210-1)는 트래이닝 세트 내 각 트래이닝 샘플의 트래이닝 데이터를 상기 ESG 자동완성 모델에 입력한다. 상기 인코더는 입력 토큰을 자연어 처리하여 입력 토큰의 특징을 추출하도록 구성된다. 상기 특징은 벡터 형태 또는 맵과 같은 행렬 형태로 추출될 수도 있다. 상기 일 예에서, 상기 인코더의 입력 토큰은 트래이닝 데이터에 포함된 토큰 배열이다. The learning unit 210-1 inputs training data of each training sample in the training set into the ESG auto-completion model. The encoder is configured to extract features of the input token by processing the input token as natural language. The features may be extracted in vector form or matrix form such as a map. In this example, the input token of the encoder is a token array included in training data.
디코더는 입력 토큰의 특징에 기초하여 트래이닝 데이터의 토큰 배열 중에서 미리 설정된 순번의 텍스트 토큰으로부터 맨 끝의 텍스트 토큰을 포함한 잔여 배열 토큰을 복원하도록 구성된다. 전술한 트래이닝 데이터에 포함된 토큰 배열이 인코더에 입력되면, 상기 디코더는 상기 미리 설정된 순번의 텍스트 토큰으로부터 맨 끝의 텍스트 토큰까지 복원할 수도 있다. 디코더의 복원 값은 입력 텍스트의 말뭉치에서 맨 처음의 텍스트 토큰의 다음 텍스트 토큰으로부터 맨 끝까지의 텍스트 토큰을 복원한 결과로서, 각 트래이닝 샘플별 예측 값으로 활용된다. The decoder is configured to restore the remaining array tokens, including the last text token, from the text tokens with a preset order in the token array of the training data based on the characteristics of the input token. When the token array included in the above-described training data is input to the encoder, the decoder may restore from the text tokens in the preset order to the last text token. The decoder's restoration value is the result of restoring text tokens from the text token following the first text token to the end in the input text corpus, and is used as a prediction value for each training sample.
도 8은, 본 출원의 일 실시 예에 따른, ESG 자동완성 모델에서 출력 텍스트를 예측하는 동작의 개략도이다. Figure 8 is a schematic diagram of an operation for predicting output text in an ESG auto-completion model, according to an embodiment of the present application.
도 8을 참조하면, 상기 디코더는 그리드 탐색 방식으로 잔여 배열 토큰을 복원할 수도 있다. 상기 디코더는 특정 토큰의 다음 순서에 배치 가능한 복수의 후보 토큰 중 가능성이 가장 높은 토큰을 선택하여, 잔여 배열 토큰을 복원한다. 도 8에 도시된 것처럼 복수의 후보 토큰은 ESG 분야의 텍스트로 이루어진 토큰이다. 디코더는 잔여 배열 토큰의 앞/뒤 맥락에 기초하여 잔여 배열 토큰의 위치에 배치될 가능성이 가장 높은 토큰을 선택한다. Referring to FIG. 8, the decoder may restore the remaining array tokens using a grid search method. The decoder selects the token with the highest probability among a plurality of candidate tokens that can be placed in the next order of a specific token and restores the remaining array tokens. As shown in Figure 8, the plurality of candidate tokens are tokens composed of text in the ESG field. The decoder selects the token most likely to be placed at the position of the remaining sequence token based on the context before and after the remaining sequence token.
상기 학습부(210-1)는 추천 텍스트를 추천하는 기능을 학습하기 위해, ESG 자동완성 모델의 파라미터를 조정할 수도 있다. 상기 ESG 자동완성 모델의 파라미터는 미리 설계된 인공 신경망 구조의 파라미터를 포함할 수도 있다. The learning unit 210-1 may adjust the parameters of the ESG auto-completion model in order to learn the function of recommending recommended text. The parameters of the ESG auto-complete model may include parameters of a pre-designed artificial neural network structure.
상기 학습부(210-1)는 산출된 예측 값(예컨대, 디코더의 출력 값)과 실제 값 간의 오차가 감소하거나 최소화되도록 ESG 자동완성 모델의 파라미터를 조정할 수도 있다. 여기서, 실제 값은 출력 값을 산출하는데 이용된 트래이닝 샘플에 함께 포함된 레이블 데이터의 값이다. The learning unit 210-1 may adjust the parameters of the ESG auto-completion model so that the error between the calculated predicted value (eg, output value of the decoder) and the actual value is reduced or minimized. Here, the actual value is the value of the label data included in the training sample used to calculate the output value.
상기 출력 값과 실제 값 간의 오차가 최소화될 경우, 학습된 ESG 자동완성 모델은 입력 텍스트의 말뭉치의 다음 순번에 배치될 텍스트의 말뭉치를 정확하게 예측할 수도 있다. ESG 자동완성 모델이 입력 텍스트의 말뭉치와 잔여 텍스트의 말뭉치 간의 연관 관계를 보다 정확하게 추론했다면, 상기 입력 텍스트의 말뭉치에서 미리 설정된 순번 이전까지의 텍스트 토큰을 제외한 나머지 텍스트의 말뭉치가 보다 정확하게 예측될 것이다. When the error between the output value and the actual value is minimized, the learned ESG auto-completion model may accurately predict the corpus of text to be placed in the next order of the corpus of the input text. If the ESG auto-completion model more accurately infers the relationship between the corpus of the input text and the corpus of the remaining text, the corpus of the remaining text excluding the text tokens up to the preset sequence in the corpus of the input text will be predicted more accurately.
이러한 과정을 통해 학습 완료된 ESG 자동완성 모델은 ESG 문서 상에서 입력 텍스트의 말뭉치의 다음 위치에 배치되기 적합한 텍스트를 추천 텍스트로 예측하도록 구성된다. 상기 출력 텍스트는 ESG 문서의 형식을 만족하는 텍스트로서, 입력 텍스트의 맥락에 연결되는 맥락을 가지면서 ESG 분야에 특화된 표현을 갖는 텍스트일 수도 있다. The ESG auto-completion model trained through this process is configured to predict a text suitable to be placed in the next position of the input text corpus on the ESG document as a recommended text. The output text is a text that satisfies the format of an ESG document, and may be a text that has a context connected to the context of the input text and has an expression specialized for the ESG field.
일부 실시 예들에서, 상기 ESG 자동완성 모델은 단일 입력 텍스트의 말뭉치가 입력될 경우, 상기 단일 입력 텍스트의 말뭉치의 다음 순번에 배치될 텍스트의 말뭉치를 하나 이상의 텍스트 말뭉치로 산출할 수도 있다. 예를 들어, 상기 ESG 자동완성 모델은 단일 문장이 입력될 경우 상기 단일 문장의 다음 순번에 배치되기에 적합한 후보 문장을 하나 또는 복수 개 산출할 수도 있다. 또한, 일부 실시 예들에서, 상기 ESG 자동완성 모델은 복수의 추천 텍스트의 말뭉치를 산출하고, 각 추천 텍스트의 말뭉치별 확률 값에 기초하여 일부 또는 전부의 추천 텍스트의 말뭉치를 최종 추천 텍스트의 말뭉치로 출력할 수도 있다. In some embodiments, when a corpus of a single input text is input, the ESG autocomplete model may calculate a corpus of text to be placed next to the corpus of the single input text as one or more text corpora. For example, when a single sentence is input, the ESG auto-completion model may calculate one or more candidate sentences suitable to be placed next to the single sentence. Additionally, in some embodiments, the ESG autocomplete model calculates a corpus of a plurality of recommended texts, and outputs some or all of the recommended text corpora as a final recommended text corpus based on the probability value for each corpus of each recommended text. You may.
예를 들어, 상기 ESG 자동완성 모델은 입력 텍스트의 다음에 위치할 추천 텍스트를 산출하는 동작을 수행할 때마다 모델의 시드 값이 임의의 값을 갖도록 설정될 수도 있다. 동일한 입력 텍스트에 대해서 해당 추천 텍스트를 산출하는 동작을 복수 회 반복할 경우, 상기 복수 회 중 2이상의 서로 다른 추천 텍스트의 말뭉치를 산출할 수도 있다. For example, the ESG auto-completion model may be set so that the seed value of the model has a random value each time an operation for calculating a recommended text to be located next to the input text is performed. When the operation of calculating the recommended text for the same input text is repeated multiple times, two or more different corpora of recommended texts may be calculated among the multiple times.
이 경우, 상기 추천 텍스트의 개수는 동일한 입력 텍스트에 대해 해당 추천 텍스트를 산출하는 동작의 반복 회수를 가리키는, 미리 지정된 하이퍼 파라미터에 의존할 수도 있다. In this case, the number of recommended texts may depend on a pre-specified hyper parameter that indicates the number of repetitions of the operation to calculate the recommended text for the same input text.
일부 실시 예들에서, 상기 ESG 자동완성 모델은 각 추천 텍스트의 말뭉치별 확률 값이 미리 설정된 임계 확률 값 이상인 일부 추천 텍스트의 말뭉치를 최종 추천 텍스트의 말뭉치로 출력할 수도 있다. 그러면, 상기 시스템(1)은 사용자의 선택 명령에 대응한 추천 텍스트의 말뭉치를 상기 입력 텍스트의 다음 위치에 배치할 수도 있다. 사용자의 선택에 따라 배치된 추천 텍스트의 말뭉치는 다다음 순서의 추천 텍스트의 말뭉치를 산출하기 위한 새로운 입력 텍스트로 이용된다. 이러한 과정의 반복으로 인해, 사용자는 몇 번의 선택 명령을 통해 ESG 문서의 내용의 일부 또는 전부를 완성할 수도 있다.In some embodiments, the ESG auto-completion model may output a corpus of some recommended texts whose probability value for each corpus of each recommended text is greater than or equal to a preset threshold probability value as a corpus of the final recommended text. Then, the system 1 may place the corpus of recommended text corresponding to the user's selection command at the next position of the input text. The corpus of recommended texts arranged according to the user's selection is used as a new input text to calculate the corpus of recommended texts in the next order. Due to repetition of this process, the user may complete part or all of the contents of the ESG document through several selection commands.
특정 실시 예들에서, 상기 디코더는 핏팅 레이어를 포함할 수도 있다. 상기 핏팅 레이어는 ESG 자동완성 모델이 입력 텍스트의 다음 순번의 텍스트로서 상기 ESG 형식에 맞는 의미 및/또는 표현의 텍스트를 예측하기 위해 상기 디코더의 말단에 배치된다. 일부 실시 예들에서, 상기 디코더가 (예컨대, 소프트맥스와 같은) 확률 함수를 포함할 경우, 상기 핏팅 레이어는 상기 확률 함수 이전의 데이터 경로 상에 배치될 수도 있다. In certain embodiments, the decoder may include a fitting layer. The fitting layer is placed at the end of the decoder so that the ESG auto-completion model predicts a text whose meaning and/or expression fits the ESG format as the next text of the input text. In some embodiments, when the decoder includes a probability function (eg, softmax), the fitting layer may be placed on the data path before the probability function.
상기 학습부(210-1)는, 상기 핏팅 레이어를 이용하여 상기 ESG 자동완성 모델이 입력 텍스트에 함축된 의미를 적어도 부분적으로 학습하는, 강화 학습 동작을 수행할 수도 있다. The learning unit 210-1 may perform a reinforcement learning operation in which the ESG auto-completion model at least partially learns the meaning implied in the input text using the fitting layer.
상기 핏팅 레이어는 추천 문장이 출력되기 이전에, 입력 텍스트가 입력될 경우 예측되어 출력될 다음 순번의 텍스트(예컨대, 단어, 문구 또는 문장)에 대해서 ESG 형식에 보다 가까운 데이터에 가중치를 부여하도록 구성된다. 일부 실시 예들에서, ESG 형식에 적합한 정도에 따라 보다 높은 가중치 값이 부여될 수도 있다. 상기 핏팅 레이어에 의해 상기 ESG 자동완성 모델은 ESG 형식에 맞는 ESG 분야의 텍스트에 함축된 의미론적 부분을 적어도 부분적으로 학습할 수 있다. The fitting layer is configured to give weight to data closer to the ESG format for the next text (e.g., word, phrase, or sentence) to be predicted and output when the input text is input before the recommended sentence is output. . In some embodiments, a higher weight value may be assigned depending on the degree of suitability for the ESG format. Through the fitting layer, the ESG auto-completion model can at least partially learn the semantic part implied in the text in the ESG field that fits the ESG format.
일부 실시 예들에서, 상기 ESG 형식에 적합한 정도는 ESG 문서에 나타난 빈도에 기초할 수도 있다. In some embodiments, the degree of compliance with the ESG format may be based on the frequency with which it appears in the ESG document.
만약 상기 ESG 자동완성 모델이 GPT(Generative Pre-trained Transformer) 모델에 기반하여 설계될 경우를 가정해보자. 상기 ESG 자동완성 모델이 핏팅 레이어를 포함하지 않고 입력 텍스트의 다음 단어, 문구 또는 문장을 예측하도록 미리 학습될 경우, 여러 카테고리의 말뭉치 데이터가 상기 다음 단어, 문구 또는 문장으로 예측될 수도 있다. 상기 특정 실시 예들에서, 상기 ESG 자동완성 모델은 핏팅 레이어를 통해 ESG 형식 카테고리의 말뭉치 데이터에서 입력 텍스트의 다음 단어, 문구 또는 문장을 구현할 수도 있다. Let us assume that the ESG auto-completion model is designed based on a GPT (Generative Pre-trained Transformer) model. If the ESG autocomplete model does not include a fitting layer and is pre-trained to predict the next word, phrase, or sentence of the input text, multiple categories of corpus data may be predicted as the next word, phrase, or sentence. In the specific embodiments above, the ESG autocomplete model may implement the next word, phrase, or sentence of the input text from corpus data of the ESG format category through a fitting layer.
그 결과, 상기 핏팅 레이어를 포함한 ESG 자동완성 모델은 ESG 문서의 형식을 만족하면서 입력 텍스트의 말뭉치의 다음 위치에 배치되기에 적합한(즉, 가능성이 가장 높은) 텍스트의 말뭉치를 예측하도록 학습된다. As a result, the ESG autocompletion model including the fitting layer is trained to predict a corpus of text that satisfies the format of the ESG document and is suitable (i.e., most likely) to be placed in the next position in the corpus of input text.
상기 서비스 서버(200-1)는 도 7과 같이 학습된 ESG 자동완성 모델을 활용하여 사용자가 ESG 문서를 작성하는 작업을 지원한다. 일부 실시 예들에서, 상기 서비스 서버(200-1)는 사용자의 입력 텍스트의 다음 위치에 배치될 추천 텍스트를 예측하여 사용자의 ESG 문서 완성을 지원하는 ESG 문서 생성부(250-1)를 더 포함할 수도 있다. 상기 ESG 문서 생성부(250-1)는 상기 ESG 자동완성 모델을 이용하도록 구성된다. 상기 ESG 문서 생성부(250-1)의 동작에 대해서는 아래의 도 10을 참조해 보다 상세히 서술한다. The service server 200-1 supports users in creating ESG documents using the learned ESG auto-completion model as shown in FIG. 7. In some embodiments, the service server 200-1 may further include an ESG document generator 250-1 that supports the user's ESG document completion by predicting a recommended text to be placed in the next position of the user's input text. It may be possible. The ESG document creation unit 250-1 is configured to use the ESG auto-completion model. The operation of the ESG document generator 250-1 will be described in more detail with reference to FIG. 10 below.
상기 전자 장치(100-1)는 서비스 서버(200-1)의 예측 동작을 개시하기 위한 입력 텍스트를 입력하고, 서비스 서버(200-1)에서 예측한 추천 텍스트 또는 입력 텍스트 및 예측한 추천 텍스트를 포함한, 적어도 부분적으로 자동완성된 ESG 문서의 내용을 출력하도록 구성된다. 또한, 일부 실시 예들에서, 상기 전자 장치(100-1)는 예측한 추천 텍스트 중 문서 내용으로 이용할 하나의 텍스트를 선택하도록 더 구성될 수도 있다. The electronic device 100-1 inputs an input text to initiate a prediction operation of the service server 200-1, and selects a recommended text predicted by the service server 200-1 or the input text and the predicted recommended text. It is configured to output the contents of the ESG document, including, but not limited to, at least partially auto-completed. Additionally, in some embodiments, the electronic device 100-1 may be further configured to select one text to be used as document content from among the predicted recommended texts.
상기 전자 장치(100-1)는 서비스 서버(200-1)와 통신하는 클라이언트 단말 장치로서, 데이터를 처리할 수 있는 적어도 하나의 프로세서, 데이터를 저장하는 메모리, 데이터를 송/수신하는 통신부를 포함한다. 상기 전자 장치는, 예를 들어, 랩탑 컴퓨터, 기타 컴퓨팅 장치, 태블릿, 셀룰러 폰, 스마트 폰, 스마트 워치, 스마트 글래스, 헤드 마운트 디스플레이(HMD), 기타 모바일 장치, 기타 웨어러블 장치일 수도 있다.The electronic device 100-1 is a client terminal device that communicates with the service server 200-1, and includes at least one processor capable of processing data, a memory for storing data, and a communication unit for transmitting/receiving data. do. The electronic device may be, for example, a laptop computer, other computing device, tablet, cellular phone, smart phone, smart watch, smart glasses, head mounted display (HMD), other mobile device, or other wearable device.
상기 전자 장치(100-1), 서비스 서버(200-1) 또는 시스템(1)이 다른 구성요소를 포함할 수도 있다는 것이 통상의 기술자에게 명백할 것이다. 예를 들어, 상기 서비스 서버(200-1)는 데이터 엔트리를 위한 입력 장치, 및 인쇄 또는 다른 데이터 표시를 위한 출력 장치를 포함하는, 본 명세서에 서술된 동작에 필요한 다른 하드웨어 요소를 포함할 수도 있다. 또한, 상기 시스템(1)은 서비스 서버(200-1)와 외부 장치(예를 들어, 사용자 단말, 또는 외부 데이터베이스 등) 사이를 연결하는 네트워크, 네트워크 인터페이스 및 프로토콜 등을 더 포함할 수 있다. It will be clear to those skilled in the art that the electronic device 100-1, service server 200-1, or system 1 may include other components. For example, the service server 200-1 may include other hardware elements necessary for the operations described herein, including input devices for data entry and output devices for printing or other data display. . In addition, the system 1 may further include a network, network interface, and protocol connecting the service server 200-1 and an external device (eg, a user terminal, an external database, etc.).
대안적인 실시 예들에서, 상기 학습부(210-1)는 서비스 서버(200-1)의 내부에 포함되는 것으로 제한되지 않는다. 상기 학습부(210-1)는 서비스 서버(200-1)의 외부 구성요소로 구현될 수도 있다. 이 경우, 상기 학습부(210-1)는 데이터 웨어하우스 시스템(300), 서비스 서버(200-1)와 전기 통신하도록 구성된다. 상기 서비스 서버(200-1)는 외부의 학습부(210-1)로부터 미리 학습된 ESG 자동완성 모델을 수신하고, 수신된 모델을 활용하여 사용자의 ESG 문서를 보다 쉽게 작성하기 위해 ESG 형식에 맞는 문장을 추천하는, ESG 텍스트 자동완성 서비스를 제공할 수도 있다. In alternative embodiments, the learning unit 210-1 is not limited to being included within the service server 200-1. The learning unit 210-1 may be implemented as an external component of the service server 200-1. In this case, the learning unit 210-1 is configured to communicate electrically with the data warehouse system 300 and the service server 200-1. The service server 200-1 receives a pre-trained ESG auto-complete model from the external learning unit 210-1, and uses the received model to fit the ESG format to more easily create a user's ESG document. An ESG text auto-completion service that recommends sentences can also be provided.
도 9는, 본 출원의 다른 일 측면에 따른, ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법의 흐름도이다. Figure 9 is a flowchart of a method for recommending text suitable for automatically completing an ESG document, according to another aspect of the present application.
도 9의 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하는 방법(이하, ESG 텍스트 추천 방법)은 도 1의 ESG 서비스 제공 시스템(1)에 연결된 도 6의 ESG 문서를 자동 완성하는데 적합한 텍스트를 추천하도록 구성된 시스템과 같은 하나 이상의 컴퓨팅 장치에 의해 수행될 수도 있다. 여기서, ESG 텍스트는 ESG 문서의 형식을 만족하는 텍스트를 지칭한다. The method of recommending text suitable for automatically completing the ESG document of FIG. 9 (hereinafter referred to as the ESG text recommendation method) recommends text suitable for automatically completing the ESG document of FIG. 6 connected to the ESG service provision system 1 of FIG. 1. It may be performed by one or more computing devices, such as a configured system. Here, ESG text refers to text that satisfies the format of the ESG document.
도 9를 참조하면, 상기 ESG 텍스트 자동완성 방법은, 사용자의 전자 장치(100-1)로부터 상기 ESG 문서의 내용 중 일부 내용으로 기재될 ESG 텍스트를 완성하기 위한 기초 텍스트를 수신하는 단계(S410)를 포함한다. 상기 기초 텍스트는 다음 순번에 배치될 텍스트를 예측하는 단서로 활용된다. Referring to FIG. 9, the ESG text auto-completion method includes receiving basic text for completing the ESG text to be described as part of the contents of the ESG document from the user's electronic device 100-1 (S410). Includes. The basic text is used as a clue to predict the text to be placed next.
상기 기초 텍스트를 수신하는 단계(S410)에서 기초 텍스트는 ESG 문서에 기재될 단어(예컨대, 키워드), 문구 또는 문장이다. 상기 기초 텍스트는, 예를 들어 해당 ESG 문서를 완성하는데 요구되는 필수 텍스트 중 일부 또는 전부의 텍스트, 또는 ESG 문서의 내용 전체 중 일부분의 내용을 나타낸 텍스트일 수도 있다. In the step of receiving the basic text (S410), the basic text is a word (eg, keyword), phrase, or sentence to be written in the ESG document. The basic text may be, for example, text representing some or all of the essential texts required to complete the ESG document, or text representing a portion of the entire contents of the ESG document.
완성할 ESG 문서의 내용 전체가 해당 ESG 문서에 기재되기 위해, 내용 전체 중 일부분에 속하는 기초 텍스트가 입력되면, 나머지 내용 중 일부 또는 전부가 추천되어 ESG 문서가 자동 완성된다. In order for the entire content of the ESG document to be completed to be written in the corresponding ESG document, when basic text belonging to a portion of the entire content is input, some or all of the remaining content is recommended and the ESG document is automatically completed.
일부 실시 예들에서, 상기 단계(S410)의 기초 텍스트는 적합한 텍스트를 추천하도록 구성된 시스템이 운영하는 특정 웹 페이지에 액세스할 경우 제공되는 인터페이스 화면을 통해 입력될 수도 있다. In some embodiments, the basic text of step S410 may be input through an interface screen provided when accessing a specific web page operated by a system configured to recommend appropriate text.
상기 인터페이스 화면은 완성하길 원하는 ESG 형식을 표현하도록 구성될 수도 있다. 상기 인터페이스 화면을 통해 사용자는 자신이 완성할 ESG 문서의 형식에 내용을 직접 입력하거나 또는 자동 완성 결과를 실시간으로 제공받을 수도 있다. The interface screen may be configured to represent the ESG format desired to be completed. Through the above interface screen, users can directly input content into the form of the ESG document to be completed or receive auto-complete results in real time.
또한, 상기 ESG 텍스트 추천 방법은, 상기 단계(S410)에서 수신한 기초 텍스트를 미리 학습된 ESG 자동완성 모델에 입력하여 기초 텍스트의 다음 순번에 배치될 추천 텍스트를 예측하는 단계(S420)를 포함한다. In addition, the ESG text recommendation method includes a step (S420) of inputting the basic text received in the step (S410) into a pre-trained ESG auto-completion model to predict a recommended text to be placed next to the basic text. .
일부 실시 예들에서, 상기 추천 텍스트를 산출하는 단계(S420)는, 상기 기초 텍스트의 말뭉치를 전처리하여 입력 데이터를 형성하는 단계, 및 형성된 입력 데이터를 상기 미리 학습된 ESG 자동완성 모델에 입력하여 적어도 하나의 추천 텍스트를 산출하는 단계를 포함할 수도 있다. In some embodiments, the step of calculating the recommended text (S420) includes forming input data by preprocessing the corpus of the base text, and inputting the formed input data into the pre-trained ESG auto-completion model to form at least one It may also include the step of calculating recommended text.
상기 단계(S420)에서 수행되는 전처리 동작은 토큰화 처리 동작 및/또는 특수 토큰 부가 동작을 포함한다. 상기 전처리 동작은 ESG 자동완성 모델의 트래이닝 데이터를 생성하는데 이용된 전처리 동작에 대응할 수도 있다. 예를 들어, 상기 트래이닝 데이터가 토큰화 처리 동작만 전처리해서 생성될 경우, 서비스 서버(200-1)는 추천 텍스트를 산출하기 위해 기초 텍스트의 말뭉치를 토큰화 처리 동작하여 입력 데이터를 생성할 수도 있다. The preprocessing operation performed in step S420 includes a tokenization processing operation and/or a special token addition operation. The preprocessing operation may correspond to the preprocessing operation used to generate training data for the ESG autocomplete model. For example, when the training data is generated by preprocessing only the tokenization processing operation, the service server 200-1 may generate input data by tokenizing the corpus of the basic text to calculate the recommended text. .
상기 단계(S420)의 ESG 자동완성 모델은 단계(S410)의 기초 텍스트의 다음 순번에 배치되기에 적합한, ESG 텍스트의 말뭉치를 예측하도록 미리 학습된다. 상기 ESG 자동완성 모델은 기초 텍스트의 다음 순번에 배치될 가능성이 있는 하나 이상의 텍스트의 말뭉치를 산출하고, 산출된 하나 이상의 텍스트의 말뭉치 중 적어도 하나의 텍스트의 말뭉치를 추천 텍스트의 말뭉치로 출력하도록 구성될 수도 있다. The ESG auto-completion model of step S420 is trained in advance to predict a corpus of ESG text suitable for placement in the next order of the basic text of step S410. The ESG auto-completion model will be configured to calculate a corpus of one or more texts that are likely to be placed in the next order of the basic text, and output a corpus of at least one text among the corpora of the calculated one or more texts as a corpus of recommended texts. It may be possible.
상기 ESG 텍스트의 말뭉치는 단어(예컨대, 키워드), 문구 또는 문장일 수도 있다. The corpus of ESG text may be words (eg, keywords), phrases, or sentences.
일부 실시 예들에서, 상기 ESG 자동완성 모델은 하나 이상의 ESG 텍스트의 말뭉치를 추천 텍스트의 말뭉치로 출력할 수도 있다. In some embodiments, the ESG autocomplete model may output a corpus of one or more ESG texts as a corpus of recommended text.
서비스 서버(200-1)는 출력된 하나 이상의 추천 텍스트의 말뭉치를 전자 장치(100-1)로 전송할 수도 있다. 상기 전자 장치(100-1)는 수신한 추천 텍스트를 사용자에게 제공할 수도 있다. 일부 실시 예들에서, 상기 전자 장치(100-1)는 기초 텍스트 및 각각의 추천 텍스트를 순서대로 배열한 결과를 제공할 수도 있다. The service server 200-1 may transmit a corpus of one or more output recommended texts to the electronic device 100-1. The electronic device 100-1 may provide the received recommended text to the user. In some embodiments, the electronic device 100-1 may provide a result of arranging the basic text and each recommended text in order.
도 10은, 본 출원의 일 실시 예예 따른, 추천 텍스트의 말뭉치의 출력 결과를 도시한다. Figure 10 shows the output result of a corpus of recommended text according to an embodiment of the present application.
도 10을 참조하면, 상기 단계(S410)에서 "대상㈜는 온실가스 감출을 위해 적극적인 설비 투자와 활동을 꾸준히 수행하고 있습니다"의 문장이 기초 텍스트로 입력될 경우, 해당 문장의 다음 순번에 배치되기 적합한 하나 이상의 추천 텍스트가 상기 ESG 자동완성 모델로부터 출력될 수도 있다. 상기 ESG 자동완성 모델은 복수의 추천 문장을 산출하고, 상기 복수의 추천 문장별 확률 값에 기초하여 도 10에 도시된 것처럼 제1 문장 내지 제5 문장을 추천 텍스트로 출력할 수도 있다. 상기 제1 문장 내지 제5 문장 각각은 기초 문장의 다음 순번에 배치되어 제공될 수도 있다. Referring to FIG. 10, in step S410, if the sentence “Daesang Co., Ltd. is steadily carrying out active facility investment and activities to hide greenhouse gases” is entered as the basic text, it is placed in the next order of the sentence. One or more suitable recommended texts may be output from the ESG autocomplete model. The ESG auto-completion model may calculate a plurality of recommended sentences and output the first to fifth sentences as recommended text, as shown in FIG. 10, based on the probability value for each of the plurality of recommended sentences. Each of the first to fifth sentences may be provided in the order following the basic sentence.
상기 단계(S420)에서 이용되는 ESG 자동완성 모델은 도 7, 도 8을 참조해서 위에서 서술하였는 바, 자세한 설명은 생략한다. The ESG auto-completion model used in the step (S420) is described above with reference to FIGS. 7 and 8, and detailed description will be omitted.
다시 도 9를 참조하면, 상기 ESG 텍스트 추천 방법은, ESG 문서의 형식에 추천 텍스트를 기재하는 단계(S430)를 더 포함할 수도 있다. Referring again to FIG. 9, the ESG text recommendation method may further include the step of writing recommended text in the format of an ESG document (S430).
상기 단계(S420)에서 단일 추천 텍스트가 출력될 경우, 출력된 단일 추천 텍스트는 기초 텍스트의 다음 순번에 곧바로 기재될 수도 있다. When a single recommended text is output in step S420, the output single recommended text may be written immediately in the next order of the basic text.
상기 단계(S420)에서 복수의 추천 텍스트가 출력될 경우, 상기 단계(S430)에서 기재되는 추천 텍스트는 복수의 추천 텍스트 중 어느 하나의 텍스트이다. 기재될 추천 텍스트는 사용자의 선택에 의해 결정될 수도 있다. 예를 들어, 사용자의 전자 장치(100-1)는 도 10의 화면을 표시하여 제1 문장 내지 제5 문장 중 어느 하나의 추천 문장을 기초 문장의 다음 순번에 기재할 추천 문장으로 선택하는 사용자 명령을 유도한다. 어느 하나의 문장이 선택되면, 전자 장치(100-1)는 선택된 추천 문장의 정보를 서비스 서버(200-1)로 전송하여 상기 기초 텍스트 및 추천 텍스트의 내용으로 상기 ESG 문서의 현재 내용을 업데이트한다. When a plurality of recommended texts are output in step S420, the recommended text written in step S430 is one of the plurality of recommended texts. The recommended text to be written may be determined by the user's selection. For example, the user's electronic device 100-1 displays the screen of FIG. 10 and provides a user command to select any one of the first to fifth sentences as the recommended sentence to be written next to the basic sentence. induces. When one sentence is selected, the electronic device 100-1 transmits information on the selected recommended sentence to the service server 200-1 to update the current content of the ESG document with the contents of the base text and recommended text. .
또한, 상기 ESG 텍스트 추천 방법은, 단계(S420)에서 예측된 추천 텍스트를 상기 ESG 자동완성 모델에 입력하여 상기 단계(S420)의 추천 텍스트의 다음 순번에 배치될 새로운 추천 텍스트를 예측하는 단계(S440)를 더 포함할 수도 있다. 그러면, ESG 자동완성 모델은 추천 텍스트의 맥락에 연결되는 맥락을 가지면서 ESG 분야에 특화된 표현을 갖는 새로운 추천 텍스트를 출력한다. In addition, the ESG text recommendation method includes inputting the recommended text predicted in step S420 into the ESG auto-completion model to predict a new recommended text to be placed next to the recommended text in step S420 (S440). ) may further be included. Then, the ESG autocomplete model outputs a new recommended text with a context that is connected to the context of the recommended text and an expression specialized for the ESG field.
또한, 상기 ESG 텍스트 추천 방법은, 단계(S440)에서 출력된 새로운 추천 텍스트를 단계(S430)의 ESG 문서의 형식에 추가 기재하는 단계(S450)를 더 포함할 수도 있다. 상기 단계(S430)의 ESG 문서의 형식은 기초 텍스트 및 추천 텍스트의 내용을 포함한 상태이다. In addition, the ESG text recommendation method may further include a step (S450) of additionally writing the new recommended text output in step (S440) into the format of the ESG document in step (S430). The format of the ESG document in step S430 includes the contents of the basic text and recommended text.
상기 단계(S450)에서 새로운 추천 텍스트가 기재되면, 작성 중인 ESG 문서는 단계(S410)의 기초 텍스트, 단계(S420)의 추천 텍스트 및 단계(S440)의 새로운 추천 텍스트의 내용을 포함하도록 업데이트된다. 단계(S450)의 동작은, 단계(S430)의 동작과 유사하므로 자세한 설명은 생략한다. If a new recommended text is described in step S450, the ESG document being created is updated to include the basic text of step S410, the recommended text of step S420, and the contents of the new recommended text of step S440. Since the operation of step S450 is similar to the operation of step S430, detailed description is omitted.
일부 실시 예들에서, 상기 ESG 텍스트 추천 방법은, ESG 문서 전체 내용이 완성될 때까지 상기 단계(S440, S450)를 반복하는 단계(S460)를 더 포함할 수도 있다. In some embodiments, the ESG text recommendation method may further include (S460) repeating the steps (S440, S450) until the entire contents of the ESG document are completed.
그러면, 사용자는 단계(S410)에서 전자 장치(100-1)를 통해 최소한의 텍스트를 기초 텍스트로 입력하여, ESG 문서를 자동 완성할 수도 있다.Then, the user may automatically complete the ESG document by inputting the minimum text as the basic text through the electronic device 100-1 in step S410.
하드웨어를 이용하여 본 발명의 실시 예를 구현하는 경우에는, 본 출원의 실시 예들을 수행하도록 구성된 ASICs(application specific integrated circuits) 또는 DSPs(digital signal processors), DSPDs(digital signal processing devices), PLDs(programmable logic devices), FPGAs(field programmable gate arrays) 등이 본 출원의 구성요소에 구비될 수 있다. When implementing embodiments of the present invention using hardware, application specific integrated circuits (ASICs) or digital signal processors (DSPs), digital signal processing devices (DSPDs), or programmable PLDs (PLDs) configured to perform the embodiments of the present application. logic devices), field programmable gate arrays (FPGAs), etc. may be included in the components of the present application.
이상에서 설명한 본 출원의 실시 예들에 따른 ESG 보조 툴을 이용하여 정형화된 ESG 데이터로 이루어진 ESG 데이터베이스를 구축하는 방법 및 이를 수행하는 ESG 서비스 제공 시스템(1)에 의한 동작은 적어도 부분적으로 컴퓨터 프로그램으로 구현되어, 컴퓨터로 읽을 수 있는 기록매체에 기록될 수 있다. 예를 들어, 프로그램 코드를 포함하는 컴퓨터-판독가능 매체로 구성되는 프로그램 제품과 함께 구현되고, 이는 기술된 임의의 또는 모든 단계, 동작, 또는 과정을 수행하기 위한 프로세서에 의해 실행될 수 있다. The method of building an ESG database consisting of standardized ESG data using the ESG auxiliary tool according to the embodiments of the present application described above, and the operation by the ESG service provision system 1 that performs the method, are at least partially implemented as a computer program. and can be recorded on a computer-readable recording medium. For example, implemented with a program product comprised of a computer-readable medium containing program code, which can be executed by a processor to perform any or all steps, operations, or processes described.
상기 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터에 의하여 읽힐 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등을 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수도 있다. 또한, 본 실시예를 구현하기 위한 기능적인 프로그램, 코드 및 코드 세그먼트(segment)들은 본 실시예가 속하는 기술 분야의 통상의 기술자에 의해 용이하게 이해될 수 있을 것이다.The computer-readable recording medium includes all types of recording devices that store data that can be read by a computer. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disk, and optical data storage devices. Additionally, computer-readable recording media may be distributed across computer systems connected to a network, and computer-readable codes may be stored and executed in a distributed manner. Additionally, functional programs, codes, and code segments for implementing this embodiment can be easily understood by those skilled in the art to which this embodiment belongs.
이상에서 살펴본 본 발명은 도면에 도시된 실시예들을 참고로 하여 설명하였으나 이는 예시적인 것에 불과하며 당해 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 실시예의 변형이 가능하다는 점을 이해할 것이다. 그러나, 이와 같은 변형은 본 발명의 기술적 보호범위 내에 있다고 보아야 한다. 따라서, 본 발명의 진정한 기술적 보호범위는 첨부된 특허청구범위의 기술적 사상에 의해서 정해져야 할 것이다.The present invention discussed above has been described with reference to the embodiments shown in the drawings, but these are merely illustrative examples, and those skilled in the art will understand that various modifications and modifications of the embodiments are possible therefrom. However, such modifications should be considered within the technical protection scope of the present invention. Therefore, the true technical protection scope of the present invention should be determined by the technical spirit of the attached patent claims.
Claims (7)
상기 전자 장치는 복수의 ESG 관리 항목을 미리 저장한 ESG 관리 항목 데이터베이스와 연결되고,
상기 방법은,
상기 전자 장치에 의해, 정형화 처리 대상의 ESG 문서를 파싱 처리하는 단계 - 상기 ESG 문서는 비정형 ESG 데이터를 포함함;
상기 전자 장치에 의해, 미리 저장된 복수의 ESG 관리 항목 중 적어도 하나에 대응하는 항목을 파싱된 ESG 문서가 포함하는지 스크리닝하는 단계;
상기 전자 장치에 의해, 스크리닝 결과에 이상이 없는지 여부를 판단하는 단계;
상기 전자 장치에 의해, 상기 ESG 관리 항목에 대응한 항목이 문서 내에 포함되었는지 여부에 따라 ESG 문서 내 항목에 대해 선별 상태를 지정하는 단계;
상기 전자 장치에 의해, 선별 상태의 지정 결과에 따라 미리 저장된 복수의 ESG 관리 항목에 대한 최종 입력 필드 값의 입력 칸을 활성화하거나 또는 비활성화하는 단계;
상기 전자 장치에 의해, 문서에 포함된 것으로 판단된, ESG 관리 항목에 대응한 항목의 내용을 획득하여 정형화 데이터를 생성하는 단계; 및
상기 서비스 서버에 의해, 파싱된 ESG 문서의 텍스트를 ESG 문서를 자동 완성하기 위한 기계학습 모델의 학습 데이터로 이용하여 상기 기계학습 모델을 학습하는 단계;를 포함하고,
상기 미리 저장된 복수의 ESG 관리 항목 중 적어도 하나에 대응하는 항목을 파싱된 ESG 문서가 포함하는지 스크리닝하는 단계는,
상기 ESG 관리 항목 데이터베이스에 저장된 각 ESG 관리 항목별 코드 값 및 데이터 세트 값 중 적어도 하나를 기준으로 파싱된 ESG 문서에 해당 항목을 포함하는지 여부를 판단하는 것이고,
상기 스크리닝 결과에 이상이 없는지 여부를 판단하는 단계는,
사용자의 확인 입력에 기초하거나 또는 ESG 문서 내에서 코드 값, 데이터 세트 값 중 적어도 하나에 매칭한 데이터에 대한 주변 데이터에 기초하여 스크리닝 결과의 이상 여부를 판단하는 것이며,
상기 선별 상태를 지정하는 단계는,
파싱된 ESG 문서 내에 해당 항목이 포함되어 있으면 상기 ESG 문서를 제1 선별 상태로 지정하고, 해당 항목이 포함되어 있지 않으면 상기 ESG 문서를 제2 선별 상태로 지정하는 것이며,
상기 정형화 데이터를 생성하는 단계는,
ESG 관리 항목에 대응한 항목의 내용을 획득하여 상기 정형화 데이터를 생성하기 위해, 제1 선별 상태로 지정된 ESG 관리 항목의 상기 ESG 문서 내 위치를 제공하는 단계; 제공된 위치에 기초하여 해당 ESG 관리 항목의 내용을 획득하는 단계; 및 선별된 ESG 관리 항목의 목록 및 획득된 각각의 ESG 관리 항목의 내용을 테이블 변환 처리하여 정형 데이터를 생성하는 단계를 포함하고,
상기 해당 ESG 관리 항목의 내용을 획득하는 단계는,
사용자의 내용 입력에 기초하거나 또는 제공된 위치에 대한 주변 데이터에 기초하여 최종 필드 입력 값의 내용을 획득하는 것이고,
상기 기계학습 모델은 입력 텍스트의 말뭉치와 잔여 텍스트의 말뭉치 간의 연관 관계를 추론하여 입력 텍스트의 말뭉치의 그 다음 순번으로 배치될 텍스트의 말뭉치를 예측하도록 학습된, 인공 신경망 구조를 포함한 모델인 것을 특징으로 하는,
방법. In a method of learning a machine learning model with standardized ESG data using an ESG auxiliary tool, performed by an electronic device and a service server,
The electronic device is connected to an ESG management item database that pre-stores a plurality of ESG management items,
The above method is,
parsing, by the electronic device, an ESG document subject to structured processing, wherein the ESG document includes unstructured ESG data;
Screening, by the electronic device, whether the parsed ESG document includes an item corresponding to at least one of a plurality of pre-stored ESG management items;
determining, by the electronic device, whether there is an abnormality in the screening result;
specifying, by the electronic device, a selection status to an item in an ESG document according to whether an item corresponding to the ESG management item is included in the document;
activating or deactivating, by the electronic device, an input field for final input field values for a plurality of pre-stored ESG management items according to a result of specifying a selection state;
generating standardized data by obtaining, by the electronic device, content of items corresponding to ESG management items determined to be included in the document; and
A step of learning the machine learning model by using the text of the parsed ESG document as training data for a machine learning model for automatically completing the ESG document, by the service server,
The step of screening whether the parsed ESG document includes an item corresponding to at least one of the plurality of pre-stored ESG management items,
Determining whether the parsed ESG document includes the corresponding item based on at least one of the code value and data set value for each ESG management item stored in the ESG management item database,
The step of determining whether there is an abnormality in the screening result is,
Determining whether the screening result is abnormal based on the user's confirmation input or based on surrounding data for data matching at least one of the code value and data set value in the ESG document,
The step of specifying the selection status is,
If the item is included in the parsed ESG document, the ESG document is designated as a first screening state, and if the item is not included, the ESG document is designated as a second screening state,
The step of generating the standardized data is,
providing a location in the ESG document of an ESG management item specified in a first selection state to obtain content of the item corresponding to the ESG management item and generate the standardized data; Obtaining the contents of the corresponding ESG management item based on the provided location; And generating structured data by converting the list of selected ESG management items and the contents of each obtained ESG management item into a table,
The step of obtaining the contents of the relevant ESG management items is,
Obtaining the content of the final field input value based on the user's content input or based on surrounding data for the provided location,
The machine learning model is characterized as a model including an artificial neural network structure that is learned to predict the corpus of text to be placed in the next order of the corpus of the input text by inferring the relationship between the corpus of the input text and the corpus of the remaining text. doing,
method.
상기 전자 장치는 다른 ESG 문서의 비정형 ESG 데이터를 정형화하여 저장한 ESG 문서 데이터베이스와 더 연결되고,
상기 ESG 관리 항목에 대응한 항목의 내용을 획득하여 정형화 데이터를 생성하는 단계는,
기존 ESG 문서 내 데이터를 이용하겠다는 사용자 입력을 수신한 경우, 상기 다른 ESG 문서 내 데이터를 해당 항목에 대한 내용으로 획득하는 단계를 더 포함하는 것을 특징으로 하는,
방법. According to paragraph 1,
The electronic device is further connected to an ESG document database that stores structured and stored unstructured ESG data from other ESG documents,
The step of generating standardized data by acquiring the contents of items corresponding to the ESG management items,
When receiving a user input to use data in an existing ESG document, further comprising the step of obtaining data in the other ESG document as content for the item,
method.
상기 인터페이스 제공부에 의해, 이미 저장된 ESG 관리 항목을 관리하는 단계를 더 포함하고 - 상기 ESG 관리 항목의 관리는 수정, 삭제 또는 생성하는 것이고,
상기 ESG 관리 항목을 관리하는 단계는,
이미 저장된 ESG 관리 항목이 저장되었는지 확인하는 단계;
저장된 경우, ESG 관리 항목에 대한 수정, 삭제 또는 생성 요청을 수신하는 단계; 및
상기 수정, 삭제 또는 생성 요청을 수신할 경우, 저장된 ESG 관리 항목 세트를 항목 레벨 구조로 나타낸 보조 툴 인터페이스 화면을 상기 출력부를 통해 표시하는 단계;를 포함하는 것을 특징으로 하는,
방법. The method of claim 1, wherein the electronic device further includes an output unit, and the method includes:
Further comprising, by the interface providing unit, managing already stored ESG management items - the management of the ESG management items includes modifying, deleting or creating,
The steps for managing the ESG management items are:
Checking whether already saved ESG management items have been saved;
If stored, receiving requests to modify, delete or create ESG management items; and
When receiving the modification, deletion or creation request, displaying an auxiliary tool interface screen showing the stored ESG management item set in an item level structure through the output unit,
method.
요청 대상 항목이 최하위 레벨 항목이 아닐 경우 대상 항목의 내용에 대한 입력 칸을 비활성화하는 단계;
상기 요청 대상 항목이 최하위 레벨 항목일 경우 대상 항목의 내용에 대한 입력 칸을 활성화하는 단계;
활성화된 입력 칸을 통해 수정 또는 생성할 대상 항목의 내용을 입력받는 단계; 및
입력된 항목의 내용을 ESG 관리 항목 데이터베이스에 저장하는 단계를 더 포함하는 것을 특징으로 하는,
방법. The method of claim 3, wherein the step of managing the ESG management items is:
If the requested item is not the lowest level item, disabling an input box for the contents of the target item;
activating an input box for the contents of the target item when the request target item is a lowest level item;
A step of inputting the contents of a target item to be modified or created through an activated input box; and
Characterized in that it further comprises the step of storing the contents of the entered items in the ESG management item database,
method.
상기 대상 항목의 내용을 입력받기 위한 보조 툴 인터페이스 화면을 제공하는 단계를 포함하고,
상기 보조 툴 인터페이스 화면은 활성화된 입력 칸을 포함한 제1 서브 영역 및 항목 구조 레벨을 포함한 제2 서브 영역을 포함하고,
상기 제2 서브 영역에는 대분류별 항목 세트를 각각의 동일한 항목 레벨별로 분류하여 표시되는 것을 특징으로 하는,
방법. The method of claim 4, wherein the step of inputting the contents of the target item through the activated input box includes:
Comprising the step of providing an auxiliary tool interface screen for inputting the contents of the target item,
The auxiliary tool interface screen includes a first sub-area including an activated input box and a second sub-area including an item structure level,
Characterized in that in the second sub-area, a set of items for each major category is classified and displayed for each same item level,
method.
상기 서비스 서버는 ESG 보조 툴을 이용하여 정형화된 ESG 데이터로 이루어진 ESG 데이터베이스를 구축하기 위한 전자 장치와 연결되고,
상기 전자 장치는 복수의 ESG 관리 항목을 미리 저장한 ESG 관리 항목 데이터베이스와 연결되고, 상기 전자 장치는,
비정형 ESG 데이터를 포함한 ESG 문서 내에서 상기 ESG 관리 항목 데이터베이스에 미리 저장된 복수의 ESG 관리 항목 중 적어도 하나에 대응한 항목 및 해당 항목의 내용을 획득하여 상기 ESG 문서에 대한 정형화된 ESG 데이터를 생성하도록 구성된 정형 데이터 처리부; 및
ESG 문서의 비정형 데이터를 정형화된 데이터로 변경하기 위한 사용자 입력을 수신하는 보조 툴 인터페이스 화면을 출력부를 통해 제공하는 인터페이스 제공부를 포함하고,
상기 정형 데이터 처리부는,
정형화 처리 대상의 ESG 문서를 파싱 처리하고 - 상기 ESG 문서는 비정형 ESG 데이터를 포함함 -, 미리 저장된 복수의 ESG 관리 항목 중 적어도 하나에 대응하는 항목을 파싱된 ESG 문서가 포함하는지 스크리닝하며, 스크리닝 결과에 이상이 없는지 여부를 판단하고, 상기 ESG 관리 항목에 대응한 항목이 문서 내에 포함되었는지 여부에 따라 ESG 문서 내 항목에 대해 선별 상태를 지정하고, 선별 상태의 지정 결과에 따라 미리 저장된 복수의 ESG 관리 항목에 대한 최종 입력 필드 값의 입력 칸을 활성화하거나 또는 비활성화하며, 그리고 문서에 포함된 것으로 판단된, ESG 관리 항목에 대응한 항목의 내용을 획득하여 정형화 데이터를 생성하도록 구성되고,
상기 정형 데이터 처리부는, 미리 저장된 복수의 ESG 관리 항목 중 적어도 하나에 대응하는 항목을 파싱된 ESG 문서가 포함하는지 스크리닝하기 위해, 상기 ESG 관리 항목 데이터베이스에 저장된 각 ESG 관리 항목별 코드 값 및 데이터 세트 값 중 적어도 하나를 기준으로 파싱된 ESG 문서에 해당 항목을 포함하는지 여부를 판단하고,
상기 정형 데이터 처리부는, 스크리닝 결과에 이상이 없는지 여부를 판단하기 위해, 사용자의 확인 입력에 기초하거나 또는 ESG 문서 내에서 코드 값, 데이터 세트 값 중 적어도 하나에 매칭한 데이터에 대한 주변 데이터에 기초하여 스크리닝 결과의 이상 여부를 판단하는 것이며,
상기 정형 데이터 처리부는, 선별 상태를 지정하기 위해, 파싱된 ESG 문서 내에 해당 항목이 포함되어 있으면 상기 ESG 문서를 제1 선별 상태로 지정하고, 해당 항목이 포함되어 있지 않으면 상기 ESG 문서를 제2 선별 상태로 지정하는 것이며,
상기 정형 데이터 처리부는, 상기 정형화 데이터를 생성하기 위해, ESG 관리 항목에 대응한 항목의 내용을 획득하여 상기 정형화 데이터를 생성하기 위해, 제1 선별 상태로 지정된 ESG 관리 항목의 상기 ESG 문서 내 위치를 제공하는 단계; 제공된 위치에 기초하여 해당 ESG 관리 항목의 내용을 획득하는 단계; 및 선별된 ESG 관리 항목의 목록 및 획득된 각각의 ESG 관리 항목의 내용을 테이블 변환 처리하여 정형 데이터를 생성하고,
상기 정형 데이터 처리부는, 상기 해당 ESG 관리 항목의 내용을 획득하기 위해, 사용자의 내용 입력에 기초하거나 또는 제공된 위치에 대한 주변 데이터에 기초하여 '최종 필드 입력 값'의 내용을 획득하며,
상기 서비스 서버는 파싱된 ESG 문서의 텍스트를 ESG 문서를 자동 완성하기 위한 기계학습 모델의 학습 데이터로 이용하여 상기 기계학습 모델을 학습하는 것이고,
상기 기계학습 모델은 입력 텍스트의 말뭉치와 잔여 텍스트의 말뭉치 간의 연관 관계를 추론하여 입력 텍스트의 말뭉치의 그 다음 순번으로 배치될 텍스트의 말뭉치를 예측하도록 학습된, 인공 신경망 구조를 포함한 모델인 것을 특징으로 하는,
서비스 서버.
In the service server that generates ESG documents automatically completed with machine learning models,
The service server is connected to an electronic device to build an ESG database consisting of standardized ESG data using an ESG auxiliary tool,
The electronic device is connected to an ESG management item database that pre-stores a plurality of ESG management items, and the electronic device:
configured to generate standardized ESG data for the ESG document by obtaining an item corresponding to at least one of a plurality of ESG management items pre-stored in the ESG management item database and the contents of the item within an ESG document containing unstructured ESG data Structured data processing unit; and
An interface providing unit that provides an auxiliary tool interface screen for receiving user input for changing unstructured data of an ESG document into standardized data through an output unit,
The structured data processing unit,
Parses and processes an ESG document subject to standardized processing - the ESG document includes unstructured ESG data - and screens whether the parsed ESG document contains an item corresponding to at least one of a plurality of pre-stored ESG management items, and the screening result Determine whether there are any abnormalities, designate a selection status for items in the ESG document depending on whether items corresponding to the above-mentioned ESG management items are included in the document, and manage multiple ESGs stored in advance according to the results of specifying the selection status. It is configured to activate or deactivate the input box of the final input field value for the item, and to obtain the contents of the item corresponding to the ESG management item determined to be included in the document to generate standardized data,
The structured data processing unit is configured to screen whether the parsed ESG document includes an item corresponding to at least one of a plurality of ESG management items stored in advance, and a code value and data set value for each ESG management item stored in the ESG management item database. Determine whether the parsed ESG document includes the relevant item based on at least one of the following,
The structured data processing unit determines whether there is an abnormality in the screening result, based on the user's confirmation input or based on surrounding data for data matching at least one of a code value and a data set value in an ESG document. To determine whether the screening results are abnormal,
In order to specify a selection state, the structured data processing unit designates the ESG document as a first selection state if the corresponding item is included in the parsed ESG document, and designates the ESG document as a second selection state if the corresponding item is not included in the parsed ESG document. It is designated as a state,
In order to generate the standardized data, the structured data processing unit acquires the contents of the item corresponding to the ESG management item and determines the location of the ESG management item specified in the first selection state within the ESG document in order to generate the structured data. providing steps; Obtaining the contents of the corresponding ESG management item based on the provided location; And the list of selected ESG management items and the contents of each acquired ESG management item are converted into tables to generate structured data,
In order to obtain the contents of the corresponding ESG management item, the structured data processing unit acquires the contents of the 'final field input value' based on the user's contents input or based on surrounding data for the provided location,
The service server uses the text of the parsed ESG document as training data for a machine learning model to automatically complete the ESG document to learn the machine learning model,
The machine learning model is characterized as a model including an artificial neural network structure that is learned to predict the corpus of text to be placed in the next order of the corpus of the input text by inferring the relationship between the corpus of the input text and the corpus of the remaining text. doing,
service server.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020230054731A KR102682244B1 (en) | 2022-08-05 | 2023-04-26 | Method for learning machine-learning model with structured ESG data using ESG auxiliary tool and service server for generating automatically completed ESG documents with the machine-learning model |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220097982A KR102532216B1 (en) | 2022-08-05 | 2022-08-05 | Method for establishing ESG database with structured ESG data using ESG auxiliary tool and ESG service providing system performing the same |
KR1020230054731A KR102682244B1 (en) | 2022-08-05 | 2023-04-26 | Method for learning machine-learning model with structured ESG data using ESG auxiliary tool and service server for generating automatically completed ESG documents with the machine-learning model |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220097982A Division KR102532216B1 (en) | 2022-08-05 | 2022-08-05 | Method for establishing ESG database with structured ESG data using ESG auxiliary tool and ESG service providing system performing the same |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20240020166A true KR20240020166A (en) | 2024-02-14 |
KR102682244B1 KR102682244B1 (en) | 2024-07-05 |
Family
ID=86385461
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220097982A KR102532216B1 (en) | 2022-08-05 | 2022-08-05 | Method for establishing ESG database with structured ESG data using ESG auxiliary tool and ESG service providing system performing the same |
KR1020230054731A KR102682244B1 (en) | 2022-08-05 | 2023-04-26 | Method for learning machine-learning model with structured ESG data using ESG auxiliary tool and service server for generating automatically completed ESG documents with the machine-learning model |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220097982A KR102532216B1 (en) | 2022-08-05 | 2022-08-05 | Method for establishing ESG database with structured ESG data using ESG auxiliary tool and ESG service providing system performing the same |
Country Status (1)
Country | Link |
---|---|
KR (2) | KR102532216B1 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024029939A1 (en) * | 2022-08-05 | 2024-02-08 | 주식회사 아이이에스지 | Method for building esg database containing structured esg data using esg auxiliary tool, and esg service provision system for carrying out same |
KR102699114B1 (en) * | 2023-12-06 | 2024-08-27 | 주식회사 아이이에스지 | Device and method for generating synthetic ESG data of corporate to be used for machine learning of ESG data-based prediction model using machine learning model |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101942468B1 (en) | 2017-01-03 | 2019-02-08 | 주식회사 페이스시스템 | Structured data and unstructured data extraction system and method |
KR20190059449A (en) | 2017-11-23 | 2019-05-31 | 지속가능발전소 주식회사 | Esg based enterprise assessment device and operating method thereof |
KR20200135607A (en) * | 2019-05-22 | 2020-12-03 | 삼성전자주식회사 | Method and apparatus for processing language based on trained network model |
KR20210108293A (en) * | 2020-02-25 | 2021-09-02 | 휴멜로 주식회사 | Apparatus for generating text and method thereof |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200059730A (en) * | 2018-11-21 | 2020-05-29 | 동신대학교산학협력단 | System and method for automatically evaluating an information security level |
KR102581414B1 (en) * | 2020-02-28 | 2023-09-21 | 주식회사 포시에스 | Apparatus and method for filling electronic document using dialogue comprehension based on format of electronic document |
-
2022
- 2022-08-05 KR KR1020220097982A patent/KR102532216B1/en active IP Right Grant
-
2023
- 2023-04-26 KR KR1020230054731A patent/KR102682244B1/en not_active Application Discontinuation
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101942468B1 (en) | 2017-01-03 | 2019-02-08 | 주식회사 페이스시스템 | Structured data and unstructured data extraction system and method |
KR20190059449A (en) | 2017-11-23 | 2019-05-31 | 지속가능발전소 주식회사 | Esg based enterprise assessment device and operating method thereof |
KR102026304B1 (en) * | 2017-11-23 | 2019-09-30 | 지속가능발전소 주식회사 | Esg based enterprise assessment device and operating method thereof |
KR20200135607A (en) * | 2019-05-22 | 2020-12-03 | 삼성전자주식회사 | Method and apparatus for processing language based on trained network model |
KR20210108293A (en) * | 2020-02-25 | 2021-09-02 | 휴멜로 주식회사 | Apparatus for generating text and method thereof |
Also Published As
Publication number | Publication date |
---|---|
KR102682244B1 (en) | 2024-07-05 |
KR102532216B1 (en) | 2023-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12026455B1 (en) | Systems and methods for construction, maintenance, and improvement of knowledge representations | |
US12099500B2 (en) | Processing a logical query | |
US11599714B2 (en) | Methods and systems for modeling complex taxonomies with natural language understanding | |
US11645317B2 (en) | Recommending topic clusters for unstructured text documents | |
US20190188326A1 (en) | Domain specific natural language understanding of customer intent in self-help | |
KR101114023B1 (en) | Content propagation for enhanced document retrieval | |
US12099804B2 (en) | Definition retrieval and display | |
CN111753198A (en) | Information recommendation method and device, electronic equipment and readable storage medium | |
EP3343400A1 (en) | System and method for dynamically creating a domain ontology | |
KR102682244B1 (en) | Method for learning machine-learning model with structured ESG data using ESG auxiliary tool and service server for generating automatically completed ESG documents with the machine-learning model | |
US20130124194A1 (en) | Systems and methods for manipulating data using natural language commands | |
US20190163500A1 (en) | Method and apparatus for providing personalized self-help experience | |
US10102246B2 (en) | Natural language consumer segmentation | |
KR20080107383A (en) | Adaptive semantic platform architecture | |
US20200410056A1 (en) | Generating machine learning training data for natural language processing tasks | |
US20180196871A1 (en) | System and method for metadata correlation using natural language processing | |
US11423232B2 (en) | Systems and methods for deploying computerized conversational agents | |
US11354345B2 (en) | Clustering topics for data visualization | |
CN114840869A (en) | Data sensitivity identification method and device based on sensitivity identification model | |
Sakai et al. | Rough set‐based rule generation and Apriori‐based rule generation from table data sets: a survey and a combination | |
US20180336242A1 (en) | Apparatus and method for generating a multiple-event pattern query | |
Musabeyezu | Comparative study of annotation tools and techniques | |
CN113961811A (en) | Conversational recommendation method, device, equipment and medium based on event map | |
KR102574784B1 (en) | Method for recommending suitable texts to auto-complete ESG documents and ESG service providing system performing the same | |
CN117891531B (en) | System parameter configuration method, system, medium and electronic equipment for SAAS software |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E601 | Decision to refuse application |