KR102440180B1 - Method and apparatus for determining whether to expose personal information using cdm packets - Google Patents
Method and apparatus for determining whether to expose personal information using cdm packets Download PDFInfo
- Publication number
- KR102440180B1 KR102440180B1 KR1020200181420A KR20200181420A KR102440180B1 KR 102440180 B1 KR102440180 B1 KR 102440180B1 KR 1020200181420 A KR1020200181420 A KR 1020200181420A KR 20200181420 A KR20200181420 A KR 20200181420A KR 102440180 B1 KR102440180 B1 KR 102440180B1
- Authority
- KR
- South Korea
- Prior art keywords
- electronic device
- query
- neural network
- personal information
- packet
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000003062 neural network model Methods 0.000 claims abstract description 39
- 230000004044 response Effects 0.000 claims abstract description 12
- 238000013528 artificial neural network Methods 0.000 claims description 31
- 230000000007 visual effect Effects 0.000 claims description 10
- 241000251730 Chondrichthyes Species 0.000 claims description 9
- 102100026278 Cysteine sulfinic acid decarboxylase Human genes 0.000 claims description 9
- 108010064775 protein C activator peptide Proteins 0.000 claims description 9
- 230000000306 recurrent effect Effects 0.000 claims description 9
- 238000013499 data model Methods 0.000 claims description 8
- 238000004891 communication Methods 0.000 description 12
- 230000014509 gene expression Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 210000002569 neuron Anatomy 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 210000000225 synapse Anatomy 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6227—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G06K9/62—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioethics (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- User Interface Of Digital Computer (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
본 개시는 개인 정보 노출 여부를 결정하는 방법 및 이를 수행하는 전자 장치에 관한 것이다. 일 실시 예에 의하면, 전자 장치가 개인 정보 노출여부를 결정하는 방법은 상기 전자 장치와 연결된 서버로 쿼리를 전송하는 단계; 상기 쿼리에 대한 쿼리 결과로써, 상기 전송된 쿼리에 응답하여 상기 서버로부터 전송되는 패킷을 획득하는 단계; 및 상기 획득된 패킷을 신경망 모델에 입력함으로써 상기 패킷 내 상기 전자 장치의 사용자에 대한 개인 정보가 노출되었는지 여부를 식별하는 단계; 를 포함할 수 있다.The present disclosure relates to a method for determining whether to expose personal information and an electronic device for performing the same. According to an embodiment, a method for an electronic device to determine whether to expose personal information includes: transmitting a query to a server connected to the electronic device; obtaining a packet transmitted from the server in response to the transmitted query as a query result for the query; and identifying whether personal information about a user of the electronic device in the packet is exposed by inputting the obtained packet into a neural network model; may include.
Description
본 개시는 개인 정보 노출 여부를 결정하는 방법 및 장치에 관한 것이다. 보다 상세하게는 CMD 쿼리 결과 내 패킷을 이용하여 개인 정보 노출 여부를 결정하는 방법 및 장치에 관한 것이다.The present disclosure relates to a method and apparatus for determining whether to disclose personal information. More particularly, it relates to a method and apparatus for determining whether to expose personal information using a packet in a CMD query result.
개인정보 노출을 분석할 때 가장 중요한 것은 문서 내 개인정보의 유무를 확인하는데 있다. 기존 개인 정보를 판별하는 방법 중 하나로 정규식(Regular expression)을 많이 활용하였으나, 개인 정보의 다형성을 판단할 수 없다는 한계가 있다.When analyzing personal information exposure, the most important thing is to check the presence or absence of personal information in the document. Although regular expressions have been widely used as one of the existing methods for determining personal information, there is a limitation in that polymorphism of personal information cannot be determined.
예를 들어, 대한민국의 주소를 정규식으로 표현하기 위해서 하기 수학식 1과 같은 정규식이 필요할 수 있다.For example, in order to express an address in Korea as a regular expression, a regular expression such as Equation 1 below may be required.
그러나, 상기 수학식 1과 같은 정규식은 실제 주소가 아닌 다른 일반 단어도 주소로 판별하거나, 실제 주소이지만 형태가 조금 다른 주소의 경우에 주소로 판별하지 못하는 한계가 있다. 상술한 예와 마찬가지로, 개인 정보 또한 다양한 형태를 가지고 있기 때문에 정규식으로 개인 정보를 구분하는 데는 한계가 있다.However, the regular expression shown in Equation 1 above has a limitation in that it cannot determine an address other than a real address as an address, or an address that is a real address but has a slightly different shape. As in the above example, since personal information also has various forms, there is a limit to classifying personal information with a regular expression.
따라서, 다양한 형태의 개인 정보를 식별하고, 개인 정보 노출 여부를 검출할 수 있는 기술 개발이 요구되고 있다.Accordingly, there is a demand for technology development capable of identifying various types of personal information and detecting whether or not personal information has been exposed.
일 실시 예에 따르면, 개인정보 노출 여부를 결정하는 방법 및 이를 수행하는 전자 장치가 제공될 수 있다.According to an embodiment, a method for determining whether to expose personal information and an electronic device for performing the same may be provided.
일 실시 예에 의하면, 신경망 모델을 이용하여 개인정보 노출 여부를 결정하는 방법 및 이를 수행하는 전자 장치가 제공될 수 있다.According to an embodiment, a method for determining whether to expose personal information using a neural network model and an electronic device for performing the same may be provided.
상술한 기술적 과제를 달성하기 위한 본 개시의 일 실시 예에 따라, 전자 장치가 개인 정보 노출 여부를 결정하는 방법은 상기 전자 장치와 연결된 서버로 쿼리를 전송하는 단계; 상기 쿼리에 대한 쿼리 결과로써, 상기 전송된 쿼리에 응답하여 상기 서버로부터 전송되는 패킷을 획득하는 단계; 및 상기 획득된 패킷을 신경망 모델에 입력함으로써 상기 패킷 내 상기 전자 장치의 사용자에 대한 개인 정보가 노출되었는지 여부를 식별하는 단계; 를 포함할 수 있다.According to an embodiment of the present disclosure for achieving the above-described technical problem, a method for an electronic device to determine whether to expose personal information includes: transmitting a query to a server connected to the electronic device; obtaining a packet transmitted from the server in response to the transmitted query as a query result for the query; and identifying whether personal information about a user of the electronic device in the packet is exposed by inputting the obtained packet into a neural network model; may include.
상술한 기술적 과제를 달성하기 위한 또 다른 실시 예에 의하면, 개인정보 노출 여부를 결정하는 전자 장치는 네트워크 인터페이스; 디스플레이; 하나 이상의 인스트럭션을 저장하는 메모리; 및 상기 하나 이상의 인스트럭션을 실행하는 적어도 하나의 프로세서; 를 포함하고, 상기 적어도 하나의 프로세서는 상기 하나 이상의 인스트럭션을 실행함으로써, 상기 전자 장치와 연결된 서버로 쿼리를 전송하고, 상기 쿼리에 대한 쿼리 결과로써, 상기 전송된 쿼리에 응답하여 상기 서버로부터 전송되는 패킷을 획득하고, 상기 획득된 패킷을 신경망 모델에 입력함으로써 상기 패킷 내 상기 전자 장치의 사용자에 대한 개인 정보가 노출되었는지 여부를 식별하는, 전자 장치가 제공될 수 있다.According to another embodiment for achieving the above-described technical problem, an electronic device for determining whether to expose personal information includes: a network interface; display; a memory storing one or more instructions; and at least one processor executing the one or more instructions. including, wherein the at least one processor transmits a query to a server connected to the electronic device by executing the one or more instructions, and as a query result for the query, is transmitted from the server in response to the transmitted query An electronic device may be provided that acquires a packet and identifies whether personal information about a user of the electronic device in the packet is exposed by inputting the acquired packet into a neural network model.
또한, 상술한 기술적 과제를 달성하기 위한 또 다른 실시 예에 따라 전자 장치가 개인정보 노출 여부를 결정하는 방법에 있어서, 상기 전자 장치와 연결된 서버로 쿼리를 전송하는 단계; 상기 쿼리에 대한 쿼리 결과로써, 상기 전송된 쿼리에 응답하여 상기 서버로부터 전송되는 패킷을 획득하는 단계; 및 상기 획득된 패킷을 신경망 모델에 입력함으로써 상기 패킷 내 상기 전자 장치의 사용자에 대한 개인 정보가 노출되었는지 여부를 식별하는 단계; 를 포함하는, 방법을 수행하도록 하는 프로그램이 저장된 컴퓨터로 읽을 수 있는 기록매체가 제공될 수 있다.In addition, according to another embodiment of the present invention for achieving the above-described technical problem, there is provided a method for determining whether to expose personal information by an electronic device, the method comprising: transmitting a query to a server connected to the electronic device; obtaining a packet transmitted from the server in response to the transmitted query as a query result for the query; and identifying whether personal information about a user of the electronic device in the packet is exposed by inputting the obtained packet into a neural network model; A computer-readable recording medium in which a program for performing the method is stored, including, may be provided.
도 1은 일 실시 예에 따른 전자 장치가 개인 정보 노출을 검사하는 과정을 개략적으로 설명하기 위한 도면이다.
도 2는 일 실시 예에 따른 전자 장치가 개인 정보 노출을 결정하는 방법의 흐름도이다.
도 3은 일 실시 예에 따른 전자 장치가 서버로부터 패킷을 획득하는 방법의 흐름도이다.
도 4는 일 실시 예에 따른 전자 장치가 신경망 모델을 이용하여 쿼리를 학습하는 과정을 설명하기 위한 도면이다.
도 5는 일 실시 예에 따른 전자 장치의 블록도이다.1 is a diagram schematically illustrating a process in which an electronic device inspects personal information exposure according to an exemplary embodiment.
2 is a flowchart of a method for an electronic device to determine personal information exposure, according to an embodiment.
3 is a flowchart of a method for an electronic device to obtain a packet from a server according to an embodiment.
4 is a diagram for describing a process in which an electronic device learns a query using a neural network model, according to an embodiment.
5 is a block diagram of an electronic device according to an embodiment.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 개시에 대해 구체적으로 설명하기로 한다. Terms used in this specification will be briefly described, and the present disclosure will be described in detail.
본 개시에서 사용되는 용어는 본 개시에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다. The terms used in the present disclosure have been selected as currently widely used general terms as possible while considering the functions in the present disclosure, but these may vary depending on the intention or precedent of a person skilled in the art, the emergence of new technology, and the like. In addition, in a specific case, there is a term arbitrarily selected by the applicant, and in this case, the meaning will be described in detail in the description of the corresponding invention. Therefore, the terms used in the present disclosure should be defined based on the meaning of the term and the contents of the present disclosure, rather than the simple name of the term.
명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.In the entire specification, when a part "includes" a certain component, it means that other components may be further included, rather than excluding other components, unless otherwise stated. In addition, terms such as "...unit" and "module" described in the specification mean a unit that processes at least one function or operation, which may be implemented as hardware or software, or a combination of hardware and software. .
아래에서는 첨부한 도면을 참고하여 본 개시의 실시예에 대하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 개시는 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 개시를 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.Hereinafter, with reference to the accompanying drawings, the embodiments of the present disclosure will be described in detail so that those of ordinary skill in the art to which the present disclosure pertains can easily implement them. However, the present disclosure may be implemented in several different forms and is not limited to the embodiments described herein. And in order to clearly explain the present disclosure in the drawings, parts irrelevant to the description are omitted, and similar reference numerals are attached to similar parts throughout the specification.
도 1은 일 실시 예에 따른 전자 장치가 개인 정보 노출을 검사하는 과정을 개략적으로 설명하기 위한 도면이다.1 is a diagram schematically illustrating a process in which an electronic device inspects personal information exposure according to an exemplary embodiment.
일 실시 예에 의하면, 개인 정보 검출 시스템(100)은 전자 장치(1000) 및 서버(2000)를 포함할 수도 있다. 일 실시 예에 의하면, 개인 정보 검출 시스템(100)은 전자 장치(1000) 및 서버(2000)사이에 송수신되는 패킷을 분석함으로써, 전자 장치(1000)의 사용자의 개인 정보 노출 여부 또는 서버의 전체적인 보안 위험을 검출할 수 있다.According to an embodiment, the personal
일 실시 예에 의하면, 전자 장치(1000)는 서버(2000)로 CDM 쿼리(162)를 전송하고, 전송된 쿼리(162)에 응답하여 CDM 쿼리 결과(164)를 획득할 수 있다. 일 실시 예에 의하면, CDM(Common Data Model)은 공통 데이터 모델로써 서로 다른 구조의 데이터를 활용하기 쉽게 표준화한 데이터 구조를 의미할 수 있다. 일 실시 예에 의하면, 전자 장치(1000) 또는 서버(2000) 중 적어도 하나가 관리하는 쿼리 및 쿼리에 대한 결과와 관련된 데이터들은 공통 데이터 모델 구조로 관리될 수 있다.According to an embodiment, the
일 실시 예에 의하면, 전자 장치(1000)는 서버(2000)로부터 획득되는 패킷을 분석함으로써, 패킷 내의 개인 정보가 노출되었는지 여부를 결정할 수 있다. 일 실시 예에 의하면, 전자 장치(1000)는 패킷 분석의 대표적인 오픈 소스인 ALTO(WIRE SHARK)를 이용하여 패킷을 분석할 수 있다. 또한, 전자 장치(1000)는 WIRE SHARK 를 응용한 ALTO 시스템과 연동하여 패킷의 전반적인 분석 과정을 수행할 수도 있다. 일 실시 예에 의하면, ALTO 시스템은 패킷 분석뿐만 아니라, 서버(2000)의 전체적인 보안 위험을 검출하는데 사용될 수도 있다. 일 실시 예에 의하면, 전자 장치(1000)는 개인 정보 토출 검사 결과, 또는 노출 위험에 대한 정보등을 시각적인 컨텐츠로 생성하고, 생성된 컨텐츠를 출력할 수도 있다.According to an embodiment, the
일 실시 예에 의하면, 전자 장치(1000)는 패킷 분석 결과에 대한 정보를, 신경망 모델에 입력함으로써 개인 정보 노출 여부를 식별할 수 있다. 일 실시 예에 의하면 전자 장치는 RNN 구조의 개체명 인식(NER) 모델에 패킷 분석 결과를 입력함으로써, 패킷 내 개인 정보 노출 여부를 결정할 수도 있다. 일 실시 예에 의하면 RNN으로 구성된 개체 인식 모델은 품사 판별기 (CRF)를 통하여, 구분되는 품사에 기초하여 학습될 수도 있다. 일 실시 예에 의하면 품사 판별기(CRF) 모델은 국립 국어원에서 제공되는 세종 말뭉치에 기초하여 학습될 수 있다.According to an embodiment, the
일 실시 예에 의하면, 전자 장치(1000)는 프로세서(110), 메모리(120) 및 네트워크 인터페이스(130)를 포함할 수 있다. 프로세서(110)는 메모리(120)내 하나 이상의 인스트럭션을 수행함으로써, 패킷 내 개인 정보가 노출되었는지 여부를 결정하는 방법을 수행할 수 있다. 일 실시 예에 의하면, 메모리(120)는 인공 지능 학습 알고리즘에 따라 학습될 수 있는 복수의 인공 지능 모델을 포함할 수 있다. 네트워크 인터페이스(130)는 서버(2000)와의 사이에 또는 개인 정보 검출 시스템 외의 기타 시스템과의 사이에 데이터, 패킷, 쿼리, 쿼리 결과를 송수신할 수 있다. According to an embodiment, the
일 실시 예에 의하면, 메모리(120)는 RNN(Recurrent Neural Network) 모델(122), 조건부 무작위장 모델(Conditional Random Field)(124), 개체명 인식 모델(Name Entity Recognition)(126) 모델을 포함할 수 있다. 일 실시 예에 의하면, 조건부 무작위장 모델(CRF)(126)은 신경망 모델로 구성됨으로써, 통계적 모델링 방법에 따라 스트링(STRING) 형식의 문장으로부터 품사를 식별할 수 있다. 일 실시 예에 의하면, 조건부 무작위장 모델(126)은 (단어, 품사), (단어, 품사) 형식으로 문장을 구성하는 단어와 품사를 식별할 수 있다. 일 실시 예에 의하면 조건부 무작위장 모델(126)은 시퀀셜 라벨링을 위해 POTENTIAL FUNCTION을 이용하년 SOFT MAX REGRESSION일 수 있다.According to an embodiment, the memory 120 includes a Recurrent Neural Network (RNN)
일 실시 예에 의하면, 개체명 인식 모델(126)은 RNN으로 구성되는 모델로써, 정규화된 개인 정보뿐만 아니라, 개인 정보로 판별될 수 있는 단어들을 유추하여 구분할 수 있다. 일 실시 예에 의하면 개체 인식 모델은 기계학습의 한 분류인 NLP, 자연어처리 기술에 사용될 수 있다. 개체명 인식 모델은 미리 정의된 사람, 회사, 장소, 시간 단위 등에 해당하는 단어(개체명)를 문서에서 추출하여 인식하는데 사용될 수 있다.According to an embodiment, the entity name recognition model 126 is a model composed of an RNN, and can infer and distinguish not only normalized personal information but also words that can be identified as personal information. According to an embodiment, the entity recognition model may be used for NLP and natural language processing technology, which are a classification of machine learning. The entity name recognition model may be used to extract and recognize a word (entity name) corresponding to a predefined person, company, place, time unit, etc. from a document.
또 다른 실시 예에 의하면, 전자 장치(1000)가 이용하는 인공 신경망(Artificial Neural Network)은 생물학적 신경망에 착안된 컴퓨팅 시스템을 지칭할 수 있다. 인공 신경망은 미리 정의된 조건에 따라 작업을 수행하는 고전적인 알고리즘과 달리, 다수의 샘플들을 고려함으로써 작업을 수행하는 것을 학습할 수 있다. 인공 신경망은 인공 뉴런(neuron)들이 연결된 구조를 가질 수 있고, 뉴런들 간의 연결은 시냅스(synapse)로 지칭될 수 있다. 뉴런은 수신된 신호를 처리할 수 있고, 처리된 신호를 시냅스를 통해서 다른 뉴런에 전송할 수 있다. 뉴런의 출력은 액티베이션(activation)으로 지칭될 수 있고, 뉴런 및/또는 시냅스는 변동될 수 있는 가중치(weight)를 가질 수 있고, 가중치에 따라 뉴런에 의해 처리된 신호의 영향력이 증가하거나 감소할 수 있다.According to another embodiment, an artificial neural network used by the
예를 들어, 인공 신경망은 복수의 신경망 레이어들로 구성될 수 있다. 복수의 신경망 레이어들 각각은 복수의 가중치들(weight values, weights)을 갖고 있으며, 이전(previous) 레이어의 연산 결과와 복수의 가중치들 간의 연산을 통해 신경망 연산을 수행한다. 복수의 신경망 레이어들이 갖고 있는 복수의 가중치들은 인공 신경망의 학습 결과에 의해 최적화될 수 있다. For example, the artificial neural network may be composed of a plurality of neural network layers. Each of the plurality of neural network layers has a plurality of weight values (weights), and a neural network operation is performed through an operation between an operation result of a previous layer and a plurality of weights. The plurality of weights of the plurality of neural network layers may be optimized by the learning result of the artificial neural network.
예를 들어, 학습 과정 동안 인공지능 모델에서 획득한 손실(loss) 값 또는 코스트(cost) 값이 감소 또는 최소화되도록 복수의 가중치들이 수정 및 갱신될 수 있다. 본 개시에 따른 인공 신경망은 심층 신경망(DNN:Deep Neural Network)을 포함할 수 있으며, 예를 들어, CNN (Convolutional Neural Network), DNN (Deep Neural Network), RNN (Recurrent Neural Network), RBM (Restricted Boltzmann Machine), DBN (Deep Belief Network), BRDNN(Bidirectional Recurrent Deep Neural Network) 또는 심층 Q-네트워크 (Deep Q-Networks) 등이 있으나, 전술한 예에 한정되지 않는다.For example, a plurality of weights may be modified and updated so that a loss value or a cost value obtained from the artificial intelligence model during the learning process is reduced or minimized. The artificial neural network according to the present disclosure may include a deep neural network (DNN), for example, a Convolutional Neural Network (CNN), Deep Neural Network (DNN), Recurrent Neural Network (RNN), Restricted RBM (RBM). Boltzmann Machine), DBN (Deep Belief Network), BRDNN (Bidirectional Recurrent Deep Neural Network), or deep Q-Networks, etc., but is not limited to the above-described example.
일 실시 예에 의하면, 전자 장치(1000)는 서버(2000)와 연동함으로써 쿼리 및 쿼리에 대한 결과를 송수신하며, 쿼리 결과로써 패킷 내 개인 정보 노출 여부를 검사할 수도 있다. 일 실시 예에 의하면, 서버(2000)는 프로세서(140), 데이터 베이스(150) 및 네트워크 인터페이스(160)를 포함할 수 있다. 프로세서(140)는 데이터 베이스(150)내 하나 이상의 인스트럭션을 실행함으로써, 서버(2000)로 하여금, 전자 장치와 연동하여 패킷 내 개인 정보를 분석하도록 할 수 있다. 일 실시 예에 의하면, 네트워크 인터페이스(160)는 전자 장치(1000)와의 사이에 또는 기타 개인 정보 노출 여부를 검사하기 위한 시스템 과의 사이에 데이터, 패킷, 쿼리, 쿼리 결과를 송수신할 수 있다.According to an embodiment, the
일 실시 예에 의하면, 프로세서(140)는 전자 장치(1000)로부터 CDM 쿼리(162)를 획득하고, 획득된 쿼리에 응답하여 쿼리 결과(164)를 전자 장치(1000)로 전송할 수도 있다. 일 실시 예에 의하면 서버(2000)가 전송한 CDM 쿼리 결과로써 패킷은 ALTO 시스템에 의해 분석됨으로써 서버(2000)전체의 보안 위험을 검사하는데 사용될 수도 있다.According to an embodiment, the processor 140 may obtain the CDM query 162 from the
도 2는 일 실시 예에 따른 전자 장치가 개인 정보 노출을 결정하는 방법의 흐름도이다.2 is a flowchart of a method for an electronic device to determine personal information exposure, according to an embodiment.
S210에서, 전자 장치(1000)는 전자 장치(1000)와 연결된 서버(2000)로 쿼리를 전송할 수 있다. 일 실시 예에 의하면, 전자 장치(1000)는 CDM(Common Data Model) 데이터를 쿼리 결과로써 요청하기 위한 CDM 쿼리를 서버로 전송할 수도 있다. S220에서, 전자 장치(1000)는 쿼리에 대한 쿼리 결과로써, 전송된 쿼리에 응답하여 서버로부터 전송되는 패킷을 획득할 수 있다. 일 실시 예에 의하면, 전자 장치(1000)는 HTTPS를 통해 서버로부터 쿼리 결과를 획득할 수도 있다.In S210 , the
S230에서, 전자 장치(1000)는 획득된 패킷을 신경망 모델에 입력함으로써 패킷 내 전자 장치의 사용자에 대한 개인 정보가 노출되었는지 여부를 식별할 수 있다. 또 다른 실시 예에 의하면, 전자 장치(1000)는 ALTO 시스템을 이용하여 분석된 패킷 분석 결과를 신경망 모델에 입력함으로써, 패킷 내 개인 정보가 노출되었는지 여부를 결정할 수도 있다.In S230 , the
또 다른 실시 예에 의하면, 전자 장치(1000)는 개인 정보가 노출되었는지 여부에 대한 정보를 시각 컨텐츠로 생성하고, 생성된 시각 컨텐츠를 전자 장치의 디스플레이 화면상에 표시할 수도 있다. 일 실시 예에 의하면, 전자 장치(1000)는 개인 정보 노출 결과를 시각적 또는 오디오 형태의 컨텐츠로 출력할 수도 있다.According to another embodiment, the
도 3은 일 실시 예에 따른 전자 장치가 서버로부터 패킷을 획득하는 방법의 흐름도이다.3 is a flowchart of a method for an electronic device to obtain a packet from a server according to an embodiment.
S310에서, 전자 장치(1000)는 HTTPS를 통해 서버(2000)에 접속할 수 있다. S320에서, 전자 장치(1000)는 접속된 서버(2000)를 통하여, 패킷을 획득할 수 있다. 보다 상세하게는, 전자 장치(1000)는 네트워크 인터페이스를 통하여 서버와 연결되고, 연결된 서버로부터 패킷을 획득할 수도 있다. S330에서, 전자 장치(1000)는 WIRE SHARK를 응용한 ALTO 시스템을 이용하여 획득된 패킷 내 데이터를 PCAP 파일로 저장할 수 있다. 전자 장치가 이용하는 와이어 샤크는 자유 및 오픈소스 패킷 분석 프로그램으로써 네트워크 문제, 분석, 소프트웨어 및 통신 프로토콜 개발에 사용될 수 있다. 전자 장치(1000)는 WIRE SHARK를 이용하여 서버로부터 획득된 패킷을 분석하고, 패킷 분석 결과(예컨대 PCAP 파일)를 소정의 신경망 모델에 입력할 수도 있다.In S310 , the
도 4는 일 실시 예에 따른 전자 장치가 신경망 모델을 이용하여 쿼리를 학습하는 과정을 설명하기 위한 도면이다.4 is a diagram for describing a process in which an electronic device learns a query using a neural network model, according to an embodiment.
일 실시 예에 의하면, 전자 장치(1000)는 서버로부터 획득된 패킷을 소정의 신경망 구조의 모델에 입력함으로써, 패킷 내 개인 정보 노출 여부를 결정할 수도 있다. 또 다른 실시 예에 의하면, 전자 장치(1000)는 WIRE SHARK를 이용하여 서버로부터 획득된 패킷을 분석하고, 분석 결과에 대한 정보를 소정의 신경망 모델에 입력할 수도 있다. 일 실시 예에 의하면, 신경망 모델은 문법의 기초가되는 품사를 구분하기 위한 조건부 무작위장 모델 및 개체명 인식 모델을 포함할 수 있다. According to an embodiment, the
일반적으로 개인 정보 노출을 분석할 때 문서 내 개인 정보의 유무를 확인하여야 하는데, 기존 개인 정보를 판별하는 방법 중 하나로 정규식(Regular expression)이 많이 활용되었으나, 개인 정보의 다형성을 판단할 수 없다는 한계가 있었다. 그러나, 본 개시에 따른 전자 장치(1000)는 신경망 모델(430)을 이용하여 개체명 인식 모델(420)을 구성하고, 개체명 인식 모델을 이용하여 정규화된 개인 정보뿐만 아니라, 개인 정보로 판별될 수 있는 단어를 유추하여 구분할 수 있다. 따라서, 본 개시에 따른 전자 장치(1000)는 개인 정보로 판별될 수 있는 단어를 유추하여 구분함으로써 정규식의 단점을 보완할 수 있다.In general, when analyzing personal information exposure, it is necessary to check the presence or absence of personal information in the document. Regular expression has been widely used as one of the methods for determining existing personal information, but there is a limitation that polymorphism of personal information cannot be determined. there was. However, the
또한, 전자 장치(1000)는 정규식의 단점을 보완하기 위해, 신경망 모델(430)로 구성된 조건부 무작위장 모델(410, CRF)을 통해 문법의 기초가 되는 품사를 구분할 수 있다. 한글에 관한 품사 정보를 이용해야만 조건부 무작위장 모델을 학습할 수 있는데, 전자 장치(1000)는 국립 국어원에서 제공하는 세종 말뭉치를 이용하여 조건부 무작위장 모델을 학습시킬 수 있다. 전자 장치(1000)는 학습된 조건부 무작위장 모델을 이용하여 한글에 관한 품사 정보를 식별하고, 식별된 품사 정보에 기초하여 개체명 인식 모델(420)을 학습시킬 수 있다. 전자 장치(1000)는 학습된 개체명 인식 모델을 이용하여 패킷 내 개인 정보로 판별될 수 있는 단어를 효과적으로 구분할 수 있다.Also, in order to compensate for the shortcomings of the regular expression, the
일 실시 예에 의하면, 조건부 무작위장 모델(410) 또는 개체명 인식 모델(420)을 구성하는 신경망 모델(430)은 심층 신경망(DNN:Deep Neural Network)을 포함할 수 있으며, 예를 들어, CNN (Convolutional Neural Network), DNN (Deep Neural Network), 순환신경망 RNN (Recurrent Neural Network), RBM (Restricted Boltzmann Machine), DBN (Deep Belief Network), BRDNN(Bidirectional Recurrent Deep Neural Network) 또는 심층 Q-네트워크 (Deep Q-Networks) 등을 포함할 수 있으나, 전술한 예에 한정되지 않는다. 일 실시 예에 의하면 신경망 모델(430)은 복수의 레이어들 및 상기 레이어들의 연결 강도에 관한 가중치(432)를 포함할 수 있다. 신경망 모델(430)은 가중치를 수정 및 갱신함으로써 학습될 수 있다.According to an embodiment, the neural network model 430 constituting the conditional random field model 410 or the entity name recognition model 420 may include a deep neural network (DNN), for example, CNN. (Convolutional Neural Network), DNN (Deep Neural Network), Recurrent Neural Network (RNN), RBM (Restricted Boltzmann Machine), DBN (Deep Belief Network), BRDNN (Bidirectional Recurrent Deep Neural Network) or Deep Q-Network ( Deep Q-Networks) and the like, but is not limited to the above-described example. According to an embodiment, the neural network model 430 may include a plurality of layers and a weight 432 related to the connection strength of the layers. The neural network model 430 can be trained by modifying and updating weights.
도 5는 일 실시 예에 따른 전자 장치의 블록도이다.5 is a block diagram of an electronic device according to an embodiment.
일 실시 예에 의하면, 전자 장치(1000)는 프로세서(1300), 네트워크 인터페이스(1500) 및 메모리(1700)를 포함할 수 있다. 그러나 상술한 예에 한정되는 것은 아니고, 전자 장치(1000)는 출력부(디스플레이, 스피커)를 더 포함할 수도 있다.According to an embodiment, the
일 실시 예에 의하면, 전자 장치(1000)는 소정의 신경망 모델을 생성하고, 생성된 신경망 모델을 학습시킬 수 있다. 전자 장치(1000)는 학습된 신경망 모델을 이용하여 서버로부터 패킷을 획득하고, 획득된 패킷 내 개인 정보들이 노출되었는지 여부를 결정할 수 있다.According to an embodiment, the
일 실시 예에 의하면, 전자 장치(1000)는 인공 신경망(Artificial Neural Network)을 학습 시키기 위한 학습 데이터를 생성할 수 있다. 일 실시 예에 의하면, 전자 장치(1000)는 생성된 학습 데이터를 이용하여 인공 신경망 내 레이어들 및 레이어들의 연결 강도에 관한 가중치(weight)를 수정 및 갱신함으로써 인공 신경망을 학습시킬 수 있다. 일 실시 예에 의하면, 전자 장치(1000)는 인공 신경망의 가중치를 처리하기 위한, AI 프로그램이 탑재되고 음성 인식 기능을 포함하는 스마트폰, 태블릿 PC, PC, 스마트 TV, 휴대폰, 미디어 플레이어, 서버, 마이크로 서버, 기타 모바일 또는 비모바일 컴퓨팅 장치일 수 있으나, 이에 제한되지 않는다.According to an embodiment, the
일 실시 예에 의하면, 프로세서(1300)는 메모리(1700)내 하나 이상의 인스트럭션을 수행함으로써 전자 장치(1000)의 전반적인 동작을 제어한다. 일 실시 예에 의하면, 프로세서(1300)는 메모리(1700)에 저장된 프로그램들을 실행함으로써 도 1 내지 도 4에 기재된 전자 장치(10000)의 기능을 수행할 수 있다. 프로세서(1300)는 하나 또는 복수의 프로세서로 구성될 수 있고, 하나 또는 복수의 프로세서는 CPU, AP, DSP(Digital Signal Processor) 등과 같은 범용 프로세서, GPU와 같은 그래픽 전용 프로세서일 수 있다. 일 실시 예에 의하면, 프로세서(1300)가 범용 프로세서 및 그래픽 전용 프로세서를 포함하는 경우, 각각의 범용 프로세서 및 그래픽 전용 프로세서는 별도의 칩으로 구현될 수도 있다. According to an embodiment, the processor 1300 controls the overall operation of the
일 실시 예에 의하면, 프로세서(1300)가 복수의 프로세서 또는 그래픽 전용 프로세서로 구현될 때, 복수의 프로세서 또는 그래픽 전용 프로세서 중 적어도 일부는 전자 장치(1000) 및 전자 장치(1000)와 연결된 다른 전자 장치 또는 서버에 탑재될 수도 있다. 예를 들어, 프로세서(1300)는, 메모리(1700)에 저장된 프로그램들을 실행함으로써, 서버와 연동하여 패킷을 송수신하고, 패킷 내 개인 정보가 노출되었는지 여부를 결정할 수 있다.According to an embodiment, when the processor 1300 is implemented as a plurality of processors or graphics-only processors, at least some of the plurality of processors or graphics-only processors may include the
일 실시 예에 의하면, 프로세서(1300)는 상기 전자 장치와 연결된 서버로 쿼리를 전송하고, 상기 쿼리에 대한 쿼리 결과로써, 상기 전송된 쿼리에 응답하여 상기 서버로부터 전송되는 패킷을 획득하고, 상기 획득된 패킷을 신경망 모델에 입력함으로써 상기 패킷 내 상기 전자 장치의 사용자에 대한 개인 정보가 노출되었는지 여부를 식별할 수 있다.According to an embodiment, the processor 1300 transmits a query to a server connected to the electronic device, obtains a packet transmitted from the server in response to the transmitted query as a query result of the query, and obtains the By inputting the received packet into the neural network model, it is possible to identify whether personal information about the user of the electronic device in the packet is exposed.
일 실시 예에 의하면, 프로세서(1300)는 상기 개인 정보가 노출되었는지 여부에 대한 시각 컨텐츠를 생성하고 상기 생성된 시각 컨텐츠를 상기 전자 장치의 화면상에 표시할 수 있다.According to an embodiment, the processor 1300 may generate visual content for whether the personal information is exposed or not, and display the generated visual content on the screen of the electronic device.
일 실시 예에 의하면, 프로세서(1300)는 CDM(Common Data Model) 데이터를 쿼리 결과로써 요청하기 위한 CDM 쿼리를 전송할 수 있다.According to an embodiment, the processor 1300 may transmit a CDM query for requesting Common Data Model (CDM) data as a query result.
일 실시 예에 의하면, 프로세서(1300)는 HTTPS를 통해 상기 서버에 접속하고,According to an embodiment, the processor 1300 accesses the server through HTTPS,
상기 접속된 서버로부터 패킷을 획득하고, WIRE SHARK를 응용한 ALTO 시스템을 이용해, 상기 획득된 패킷 내 데이터를 PCAP 파일로 저장할 수 있다.A packet may be obtained from the connected server, and data in the obtained packet may be stored as a PCAP file by using the ALTO system to which WIRE SHARK is applied.
일 실시 예에 의하면, 프로세서(1300)는 상기 PCAP 파일을 상기 신경망 모델에 입력하고, 상기 신경망 모델의 출력 값에 기초하여 상기 전자 장치의 사용자에 대한 상기 개인 정보가 노출되었는지 여부를 식별할 수 있다.According to an embodiment, the processor 1300 may input the PCAP file to the neural network model and identify whether the personal information about the user of the electronic device has been exposed based on an output value of the neural network model. .
네트워크 인터페이스(1500)는 전자 장치(1000)가 다른 장치(미도시) 및 서버(2000)와 통신을 하게 하는 하나 이상의 구성요소를 포함할 수 있다. 다른 장치(미도시)는 전자 장치(1000)와 같은 컴퓨팅 장치이거나, 센싱 장치일 수 있으나, 이에 제한되지 않는다. 예를 들어, 네트워크 인터페이스(1500)는 근거리 통신부, 이동 통신부를 포함할 수 있다. The
근거리 통신부(short-range wireless communication unit) 는, 블루투스 통신부, BLE(Bluetooth Low Energy) 통신부, 근거리 무선 통신부(Near Field Communication unit), WLAN(와이파이) 통신부, 지그비(Zigbee) 통신부, 적외선(IrDA, infrared Data Association) 통신부, WFD(Wi-Fi Direct) 통신부, UWB(ultra wideband) 통신부, 등을 포함할 수 있으나, 이에 한정되는 것은 아니다. 이동 통신부는, 이동 통신망 상에서 기지국, 외부의 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다. 일 실시 예에 의하면, 네트워크 인터페이스(미도시)는 프로세서의 제어에 의하여, 서버로 쿼리 요청, CDM 쿼리 요청, 인공 신경망 내 가중치 값들, 상기 인공 신경망을 학습시키기 위한 학습 데이터등에 대한 요청을 전송하거나, 요청에 응답하여 쿼리 결과, 인공 신경망 학습 데이터, 인공 신경망의 학습 정보등을 수신할 수도 있다.Short-range wireless communication unit, Bluetooth communication unit, BLE (Bluetooth Low Energy) communication unit, near field communication unit (Near Field Communication unit), WLAN (Wi-Fi) communication unit, Zigbee communication unit, infrared (IrDA, infrared) It may include a data association) communication unit, a Wi-Fi Direct (WFD) communication unit, an ultra wideband (UWB) communication unit, and the like, but is not limited thereto. The mobile communication unit transmits/receives a radio signal to and from at least one of a base station, an external terminal, and a server on a mobile communication network. According to an embodiment, the network interface (not shown) transmits a query request, a CDM query request, a weight value in the artificial neural network, training data for learning the artificial neural network, etc. to the server under the control of the processor, In response to the request, the query result, artificial neural network learning data, artificial neural network learning information, and the like may be received.
메모리(1700)는, 프로세서(1300)의 처리 및 제어를 위한 프로그램을 저장할 수 있고, 전자 장치(1000)로 입력되거나 전자 장치(1000)로부터 출력되는 데이터를 저장할 수도 있다. 또한, 메모리(1700)는 인공 신경망을 구성하는 레이어들, 레이어들에 포함된 노드들 및 레이어들의 연결 강도에 관한 가중치들에 대한 정보를 저장할 수 있다. 또한, 메모리(1700)는 증강 데이터들을 더 저장할 수도 있다. 또한, 메모리(1700)는 인공 신경망 내 가중치들이 수정 및 갱신될 경우, 수정 및 갱신된 가중치에 관한 정보를 더 저장할 수 있다. 또한, 메모리(1700)는 개체명 인식 모델, 조건부 무작위장 모델, 신경망 모델에 대한 정보를 더 저장할 수도 있다.The memory 1700 may store a program for processing and controlling the processor 1300 , and may also store data input to or output from the
메모리(1700)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(RAM, Random Access Memory) SRAM(Static Random Access Memory), 롬(ROM, Read-Only Memory), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. The memory 1700 may include a flash memory type, a hard disk type, a multimedia card micro type, a card type memory (eg, SD or XD memory), and a RAM. (RAM, Random Access Memory) SRAM (Static Random Access Memory), ROM (Read-Only Memory), EEPROM (Electrically Erasable Programmable Read-Only Memory), PROM (Programmable Read-Only Memory), magnetic memory, magnetic disk , may include at least one type of storage medium among optical disks.
일 실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 개시를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. The method according to an embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, etc. alone or in combination. The program instructions recorded on the medium may be specially designed and configured for the present disclosure, or may be known and available to those skilled in the art of computer software.
또한, 상기 일 실시 예에 다른 방법을 수행하도록 하는 프로그램이 저장된 기록매체를 포함하는 컴퓨터 프로그램 장치가 제공될 수 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. In addition, according to the embodiment, a computer program apparatus including a recording medium storing a program for performing another method may be provided. Examples of the computer-readable recording medium include magnetic media such as hard disks, floppy disks and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic such as floppy disks. - includes magneto-optical media, and hardware devices specially configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine language codes such as those generated by a compiler, but also high-level language codes that can be executed by a computer using an interpreter or the like.
이상에서 본 개시의 실시예에 대하여 상세하게 설명하였지만 본 개시의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 개시의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 개시의 권리범위에 속한다.Although the embodiments of the present disclosure have been described in detail above, the scope of the present disclosure is not limited thereto, and various modifications and improved forms of the present disclosure are also provided by those skilled in the art using the basic concept of the present disclosure as defined in the following claims. belong to the scope of the right.
Claims (13)
상기 전자 장치와 연결된 서버로 CDM(Common Data Model) 데이터를 쿼리 결과로써 요청하기 위한 CDM 쿼리를 전송하는 단계;
상기 쿼리에 대한 쿼리 결과로써, 상기 전송된 쿼리에 응답하여 HTTPS를 통해 상기 서버에 접속하고, 상기 접속된 서버로부터 전송되는 패킷을 획득하는 단계; 및
상기 획득된 패킷을 신경망 모델에 입력함으로써 상기 패킷 내 상기 전자 장치의 사용자에 대한 개인 정보가 노출되었는지 여부를 식별하는 단계; 를 포함하고,
상기 패킷을 획득하는 단계는,
WIRE SHARK를 응용한 ALTO 시스템을 이용해, 상기 획득된 패킷 내 데이터를 PCAP 파일로 저장하는 단계를 포함하며,
상기 신경망 모델은,
순환 신경망 모델(Recurrent Neural Network) 구조이고, 문법의 기초가 되는 품사를 구분하기 위한 조건부 무작위장(Conditional Random Field) 모델 및 개체명 인식(Named Entitiy Recognition) 모델을 포함하는 것을 특징으로 하는, 방법.In a method for an electronic device to determine whether to expose personal information,
transmitting a CDM query for requesting Common Data Model (CDM) data as a query result to a server connected to the electronic device;
accessing the server through HTTPS in response to the transmitted query as a result of the query for the query, and obtaining a packet transmitted from the connected server; and
identifying whether personal information about a user of the electronic device in the packet is exposed by inputting the obtained packet into a neural network model; including,
The step of obtaining the packet includes:
Using the ALTO system to which WIRE SHARK is applied, it includes the step of storing the obtained data in the packet as a PCAP file,
The neural network model is
It is a recurrent neural network model (Recurrent Neural Network) structure, and comprises a Conditional Random Field model and a Named Entity Recognition model for distinguishing parts of speech that are the basis of grammar.
상기 개인 정보가 노출되었는지 여부에 대한 시각 컨텐츠를 생성하는 단계; 및
상기 생성된 시각 컨텐츠를 상기 전자 장치의 화면상에 표시하는 단계; 를 포함하는, 방법.The method of claim 1, wherein the method
generating visual content for whether the personal information has been exposed; and
displaying the generated visual content on a screen of the electronic device; A method comprising
상기 PCAP 파일을 상기 신경망 모델에 입력하는 단계; 및
상기 신경망 모델의 출력 값에 기초하여 상기 전자 장치의 사용자에 대한 상기 개인 정보가 노출되었는지 여부를 식별하는 단계; 를 포함하는, 방법.The method of claim 1, wherein the step of identifying whether the personal information has been exposed comprises:
inputting the PCAP file into the neural network model; and
identifying whether the personal information about the user of the electronic device has been exposed based on an output value of the neural network model; A method comprising
네트워크 인터페이스;
디스플레이;
하나 이상의 인스트럭션을 저장하는 메모리; 및
상기 하나 이상의 인스트럭션을 실행하는 적어도 하나의 프로세서; 를 포함하고,
상기 적어도 하나의 프로세서는 상기 하나 이상의 인스트럭션을 실행함으로써,
상기 전자 장치와 연결된 서버로 CDM(Common Data Model) 데이터를 쿼리 결과로써 요청하기 위한 CDM 쿼리를 전송하고,
상기 쿼리에 대한 쿼리 결과로써, 상기 전송된 쿼리에 응답하여 HTTPS를 통해 상기 서버에 접속하고, 상기 접속된 서버로부터 전송되는 패킷을 획득하고,
상기 획득된 패킷을 신경망 모델에 입력함으로써 상기 패킷 내 상기 전자 장치의 사용자에 대한 개인 정보가 노출되었는지 여부를 식별하고,
상기 적어도 하나의 프로세서는,
WIRE SHARK를 응용한 ALTO 시스템을 이용해, 상기 획득된 패킷 내 데이터를 PCAP 파일로 저장하고,
상기 신경망 모델은,
순환 신경망 모델(Recurrent Neural Network) 구조이고, 문법의 기초가 되는 품사를 구분하기 위한 조건부 무작위장(Conditional Random Field) 모델 및 개체명 인식(Named Entitiy Recognition) 모델을 포함하는 것을 특징으로 하는, 전자 장치.In the electronic device for determining whether to expose personal information,
network interface;
display;
a memory storing one or more instructions; and
at least one processor executing the one or more instructions; including,
The at least one processor by executing the one or more instructions,
Transmitting a CDM query for requesting CDM (Common Data Model) data as a query result to a server connected to the electronic device,
accessing the server through HTTPS in response to the transmitted query as a result of the query for the query, and obtaining a packet transmitted from the connected server;
By inputting the obtained packet into a neural network model, it is identified whether personal information about a user of the electronic device in the packet is exposed,
the at least one processor,
Using the ALTO system to which WIRE SHARK is applied, the data in the acquired packet is stored as a PCAP file,
The neural network model is
It is a recurrent neural network model structure and comprises a Conditional Random Field model and a Named Entity Recognition model for distinguishing parts of speech that are the basis of grammar, an electronic device .
상기 하나 이상의 인스트럭션을 실행함으로써,
상기 개인 정보가 노출되었는지 여부에 대한 시각 컨텐츠를 생성하고
상기 생성된 시각 컨텐츠를 상기 전자 장치의 화면상에 표시하는, 전자 장치.8. The method of claim 7, wherein the at least one processor comprises:
By executing the one or more instructions,
create visual content about whether the personal information has been exposed, and
and displaying the generated visual content on a screen of the electronic device.
상기 PCAP 파일을 상기 신경망 모델에 입력하고,
상기 신경망 모델의 출력 값에 기초하여 상기 전자 장치의 사용자에 대한 상기 개인 정보가 노출되었는지 여부를 식별하는, 전자 장치.8. The method of claim 7, wherein the at least one processor comprises:
input the PCAP file to the neural network model;
and identifying whether the personal information about the user of the electronic device has been exposed based on an output value of the neural network model.
상기 전자 장치와 연결된 서버로 CDM(Common Data Model) 데이터를 쿼리 결과로써 요청하기 위한 CDM 쿼리를 전송하는 단계;
상기 쿼리에 대한 쿼리 결과로써, 상기 전송된 쿼리에 응답하여 HTTPS를 통해 상기 서버에 접속하고, 상기 접속된 서버로부터 전송되는 패킷을 획득하는 단계; 및
상기 획득된 패킷을 신경망 모델에 입력함으로써 상기 패킷 내 상기 전자 장치의 사용자에 대한 개인 정보가 노출되었는지 여부를 식별하는 단계; 를 포함하고,
상기 패킷을 획득하는 단계는,
WIRE SHARK를 응용한 ALTO 시스템을 이용해, 상기 획득된 패킷 내 데이터를 PCAP 파일로 저장하는 단계를 포함하며,
상기 신경망 모델은,
순환 신경망 모델(Recurrent Neural Network) 구조이고, 문법의 기초가 되는 품사를 구분하기 위한 조건부 무작위장(Conditional Random Field) 모델 및 개체명 인식(Named Entitiy Recognition) 모델을 포함하는 것을 특징으로 하는, 방법을 수행하도록 하는 프로그램이 저장된 컴퓨터로 읽을 수 있는 기록매체.In a method for an electronic device to determine whether to expose personal information,
transmitting a CDM query for requesting Common Data Model (CDM) data as a query result to a server connected to the electronic device;
accessing the server through HTTPS in response to the transmitted query as a result of the query for the query, and obtaining a packet transmitted from the connected server; and
identifying whether personal information about a user of the electronic device in the packet is exposed by inputting the obtained packet into a neural network model; including,
The step of obtaining the packet includes:
Using the ALTO system to which WIRE SHARK is applied, it includes the step of storing the obtained data in the packet as a PCAP file,
The neural network model is
It is a recurrent neural network model structure, and it is characterized by including a Conditional Random Field model and a Named Entity Recognition model for distinguishing parts of speech that are the basis of grammar. A computer-readable recording medium in which a program to be executed is stored.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200181420A KR102440180B1 (en) | 2020-12-22 | 2020-12-22 | Method and apparatus for determining whether to expose personal information using cdm packets |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200181420A KR102440180B1 (en) | 2020-12-22 | 2020-12-22 | Method and apparatus for determining whether to expose personal information using cdm packets |
Publications (3)
Publication Number | Publication Date |
---|---|
KR20220090332A KR20220090332A (en) | 2022-06-29 |
KR102440180B1 true KR102440180B1 (en) | 2022-09-02 |
KR102440180B9 KR102440180B9 (en) | 2023-02-23 |
Family
ID=82270409
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200181420A KR102440180B1 (en) | 2020-12-22 | 2020-12-22 | Method and apparatus for determining whether to expose personal information using cdm packets |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102440180B1 (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101054107B1 (en) * | 2011-03-25 | 2011-08-03 | 한국인터넷진흥원 | A system for exposure retrieval of personal information using image features |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080029123A (en) * | 2006-09-28 | 2008-04-03 | 한국전자통신연구원 | Apparatus and method for generating a generalized user profile |
KR101265467B1 (en) * | 2010-12-17 | 2013-05-16 | 한국과학기술원 | Method for extracting experience and classifying verb in blog |
KR20140049148A (en) * | 2012-10-16 | 2014-04-25 | 한국전자통신연구원 | Method for part-of-speech tagging based on morpheme segmentation and apparatus thereof |
KR20140115602A (en) * | 2013-03-21 | 2014-10-01 | 주식회사 퓨전소프트 | Protocol Reverse Engineering |
KR102101456B1 (en) | 2018-10-31 | 2020-04-16 | (주)아이티 노매즈 | Method for reducing false positives for diagnosis of personal information exposure of text files and irregular image files |
-
2020
- 2020-12-22 KR KR1020200181420A patent/KR102440180B1/en active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101054107B1 (en) * | 2011-03-25 | 2011-08-03 | 한국인터넷진흥원 | A system for exposure retrieval of personal information using image features |
Also Published As
Publication number | Publication date |
---|---|
KR20220090332A (en) | 2022-06-29 |
KR102440180B9 (en) | 2023-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10991366B2 (en) | Method of processing dialogue query priority based on dialog act information dependent on number of empty slots of the query | |
US11367434B2 (en) | Electronic device, method for determining utterance intention of user thereof, and non-transitory computer-readable recording medium | |
CN107391760B (en) | User interest recognition methods, device and computer readable storage medium | |
US10521723B2 (en) | Electronic apparatus, method of providing guide and non-transitory computer readable recording medium | |
CN108564941A (en) | Audio recognition method, device, equipment and storage medium | |
US11164565B2 (en) | Unsupervised learning system and method for performing weighting for improvement in speech recognition performance and recording medium for performing the method | |
US11532305B2 (en) | Electronic apparatus and control method thereof | |
US11810596B2 (en) | Apparatus and method for speech-emotion recognition with quantified emotional states | |
US11769492B2 (en) | Voice conversation analysis method and apparatus using artificial intelligence | |
WO2021103712A1 (en) | Neural network-based voice keyword detection method and device, and system | |
US20220114497A1 (en) | Smart copy optimization in customer acquisition and customer management platforms | |
US20210255759A1 (en) | Indication of content linked to text | |
KR102537113B1 (en) | Method for determining a confidence level of inference data produced by artificial neural network | |
KR20220071059A (en) | Method for evaluation of emotion based on emotion analysis model and device using the same | |
CN112329433A (en) | Text smoothness detection method, device and equipment and computer readable storage medium | |
KR102703332B1 (en) | Method for evaluating consultation quality | |
US11705110B2 (en) | Electronic device and controlling the electronic device | |
KR102440180B1 (en) | Method and apparatus for determining whether to expose personal information using cdm packets | |
US20210090593A1 (en) | Method and device for analyzing real-time sound | |
US20220108550A1 (en) | Electronic device and control method of same | |
WO2019051704A1 (en) | Method and device for identifying junk file | |
US11972756B2 (en) | Method for recognizing the voice of audio containing foreign languages | |
CN117522592B (en) | Data configuration method, electronic device and storage medium | |
KR102674954B1 (en) | Method and apparatus for providing search service using large language model and deep learning | |
CN114817456B (en) | Keyword detection method, keyword detection device, computer equipment and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
G170 | Re-publication after modification of scope of protection [patent] |