Nothing Special   »   [go: up one dir, main page]

KR102440180B1 - Method and apparatus for determining whether to expose personal information using cdm packets - Google Patents

Method and apparatus for determining whether to expose personal information using cdm packets Download PDF

Info

Publication number
KR102440180B1
KR102440180B1 KR1020200181420A KR20200181420A KR102440180B1 KR 102440180 B1 KR102440180 B1 KR 102440180B1 KR 1020200181420 A KR1020200181420 A KR 1020200181420A KR 20200181420 A KR20200181420 A KR 20200181420A KR 102440180 B1 KR102440180 B1 KR 102440180B1
Authority
KR
South Korea
Prior art keywords
electronic device
query
neural network
personal information
packet
Prior art date
Application number
KR1020200181420A
Other languages
Korean (ko)
Other versions
KR20220090332A (en
KR102440180B9 (en
Inventor
황상원
김민아
포비체카
권찬우
Original Assignee
연세대학교 원주산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 원주산학협력단 filed Critical 연세대학교 원주산학협력단
Priority to KR1020200181420A priority Critical patent/KR102440180B1/en
Publication of KR20220090332A publication Critical patent/KR20220090332A/en
Application granted granted Critical
Publication of KR102440180B1 publication Critical patent/KR102440180B1/en
Publication of KR102440180B9 publication Critical patent/KR102440180B9/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6227Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • G06K9/62
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioethics (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • User Interface Of Digital Computer (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

본 개시는 개인 정보 노출 여부를 결정하는 방법 및 이를 수행하는 전자 장치에 관한 것이다. 일 실시 예에 의하면, 전자 장치가 개인 정보 노출여부를 결정하는 방법은 상기 전자 장치와 연결된 서버로 쿼리를 전송하는 단계; 상기 쿼리에 대한 쿼리 결과로써, 상기 전송된 쿼리에 응답하여 상기 서버로부터 전송되는 패킷을 획득하는 단계; 및 상기 획득된 패킷을 신경망 모델에 입력함으로써 상기 패킷 내 상기 전자 장치의 사용자에 대한 개인 정보가 노출되었는지 여부를 식별하는 단계; 를 포함할 수 있다.The present disclosure relates to a method for determining whether to expose personal information and an electronic device for performing the same. According to an embodiment, a method for an electronic device to determine whether to expose personal information includes: transmitting a query to a server connected to the electronic device; obtaining a packet transmitted from the server in response to the transmitted query as a query result for the query; and identifying whether personal information about a user of the electronic device in the packet is exposed by inputting the obtained packet into a neural network model; may include.

Figure R1020200181420
Figure R1020200181420

Description

CDM 패킷을 이용하여 개인정보 노출 여부를 결정하는 방법 및 장치 {METHOD AND APPARATUS FOR DETERMINING WHETHER TO EXPOSE PERSONAL INFORMATION USING CDM PACKETS}Method and device for determining whether personal information is exposed using CDM packets

본 개시는 개인 정보 노출 여부를 결정하는 방법 및 장치에 관한 것이다. 보다 상세하게는 CMD 쿼리 결과 내 패킷을 이용하여 개인 정보 노출 여부를 결정하는 방법 및 장치에 관한 것이다.The present disclosure relates to a method and apparatus for determining whether to disclose personal information. More particularly, it relates to a method and apparatus for determining whether to expose personal information using a packet in a CMD query result.

개인정보 노출을 분석할 때 가장 중요한 것은 문서 내 개인정보의 유무를 확인하는데 있다. 기존 개인 정보를 판별하는 방법 중 하나로 정규식(Regular expression)을 많이 활용하였으나, 개인 정보의 다형성을 판단할 수 없다는 한계가 있다.When analyzing personal information exposure, the most important thing is to check the presence or absence of personal information in the document. Although regular expressions have been widely used as one of the existing methods for determining personal information, there is a limitation in that polymorphism of personal information cannot be determined.

예를 들어, 대한민국의 주소를 정규식으로 표현하기 위해서 하기 수학식 1과 같은 정규식이 필요할 수 있다.For example, in order to express an address in Korea as a regular expression, a regular expression such as Equation 1 below may be required.

Figure 112020139976551-pat00001
Figure 112020139976551-pat00001

그러나, 상기 수학식 1과 같은 정규식은 실제 주소가 아닌 다른 일반 단어도 주소로 판별하거나, 실제 주소이지만 형태가 조금 다른 주소의 경우에 주소로 판별하지 못하는 한계가 있다. 상술한 예와 마찬가지로, 개인 정보 또한 다양한 형태를 가지고 있기 때문에 정규식으로 개인 정보를 구분하는 데는 한계가 있다.However, the regular expression shown in Equation 1 above has a limitation in that it cannot determine an address other than a real address as an address, or an address that is a real address but has a slightly different shape. As in the above example, since personal information also has various forms, there is a limit to classifying personal information with a regular expression.

따라서, 다양한 형태의 개인 정보를 식별하고, 개인 정보 노출 여부를 검출할 수 있는 기술 개발이 요구되고 있다.Accordingly, there is a demand for technology development capable of identifying various types of personal information and detecting whether or not personal information has been exposed.

한국등록특허 제2101456호Korean Patent No. 2101456

일 실시 예에 따르면, 개인정보 노출 여부를 결정하는 방법 및 이를 수행하는 전자 장치가 제공될 수 있다.According to an embodiment, a method for determining whether to expose personal information and an electronic device for performing the same may be provided.

일 실시 예에 의하면, 신경망 모델을 이용하여 개인정보 노출 여부를 결정하는 방법 및 이를 수행하는 전자 장치가 제공될 수 있다.According to an embodiment, a method for determining whether to expose personal information using a neural network model and an electronic device for performing the same may be provided.

상술한 기술적 과제를 달성하기 위한 본 개시의 일 실시 예에 따라, 전자 장치가 개인 정보 노출 여부를 결정하는 방법은 상기 전자 장치와 연결된 서버로 쿼리를 전송하는 단계; 상기 쿼리에 대한 쿼리 결과로써, 상기 전송된 쿼리에 응답하여 상기 서버로부터 전송되는 패킷을 획득하는 단계; 및 상기 획득된 패킷을 신경망 모델에 입력함으로써 상기 패킷 내 상기 전자 장치의 사용자에 대한 개인 정보가 노출되었는지 여부를 식별하는 단계; 를 포함할 수 있다.According to an embodiment of the present disclosure for achieving the above-described technical problem, a method for an electronic device to determine whether to expose personal information includes: transmitting a query to a server connected to the electronic device; obtaining a packet transmitted from the server in response to the transmitted query as a query result for the query; and identifying whether personal information about a user of the electronic device in the packet is exposed by inputting the obtained packet into a neural network model; may include.

상술한 기술적 과제를 달성하기 위한 또 다른 실시 예에 의하면, 개인정보 노출 여부를 결정하는 전자 장치는 네트워크 인터페이스; 디스플레이; 하나 이상의 인스트럭션을 저장하는 메모리; 및 상기 하나 이상의 인스트럭션을 실행하는 적어도 하나의 프로세서; 를 포함하고, 상기 적어도 하나의 프로세서는 상기 하나 이상의 인스트럭션을 실행함으로써, 상기 전자 장치와 연결된 서버로 쿼리를 전송하고, 상기 쿼리에 대한 쿼리 결과로써, 상기 전송된 쿼리에 응답하여 상기 서버로부터 전송되는 패킷을 획득하고, 상기 획득된 패킷을 신경망 모델에 입력함으로써 상기 패킷 내 상기 전자 장치의 사용자에 대한 개인 정보가 노출되었는지 여부를 식별하는, 전자 장치가 제공될 수 있다.According to another embodiment for achieving the above-described technical problem, an electronic device for determining whether to expose personal information includes: a network interface; display; a memory storing one or more instructions; and at least one processor executing the one or more instructions. including, wherein the at least one processor transmits a query to a server connected to the electronic device by executing the one or more instructions, and as a query result for the query, is transmitted from the server in response to the transmitted query An electronic device may be provided that acquires a packet and identifies whether personal information about a user of the electronic device in the packet is exposed by inputting the acquired packet into a neural network model.

또한, 상술한 기술적 과제를 달성하기 위한 또 다른 실시 예에 따라 전자 장치가 개인정보 노출 여부를 결정하는 방법에 있어서, 상기 전자 장치와 연결된 서버로 쿼리를 전송하는 단계; 상기 쿼리에 대한 쿼리 결과로써, 상기 전송된 쿼리에 응답하여 상기 서버로부터 전송되는 패킷을 획득하는 단계; 및 상기 획득된 패킷을 신경망 모델에 입력함으로써 상기 패킷 내 상기 전자 장치의 사용자에 대한 개인 정보가 노출되었는지 여부를 식별하는 단계; 를 포함하는, 방법을 수행하도록 하는 프로그램이 저장된 컴퓨터로 읽을 수 있는 기록매체가 제공될 수 있다.In addition, according to another embodiment of the present invention for achieving the above-described technical problem, there is provided a method for determining whether to expose personal information by an electronic device, the method comprising: transmitting a query to a server connected to the electronic device; obtaining a packet transmitted from the server in response to the transmitted query as a query result for the query; and identifying whether personal information about a user of the electronic device in the packet is exposed by inputting the obtained packet into a neural network model; A computer-readable recording medium in which a program for performing the method is stored, including, may be provided.

도 1은 일 실시 예에 따른 전자 장치가 개인 정보 노출을 검사하는 과정을 개략적으로 설명하기 위한 도면이다.
도 2는 일 실시 예에 따른 전자 장치가 개인 정보 노출을 결정하는 방법의 흐름도이다.
도 3은 일 실시 예에 따른 전자 장치가 서버로부터 패킷을 획득하는 방법의 흐름도이다.
도 4는 일 실시 예에 따른 전자 장치가 신경망 모델을 이용하여 쿼리를 학습하는 과정을 설명하기 위한 도면이다.
도 5는 일 실시 예에 따른 전자 장치의 블록도이다.
1 is a diagram schematically illustrating a process in which an electronic device inspects personal information exposure according to an exemplary embodiment.
2 is a flowchart of a method for an electronic device to determine personal information exposure, according to an embodiment.
3 is a flowchart of a method for an electronic device to obtain a packet from a server according to an embodiment.
4 is a diagram for describing a process in which an electronic device learns a query using a neural network model, according to an embodiment.
5 is a block diagram of an electronic device according to an embodiment.

본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 개시에 대해 구체적으로 설명하기로 한다. Terms used in this specification will be briefly described, and the present disclosure will be described in detail.

본 개시에서 사용되는 용어는 본 개시에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다. The terms used in the present disclosure have been selected as currently widely used general terms as possible while considering the functions in the present disclosure, but these may vary depending on the intention or precedent of a person skilled in the art, the emergence of new technology, and the like. In addition, in a specific case, there is a term arbitrarily selected by the applicant, and in this case, the meaning will be described in detail in the description of the corresponding invention. Therefore, the terms used in the present disclosure should be defined based on the meaning of the term and the contents of the present disclosure, rather than the simple name of the term.

명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.In the entire specification, when a part "includes" a certain component, it means that other components may be further included, rather than excluding other components, unless otherwise stated. In addition, terms such as "...unit" and "module" described in the specification mean a unit that processes at least one function or operation, which may be implemented as hardware or software, or a combination of hardware and software. .

아래에서는 첨부한 도면을 참고하여 본 개시의 실시예에 대하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 개시는 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 개시를 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.Hereinafter, with reference to the accompanying drawings, the embodiments of the present disclosure will be described in detail so that those of ordinary skill in the art to which the present disclosure pertains can easily implement them. However, the present disclosure may be implemented in several different forms and is not limited to the embodiments described herein. And in order to clearly explain the present disclosure in the drawings, parts irrelevant to the description are omitted, and similar reference numerals are attached to similar parts throughout the specification.

도 1은 일 실시 예에 따른 전자 장치가 개인 정보 노출을 검사하는 과정을 개략적으로 설명하기 위한 도면이다.1 is a diagram schematically illustrating a process in which an electronic device inspects personal information exposure according to an exemplary embodiment.

일 실시 예에 의하면, 개인 정보 검출 시스템(100)은 전자 장치(1000) 및 서버(2000)를 포함할 수도 있다. 일 실시 예에 의하면, 개인 정보 검출 시스템(100)은 전자 장치(1000) 및 서버(2000)사이에 송수신되는 패킷을 분석함으로써, 전자 장치(1000)의 사용자의 개인 정보 노출 여부 또는 서버의 전체적인 보안 위험을 검출할 수 있다.According to an embodiment, the personal information detection system 100 may include the electronic device 1000 and the server 2000 . According to an embodiment, the personal information detection system 100 analyzes packets transmitted/received between the electronic device 1000 and the server 2000 to determine whether the user's personal information is exposed or the overall security of the server. danger can be detected.

일 실시 예에 의하면, 전자 장치(1000)는 서버(2000)로 CDM 쿼리(162)를 전송하고, 전송된 쿼리(162)에 응답하여 CDM 쿼리 결과(164)를 획득할 수 있다. 일 실시 예에 의하면, CDM(Common Data Model)은 공통 데이터 모델로써 서로 다른 구조의 데이터를 활용하기 쉽게 표준화한 데이터 구조를 의미할 수 있다. 일 실시 예에 의하면, 전자 장치(1000) 또는 서버(2000) 중 적어도 하나가 관리하는 쿼리 및 쿼리에 대한 결과와 관련된 데이터들은 공통 데이터 모델 구조로 관리될 수 있다.According to an embodiment, the electronic device 1000 may transmit the CDM query 162 to the server 2000 and obtain the CDM query result 164 in response to the transmitted query 162 . According to an embodiment, the Common Data Model (CDM) may refer to a data structure standardized to facilitate use of data having different structures as a common data model. According to an embodiment, a query managed by at least one of the electronic device 1000 or the server 2000 and data related to a query result may be managed in a common data model structure.

일 실시 예에 의하면, 전자 장치(1000)는 서버(2000)로부터 획득되는 패킷을 분석함으로써, 패킷 내의 개인 정보가 노출되었는지 여부를 결정할 수 있다. 일 실시 예에 의하면, 전자 장치(1000)는 패킷 분석의 대표적인 오픈 소스인 ALTO(WIRE SHARK)를 이용하여 패킷을 분석할 수 있다. 또한, 전자 장치(1000)는 WIRE SHARK 를 응용한 ALTO 시스템과 연동하여 패킷의 전반적인 분석 과정을 수행할 수도 있다. 일 실시 예에 의하면, ALTO 시스템은 패킷 분석뿐만 아니라, 서버(2000)의 전체적인 보안 위험을 검출하는데 사용될 수도 있다. 일 실시 예에 의하면, 전자 장치(1000)는 개인 정보 토출 검사 결과, 또는 노출 위험에 대한 정보등을 시각적인 컨텐츠로 생성하고, 생성된 컨텐츠를 출력할 수도 있다.According to an embodiment, the electronic device 1000 may determine whether personal information in the packet is exposed by analyzing the packet obtained from the server 2000 . According to an embodiment, the electronic device 1000 may analyze a packet using ALTO (WIRE SHARK), which is a representative open source of packet analysis. In addition, the electronic device 1000 may perform an overall analysis process of the packet by interworking with the ALTO system to which the WIRE SHARK is applied. According to an embodiment, the ALTO system may be used to detect the overall security risk of the server 2000 as well as packet analysis. According to an embodiment, the electronic device 1000 may generate a personal information discharge test result or information on exposure risk as visual content, and may output the generated content.

일 실시 예에 의하면, 전자 장치(1000)는 패킷 분석 결과에 대한 정보를, 신경망 모델에 입력함으로써 개인 정보 노출 여부를 식별할 수 있다. 일 실시 예에 의하면 전자 장치는 RNN 구조의 개체명 인식(NER) 모델에 패킷 분석 결과를 입력함으로써, 패킷 내 개인 정보 노출 여부를 결정할 수도 있다. 일 실시 예에 의하면 RNN으로 구성된 개체 인식 모델은 품사 판별기 (CRF)를 통하여, 구분되는 품사에 기초하여 학습될 수도 있다. 일 실시 예에 의하면 품사 판별기(CRF) 모델은 국립 국어원에서 제공되는 세종 말뭉치에 기초하여 학습될 수 있다.According to an embodiment, the electronic device 1000 may identify whether personal information is exposed by inputting information on a packet analysis result into a neural network model. According to an embodiment, the electronic device may determine whether to expose personal information in the packet by inputting the packet analysis result to the entity name recognition (NER) model of the RNN structure. According to an embodiment, the object recognition model composed of the RNN may be learned based on the divided parts-of-speech through a part-of-speech discriminator (CRF). According to an embodiment, the part-of-speech discriminator (CRF) model may be learned based on the Sejong corpus provided by the National Institute of the Korean Language.

일 실시 예에 의하면, 전자 장치(1000)는 프로세서(110), 메모리(120) 및 네트워크 인터페이스(130)를 포함할 수 있다. 프로세서(110)는 메모리(120)내 하나 이상의 인스트럭션을 수행함으로써, 패킷 내 개인 정보가 노출되었는지 여부를 결정하는 방법을 수행할 수 있다. 일 실시 예에 의하면, 메모리(120)는 인공 지능 학습 알고리즘에 따라 학습될 수 있는 복수의 인공 지능 모델을 포함할 수 있다. 네트워크 인터페이스(130)는 서버(2000)와의 사이에 또는 개인 정보 검출 시스템 외의 기타 시스템과의 사이에 데이터, 패킷, 쿼리, 쿼리 결과를 송수신할 수 있다. According to an embodiment, the electronic device 1000 may include a processor 110 , a memory 120 , and a network interface 130 . The processor 110 may perform a method of determining whether personal information in a packet is exposed by executing one or more instructions in the memory 120 . According to an embodiment, the memory 120 may include a plurality of artificial intelligence models that can be learned according to an artificial intelligence learning algorithm. The network interface 130 may transmit and receive data, packets, queries, and query results between the server 2000 and other systems other than the personal information detection system.

일 실시 예에 의하면, 메모리(120)는 RNN(Recurrent Neural Network) 모델(122), 조건부 무작위장 모델(Conditional Random Field)(124), 개체명 인식 모델(Name Entity Recognition)(126) 모델을 포함할 수 있다. 일 실시 예에 의하면, 조건부 무작위장 모델(CRF)(126)은 신경망 모델로 구성됨으로써, 통계적 모델링 방법에 따라 스트링(STRING) 형식의 문장으로부터 품사를 식별할 수 있다. 일 실시 예에 의하면, 조건부 무작위장 모델(126)은 (단어, 품사), (단어, 품사) 형식으로 문장을 구성하는 단어와 품사를 식별할 수 있다. 일 실시 예에 의하면 조건부 무작위장 모델(126)은 시퀀셜 라벨링을 위해 POTENTIAL FUNCTION을 이용하년 SOFT MAX REGRESSION일 수 있다.According to an embodiment, the memory 120 includes a Recurrent Neural Network (RNN) model 122 , a Conditional Random Field model 124 , and a Name Entity Recognition model 126 . can do. According to an embodiment, the conditional random field model (CRF) 126 is configured as a neural network model, so that the part-of-speech can be identified from a string-type sentence according to a statistical modeling method. According to an embodiment, the conditional random chapter model 126 may identify words and parts of speech constituting a sentence in the form of (word, part-of-speech) and (word, part-of-speech). According to an embodiment, the conditional random field model 126 may be a SOFT MAX REGRESSION using POTENTIAL FUNCTION for sequential labeling.

일 실시 예에 의하면, 개체명 인식 모델(126)은 RNN으로 구성되는 모델로써, 정규화된 개인 정보뿐만 아니라, 개인 정보로 판별될 수 있는 단어들을 유추하여 구분할 수 있다. 일 실시 예에 의하면 개체 인식 모델은 기계학습의 한 분류인 NLP, 자연어처리 기술에 사용될 수 있다. 개체명 인식 모델은 미리 정의된 사람, 회사, 장소, 시간 단위 등에 해당하는 단어(개체명)를 문서에서 추출하여 인식하는데 사용될 수 있다.According to an embodiment, the entity name recognition model 126 is a model composed of an RNN, and can infer and distinguish not only normalized personal information but also words that can be identified as personal information. According to an embodiment, the entity recognition model may be used for NLP and natural language processing technology, which are a classification of machine learning. The entity name recognition model may be used to extract and recognize a word (entity name) corresponding to a predefined person, company, place, time unit, etc. from a document.

또 다른 실시 예에 의하면, 전자 장치(1000)가 이용하는 인공 신경망(Artificial Neural Network)은 생물학적 신경망에 착안된 컴퓨팅 시스템을 지칭할 수 있다. 인공 신경망은 미리 정의된 조건에 따라 작업을 수행하는 고전적인 알고리즘과 달리, 다수의 샘플들을 고려함으로써 작업을 수행하는 것을 학습할 수 있다. 인공 신경망은 인공 뉴런(neuron)들이 연결된 구조를 가질 수 있고, 뉴런들 간의 연결은 시냅스(synapse)로 지칭될 수 있다. 뉴런은 수신된 신호를 처리할 수 있고, 처리된 신호를 시냅스를 통해서 다른 뉴런에 전송할 수 있다. 뉴런의 출력은 액티베이션(activation)으로 지칭될 수 있고, 뉴런 및/또는 시냅스는 변동될 수 있는 가중치(weight)를 가질 수 있고, 가중치에 따라 뉴런에 의해 처리된 신호의 영향력이 증가하거나 감소할 수 있다.According to another embodiment, an artificial neural network used by the electronic device 1000 may refer to a computing system focusing on a biological neural network. Unlike classical algorithms that perform tasks according to predefined conditions, artificial neural networks can learn to perform tasks by considering a large number of samples. An artificial neural network may have a structure in which artificial neurons are connected, and a connection between neurons may be referred to as a synapse. A neuron may process a received signal and transmit the processed signal to another neuron through a synapse. The output of a neuron may be referred to as activation, and a neuron and/or synapse may have a weight that can be varied, and the influence of a signal processed by the neuron may increase or decrease depending on the weight. .

예를 들어, 인공 신경망은 복수의 신경망 레이어들로 구성될 수 있다. 복수의 신경망 레이어들 각각은 복수의 가중치들(weight values, weights)을 갖고 있으며, 이전(previous) 레이어의 연산 결과와 복수의 가중치들 간의 연산을 통해 신경망 연산을 수행한다. 복수의 신경망 레이어들이 갖고 있는 복수의 가중치들은 인공 신경망의 학습 결과에 의해 최적화될 수 있다. For example, the artificial neural network may be composed of a plurality of neural network layers. Each of the plurality of neural network layers has a plurality of weight values (weights), and a neural network operation is performed through an operation between an operation result of a previous layer and a plurality of weights. The plurality of weights of the plurality of neural network layers may be optimized by the learning result of the artificial neural network.

예를 들어, 학습 과정 동안 인공지능 모델에서 획득한 손실(loss) 값 또는 코스트(cost) 값이 감소 또는 최소화되도록 복수의 가중치들이 수정 및 갱신될 수 있다. 본 개시에 따른 인공 신경망은 심층 신경망(DNN:Deep Neural Network)을 포함할 수 있으며, 예를 들어, CNN (Convolutional Neural Network), DNN (Deep Neural Network), RNN (Recurrent Neural Network), RBM (Restricted Boltzmann Machine), DBN (Deep Belief Network), BRDNN(Bidirectional Recurrent Deep Neural Network) 또는 심층 Q-네트워크 (Deep Q-Networks) 등이 있으나, 전술한 예에 한정되지 않는다.For example, a plurality of weights may be modified and updated so that a loss value or a cost value obtained from the artificial intelligence model during the learning process is reduced or minimized. The artificial neural network according to the present disclosure may include a deep neural network (DNN), for example, a Convolutional Neural Network (CNN), Deep Neural Network (DNN), Recurrent Neural Network (RNN), Restricted RBM (RBM). Boltzmann Machine), DBN (Deep Belief Network), BRDNN (Bidirectional Recurrent Deep Neural Network), or deep Q-Networks, etc., but is not limited to the above-described example.

일 실시 예에 의하면, 전자 장치(1000)는 서버(2000)와 연동함으로써 쿼리 및 쿼리에 대한 결과를 송수신하며, 쿼리 결과로써 패킷 내 개인 정보 노출 여부를 검사할 수도 있다. 일 실시 예에 의하면, 서버(2000)는 프로세서(140), 데이터 베이스(150) 및 네트워크 인터페이스(160)를 포함할 수 있다. 프로세서(140)는 데이터 베이스(150)내 하나 이상의 인스트럭션을 실행함으로써, 서버(2000)로 하여금, 전자 장치와 연동하여 패킷 내 개인 정보를 분석하도록 할 수 있다. 일 실시 예에 의하면, 네트워크 인터페이스(160)는 전자 장치(1000)와의 사이에 또는 기타 개인 정보 노출 여부를 검사하기 위한 시스템 과의 사이에 데이터, 패킷, 쿼리, 쿼리 결과를 송수신할 수 있다.According to an embodiment, the electronic device 1000 may transmit/receive a query and a result of the query by interworking with the server 2000, and may check whether personal information is exposed in the packet as a result of the query. According to an embodiment, the server 2000 may include a processor 140 , a database 150 , and a network interface 160 . By executing one or more instructions in the database 150 , the processor 140 may cause the server 2000 to analyze personal information in the packet by interworking with the electronic device. According to an embodiment, the network interface 160 may transmit/receive data, packets, queries, and query results to/from the electronic device 1000 or other systems for checking whether personal information is exposed.

일 실시 예에 의하면, 프로세서(140)는 전자 장치(1000)로부터 CDM 쿼리(162)를 획득하고, 획득된 쿼리에 응답하여 쿼리 결과(164)를 전자 장치(1000)로 전송할 수도 있다. 일 실시 예에 의하면 서버(2000)가 전송한 CDM 쿼리 결과로써 패킷은 ALTO 시스템에 의해 분석됨으로써 서버(2000)전체의 보안 위험을 검사하는데 사용될 수도 있다.According to an embodiment, the processor 140 may obtain the CDM query 162 from the electronic device 1000 and transmit the query result 164 to the electronic device 1000 in response to the obtained query. According to an embodiment, a packet as a CDM query result transmitted by the server 2000 may be analyzed by the ALTO system and used to check the security risk of the server 2000 as a whole.

도 2는 일 실시 예에 따른 전자 장치가 개인 정보 노출을 결정하는 방법의 흐름도이다.2 is a flowchart of a method for an electronic device to determine personal information exposure, according to an embodiment.

S210에서, 전자 장치(1000)는 전자 장치(1000)와 연결된 서버(2000)로 쿼리를 전송할 수 있다. 일 실시 예에 의하면, 전자 장치(1000)는 CDM(Common Data Model) 데이터를 쿼리 결과로써 요청하기 위한 CDM 쿼리를 서버로 전송할 수도 있다. S220에서, 전자 장치(1000)는 쿼리에 대한 쿼리 결과로써, 전송된 쿼리에 응답하여 서버로부터 전송되는 패킷을 획득할 수 있다. 일 실시 예에 의하면, 전자 장치(1000)는 HTTPS를 통해 서버로부터 쿼리 결과를 획득할 수도 있다.In S210 , the electronic device 1000 may transmit a query to the server 2000 connected to the electronic device 1000 . According to an embodiment, the electronic device 1000 may transmit a CDM query for requesting Common Data Model (CDM) data as a query result to the server. In S220 , the electronic device 1000 may obtain a packet transmitted from the server in response to the transmitted query as a result of the query for the query. According to an embodiment, the electronic device 1000 may obtain a query result from the server through HTTPS.

S230에서, 전자 장치(1000)는 획득된 패킷을 신경망 모델에 입력함으로써 패킷 내 전자 장치의 사용자에 대한 개인 정보가 노출되었는지 여부를 식별할 수 있다. 또 다른 실시 예에 의하면, 전자 장치(1000)는 ALTO 시스템을 이용하여 분석된 패킷 분석 결과를 신경망 모델에 입력함으로써, 패킷 내 개인 정보가 노출되었는지 여부를 결정할 수도 있다.In S230 , the electronic device 1000 may identify whether personal information about the user of the electronic device in the packet is exposed by inputting the obtained packet into the neural network model. According to another embodiment, the electronic device 1000 may determine whether personal information in the packet is exposed by inputting a packet analysis result analyzed using the ALTO system to the neural network model.

또 다른 실시 예에 의하면, 전자 장치(1000)는 개인 정보가 노출되었는지 여부에 대한 정보를 시각 컨텐츠로 생성하고, 생성된 시각 컨텐츠를 전자 장치의 디스플레이 화면상에 표시할 수도 있다. 일 실시 예에 의하면, 전자 장치(1000)는 개인 정보 노출 결과를 시각적 또는 오디오 형태의 컨텐츠로 출력할 수도 있다.According to another embodiment, the electronic device 1000 may generate information on whether personal information has been exposed as visual content and display the generated visual content on the display screen of the electronic device. According to an embodiment, the electronic device 1000 may output the personal information exposure result as content in a visual or audio format.

도 3은 일 실시 예에 따른 전자 장치가 서버로부터 패킷을 획득하는 방법의 흐름도이다.3 is a flowchart of a method for an electronic device to obtain a packet from a server according to an embodiment.

S310에서, 전자 장치(1000)는 HTTPS를 통해 서버(2000)에 접속할 수 있다. S320에서, 전자 장치(1000)는 접속된 서버(2000)를 통하여, 패킷을 획득할 수 있다. 보다 상세하게는, 전자 장치(1000)는 네트워크 인터페이스를 통하여 서버와 연결되고, 연결된 서버로부터 패킷을 획득할 수도 있다. S330에서, 전자 장치(1000)는 WIRE SHARK를 응용한 ALTO 시스템을 이용하여 획득된 패킷 내 데이터를 PCAP 파일로 저장할 수 있다. 전자 장치가 이용하는 와이어 샤크는 자유 및 오픈소스 패킷 분석 프로그램으로써 네트워크 문제, 분석, 소프트웨어 및 통신 프로토콜 개발에 사용될 수 있다. 전자 장치(1000)는 WIRE SHARK를 이용하여 서버로부터 획득된 패킷을 분석하고, 패킷 분석 결과(예컨대 PCAP 파일)를 소정의 신경망 모델에 입력할 수도 있다.In S310 , the electronic device 1000 may access the server 2000 through HTTPS. In S320 , the electronic device 1000 may obtain a packet through the connected server 2000 . More specifically, the electronic device 1000 may be connected to a server through a network interface, and may obtain a packet from the connected server. In S330, the electronic device 1000 may store data in a packet obtained using the ALTO system to which the WIRE SHARK is applied as a PCAP file. Wireshark, used by electronic devices, is a free and open source packet analysis program that can be used for network problems, analysis, and software and communication protocol development. The electronic device 1000 may analyze a packet obtained from the server using the WIRE SHARK, and may input a packet analysis result (eg, a PCAP file) into a predetermined neural network model.

도 4는 일 실시 예에 따른 전자 장치가 신경망 모델을 이용하여 쿼리를 학습하는 과정을 설명하기 위한 도면이다.4 is a diagram for describing a process in which an electronic device learns a query using a neural network model, according to an embodiment.

일 실시 예에 의하면, 전자 장치(1000)는 서버로부터 획득된 패킷을 소정의 신경망 구조의 모델에 입력함으로써, 패킷 내 개인 정보 노출 여부를 결정할 수도 있다. 또 다른 실시 예에 의하면, 전자 장치(1000)는 WIRE SHARK를 이용하여 서버로부터 획득된 패킷을 분석하고, 분석 결과에 대한 정보를 소정의 신경망 모델에 입력할 수도 있다. 일 실시 예에 의하면, 신경망 모델은 문법의 기초가되는 품사를 구분하기 위한 조건부 무작위장 모델 및 개체명 인식 모델을 포함할 수 있다. According to an embodiment, the electronic device 1000 may determine whether to expose personal information in the packet by inputting a packet obtained from the server into a model of a predetermined neural network structure. According to another embodiment, the electronic device 1000 may analyze a packet obtained from the server using a WIRE SHARK, and may input information on the analysis result into a predetermined neural network model. According to an embodiment, the neural network model may include a conditional random field model and an entity name recognition model for distinguishing parts of speech that are the basis of grammar.

일반적으로 개인 정보 노출을 분석할 때 문서 내 개인 정보의 유무를 확인하여야 하는데, 기존 개인 정보를 판별하는 방법 중 하나로 정규식(Regular expression)이 많이 활용되었으나, 개인 정보의 다형성을 판단할 수 없다는 한계가 있었다. 그러나, 본 개시에 따른 전자 장치(1000)는 신경망 모델(430)을 이용하여 개체명 인식 모델(420)을 구성하고, 개체명 인식 모델을 이용하여 정규화된 개인 정보뿐만 아니라, 개인 정보로 판별될 수 있는 단어를 유추하여 구분할 수 있다. 따라서, 본 개시에 따른 전자 장치(1000)는 개인 정보로 판별될 수 있는 단어를 유추하여 구분함으로써 정규식의 단점을 보완할 수 있다.In general, when analyzing personal information exposure, it is necessary to check the presence or absence of personal information in the document. Regular expression has been widely used as one of the methods for determining existing personal information, but there is a limitation that polymorphism of personal information cannot be determined. there was. However, the electronic device 1000 according to the present disclosure configures the entity name recognition model 420 using the neural network model 430, and uses the entity name recognition model to determine not only normalized personal information but also personal information. Can be distinguished by inferring possible words. Accordingly, the electronic device 1000 according to the present disclosure can compensate for the disadvantages of the regular expression by inferring and classifying words that can be identified as personal information.

또한, 전자 장치(1000)는 정규식의 단점을 보완하기 위해, 신경망 모델(430)로 구성된 조건부 무작위장 모델(410, CRF)을 통해 문법의 기초가 되는 품사를 구분할 수 있다. 한글에 관한 품사 정보를 이용해야만 조건부 무작위장 모델을 학습할 수 있는데, 전자 장치(1000)는 국립 국어원에서 제공하는 세종 말뭉치를 이용하여 조건부 무작위장 모델을 학습시킬 수 있다. 전자 장치(1000)는 학습된 조건부 무작위장 모델을 이용하여 한글에 관한 품사 정보를 식별하고, 식별된 품사 정보에 기초하여 개체명 인식 모델(420)을 학습시킬 수 있다. 전자 장치(1000)는 학습된 개체명 인식 모델을 이용하여 패킷 내 개인 정보로 판별될 수 있는 단어를 효과적으로 구분할 수 있다.Also, in order to compensate for the shortcomings of the regular expression, the electronic device 1000 may distinguish the part-of-speech, which is the basis of the grammar, through the conditional random field model 410 (CRF) including the neural network model 430 . The conditional random field model can be learned only by using the part-of-speech information about Hangul, and the electronic device 1000 can learn the conditional random field model using the Sejong corpus provided by the National Institute of the Korean Language. The electronic device 1000 may identify part-of-speech information about Hangul using the learned conditional random chapter model, and train the entity name recognition model 420 based on the identified part-of-speech information. The electronic device 1000 may effectively classify words that can be identified as personal information in a packet by using the learned entity name recognition model.

일 실시 예에 의하면, 조건부 무작위장 모델(410) 또는 개체명 인식 모델(420)을 구성하는 신경망 모델(430)은 심층 신경망(DNN:Deep Neural Network)을 포함할 수 있으며, 예를 들어, CNN (Convolutional Neural Network), DNN (Deep Neural Network), 순환신경망 RNN (Recurrent Neural Network), RBM (Restricted Boltzmann Machine), DBN (Deep Belief Network), BRDNN(Bidirectional Recurrent Deep Neural Network) 또는 심층 Q-네트워크 (Deep Q-Networks) 등을 포함할 수 있으나, 전술한 예에 한정되지 않는다. 일 실시 예에 의하면 신경망 모델(430)은 복수의 레이어들 및 상기 레이어들의 연결 강도에 관한 가중치(432)를 포함할 수 있다. 신경망 모델(430)은 가중치를 수정 및 갱신함으로써 학습될 수 있다.According to an embodiment, the neural network model 430 constituting the conditional random field model 410 or the entity name recognition model 420 may include a deep neural network (DNN), for example, CNN. (Convolutional Neural Network), DNN (Deep Neural Network), Recurrent Neural Network (RNN), RBM (Restricted Boltzmann Machine), DBN (Deep Belief Network), BRDNN (Bidirectional Recurrent Deep Neural Network) or Deep Q-Network ( Deep Q-Networks) and the like, but is not limited to the above-described example. According to an embodiment, the neural network model 430 may include a plurality of layers and a weight 432 related to the connection strength of the layers. The neural network model 430 can be trained by modifying and updating weights.

도 5는 일 실시 예에 따른 전자 장치의 블록도이다.5 is a block diagram of an electronic device according to an embodiment.

일 실시 예에 의하면, 전자 장치(1000)는 프로세서(1300), 네트워크 인터페이스(1500) 및 메모리(1700)를 포함할 수 있다. 그러나 상술한 예에 한정되는 것은 아니고, 전자 장치(1000)는 출력부(디스플레이, 스피커)를 더 포함할 수도 있다.According to an embodiment, the electronic device 1000 may include a processor 1300 , a network interface 1500 , and a memory 1700 . However, the present invention is not limited thereto, and the electronic device 1000 may further include an output unit (display, speaker).

일 실시 예에 의하면, 전자 장치(1000)는 소정의 신경망 모델을 생성하고, 생성된 신경망 모델을 학습시킬 수 있다. 전자 장치(1000)는 학습된 신경망 모델을 이용하여 서버로부터 패킷을 획득하고, 획득된 패킷 내 개인 정보들이 노출되었는지 여부를 결정할 수 있다.According to an embodiment, the electronic device 1000 may generate a predetermined neural network model and train the generated neural network model. The electronic device 1000 may obtain a packet from the server using the learned neural network model, and determine whether personal information in the obtained packet is exposed.

일 실시 예에 의하면, 전자 장치(1000)는 인공 신경망(Artificial Neural Network)을 학습 시키기 위한 학습 데이터를 생성할 수 있다. 일 실시 예에 의하면, 전자 장치(1000)는 생성된 학습 데이터를 이용하여 인공 신경망 내 레이어들 및 레이어들의 연결 강도에 관한 가중치(weight)를 수정 및 갱신함으로써 인공 신경망을 학습시킬 수 있다. 일 실시 예에 의하면, 전자 장치(1000)는 인공 신경망의 가중치를 처리하기 위한, AI 프로그램이 탑재되고 음성 인식 기능을 포함하는 스마트폰, 태블릿 PC, PC, 스마트 TV, 휴대폰, 미디어 플레이어, 서버, 마이크로 서버, 기타 모바일 또는 비모바일 컴퓨팅 장치일 수 있으나, 이에 제한되지 않는다.According to an embodiment, the electronic device 1000 may generate learning data for learning an artificial neural network. According to an embodiment, the electronic device 1000 may train the artificial neural network by using the generated learning data to modify and update the layers in the artificial neural network and a weight related to the connection strength of the layers. According to an embodiment, the electronic device 1000 includes a smart phone, a tablet PC, a PC, a smart TV, a mobile phone, a media player, a server, an AI program loaded with an AI program for processing the weights of the artificial neural network and including a voice recognition function; It may be, but is not limited to, a micro server or other mobile or non-mobile computing device.

일 실시 예에 의하면, 프로세서(1300)는 메모리(1700)내 하나 이상의 인스트럭션을 수행함으로써 전자 장치(1000)의 전반적인 동작을 제어한다. 일 실시 예에 의하면, 프로세서(1300)는 메모리(1700)에 저장된 프로그램들을 실행함으로써 도 1 내지 도 4에 기재된 전자 장치(10000)의 기능을 수행할 수 있다. 프로세서(1300)는 하나 또는 복수의 프로세서로 구성될 수 있고, 하나 또는 복수의 프로세서는 CPU, AP, DSP(Digital Signal Processor) 등과 같은 범용 프로세서, GPU와 같은 그래픽 전용 프로세서일 수 있다. 일 실시 예에 의하면, 프로세서(1300)가 범용 프로세서 및 그래픽 전용 프로세서를 포함하는 경우, 각각의 범용 프로세서 및 그래픽 전용 프로세서는 별도의 칩으로 구현될 수도 있다. According to an embodiment, the processor 1300 controls the overall operation of the electronic device 1000 by executing one or more instructions in the memory 1700 . According to an embodiment, the processor 1300 may perform the functions of the electronic device 10000 described in FIGS. 1 to 4 by executing programs stored in the memory 1700 . The processor 1300 may include one or a plurality of processors, and the one or more processors may be a general-purpose processor such as a CPU, an AP, a digital signal processor (DSP), or the like, or a graphics-only processor such as a GPU. According to an embodiment, when the processor 1300 includes a general-purpose processor and a graphics-only processor, each of the general-purpose processor and the graphics-only processor may be implemented as a separate chip.

일 실시 예에 의하면, 프로세서(1300)가 복수의 프로세서 또는 그래픽 전용 프로세서로 구현될 때, 복수의 프로세서 또는 그래픽 전용 프로세서 중 적어도 일부는 전자 장치(1000) 및 전자 장치(1000)와 연결된 다른 전자 장치 또는 서버에 탑재될 수도 있다. 예를 들어, 프로세서(1300)는, 메모리(1700)에 저장된 프로그램들을 실행함으로써, 서버와 연동하여 패킷을 송수신하고, 패킷 내 개인 정보가 노출되었는지 여부를 결정할 수 있다.According to an embodiment, when the processor 1300 is implemented as a plurality of processors or graphics-only processors, at least some of the plurality of processors or graphics-only processors may include the electronic device 1000 and other electronic devices connected to the electronic device 1000 . Alternatively, it may be mounted on a server. For example, by executing programs stored in the memory 1700 , the processor 1300 may transmit/receive a packet in association with a server and determine whether personal information in the packet is exposed.

일 실시 예에 의하면, 프로세서(1300)는 상기 전자 장치와 연결된 서버로 쿼리를 전송하고, 상기 쿼리에 대한 쿼리 결과로써, 상기 전송된 쿼리에 응답하여 상기 서버로부터 전송되는 패킷을 획득하고, 상기 획득된 패킷을 신경망 모델에 입력함으로써 상기 패킷 내 상기 전자 장치의 사용자에 대한 개인 정보가 노출되었는지 여부를 식별할 수 있다.According to an embodiment, the processor 1300 transmits a query to a server connected to the electronic device, obtains a packet transmitted from the server in response to the transmitted query as a query result of the query, and obtains the By inputting the received packet into the neural network model, it is possible to identify whether personal information about the user of the electronic device in the packet is exposed.

일 실시 예에 의하면, 프로세서(1300)는 상기 개인 정보가 노출되었는지 여부에 대한 시각 컨텐츠를 생성하고 상기 생성된 시각 컨텐츠를 상기 전자 장치의 화면상에 표시할 수 있다.According to an embodiment, the processor 1300 may generate visual content for whether the personal information is exposed or not, and display the generated visual content on the screen of the electronic device.

일 실시 예에 의하면, 프로세서(1300)는 CDM(Common Data Model) 데이터를 쿼리 결과로써 요청하기 위한 CDM 쿼리를 전송할 수 있다.According to an embodiment, the processor 1300 may transmit a CDM query for requesting Common Data Model (CDM) data as a query result.

일 실시 예에 의하면, 프로세서(1300)는 HTTPS를 통해 상기 서버에 접속하고,According to an embodiment, the processor 1300 accesses the server through HTTPS,

상기 접속된 서버로부터 패킷을 획득하고, WIRE SHARK를 응용한 ALTO 시스템을 이용해, 상기 획득된 패킷 내 데이터를 PCAP 파일로 저장할 수 있다.A packet may be obtained from the connected server, and data in the obtained packet may be stored as a PCAP file by using the ALTO system to which WIRE SHARK is applied.

일 실시 예에 의하면, 프로세서(1300)는 상기 PCAP 파일을 상기 신경망 모델에 입력하고, 상기 신경망 모델의 출력 값에 기초하여 상기 전자 장치의 사용자에 대한 상기 개인 정보가 노출되었는지 여부를 식별할 수 있다.According to an embodiment, the processor 1300 may input the PCAP file to the neural network model and identify whether the personal information about the user of the electronic device has been exposed based on an output value of the neural network model. .

네트워크 인터페이스(1500)는 전자 장치(1000)가 다른 장치(미도시) 및 서버(2000)와 통신을 하게 하는 하나 이상의 구성요소를 포함할 수 있다. 다른 장치(미도시)는 전자 장치(1000)와 같은 컴퓨팅 장치이거나, 센싱 장치일 수 있으나, 이에 제한되지 않는다. 예를 들어, 네트워크 인터페이스(1500)는 근거리 통신부, 이동 통신부를 포함할 수 있다. The network interface 1500 may include one or more components that allow the electronic device 1000 to communicate with another device (not shown) and the server 2000 . The other device (not shown) may be a computing device such as the electronic device 1000 or a sensing device, but is not limited thereto. For example, the network interface 1500 may include a short-range communication unit and a mobile communication unit.

근거리 통신부(short-range wireless communication unit) 는, 블루투스 통신부, BLE(Bluetooth Low Energy) 통신부, 근거리 무선 통신부(Near Field Communication unit), WLAN(와이파이) 통신부, 지그비(Zigbee) 통신부, 적외선(IrDA, infrared Data Association) 통신부, WFD(Wi-Fi Direct) 통신부, UWB(ultra wideband) 통신부, 등을 포함할 수 있으나, 이에 한정되는 것은 아니다. 이동 통신부는, 이동 통신망 상에서 기지국, 외부의 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다. 일 실시 예에 의하면, 네트워크 인터페이스(미도시)는 프로세서의 제어에 의하여, 서버로 쿼리 요청, CDM 쿼리 요청, 인공 신경망 내 가중치 값들, 상기 인공 신경망을 학습시키기 위한 학습 데이터등에 대한 요청을 전송하거나, 요청에 응답하여 쿼리 결과, 인공 신경망 학습 데이터, 인공 신경망의 학습 정보등을 수신할 수도 있다.Short-range wireless communication unit, Bluetooth communication unit, BLE (Bluetooth Low Energy) communication unit, near field communication unit (Near Field Communication unit), WLAN (Wi-Fi) communication unit, Zigbee communication unit, infrared (IrDA, infrared) It may include a data association) communication unit, a Wi-Fi Direct (WFD) communication unit, an ultra wideband (UWB) communication unit, and the like, but is not limited thereto. The mobile communication unit transmits/receives a radio signal to and from at least one of a base station, an external terminal, and a server on a mobile communication network. According to an embodiment, the network interface (not shown) transmits a query request, a CDM query request, a weight value in the artificial neural network, training data for learning the artificial neural network, etc. to the server under the control of the processor, In response to the request, the query result, artificial neural network learning data, artificial neural network learning information, and the like may be received.

메모리(1700)는, 프로세서(1300)의 처리 및 제어를 위한 프로그램을 저장할 수 있고, 전자 장치(1000)로 입력되거나 전자 장치(1000)로부터 출력되는 데이터를 저장할 수도 있다. 또한, 메모리(1700)는 인공 신경망을 구성하는 레이어들, 레이어들에 포함된 노드들 및 레이어들의 연결 강도에 관한 가중치들에 대한 정보를 저장할 수 있다. 또한, 메모리(1700)는 증강 데이터들을 더 저장할 수도 있다. 또한, 메모리(1700)는 인공 신경망 내 가중치들이 수정 및 갱신될 경우, 수정 및 갱신된 가중치에 관한 정보를 더 저장할 수 있다. 또한, 메모리(1700)는 개체명 인식 모델, 조건부 무작위장 모델, 신경망 모델에 대한 정보를 더 저장할 수도 있다.The memory 1700 may store a program for processing and controlling the processor 1300 , and may also store data input to or output from the electronic device 1000 . Also, the memory 1700 may store information about the layers constituting the artificial neural network, nodes included in the layers, and weights related to the connection strength of the layers. Also, the memory 1700 may further store augmentation data. Also, when the weights in the artificial neural network are modified and updated, the memory 1700 may further store information about the modified and updated weights. Also, the memory 1700 may further store information on the entity name recognition model, the conditional random field model, and the neural network model.

메모리(1700)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(RAM, Random Access Memory) SRAM(Static Random Access Memory), 롬(ROM, Read-Only Memory), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. The memory 1700 may include a flash memory type, a hard disk type, a multimedia card micro type, a card type memory (eg, SD or XD memory), and a RAM. (RAM, Random Access Memory) SRAM (Static Random Access Memory), ROM (Read-Only Memory), EEPROM (Electrically Erasable Programmable Read-Only Memory), PROM (Programmable Read-Only Memory), magnetic memory, magnetic disk , may include at least one type of storage medium among optical disks.

일 실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 개시를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. The method according to an embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, etc. alone or in combination. The program instructions recorded on the medium may be specially designed and configured for the present disclosure, or may be known and available to those skilled in the art of computer software.

또한, 상기 일 실시 예에 다른 방법을 수행하도록 하는 프로그램이 저장된 기록매체를 포함하는 컴퓨터 프로그램 장치가 제공될 수 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. In addition, according to the embodiment, a computer program apparatus including a recording medium storing a program for performing another method may be provided. Examples of the computer-readable recording medium include magnetic media such as hard disks, floppy disks and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic such as floppy disks. - includes magneto-optical media, and hardware devices specially configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine language codes such as those generated by a compiler, but also high-level language codes that can be executed by a computer using an interpreter or the like.

이상에서 본 개시의 실시예에 대하여 상세하게 설명하였지만 본 개시의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 개시의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 개시의 권리범위에 속한다.Although the embodiments of the present disclosure have been described in detail above, the scope of the present disclosure is not limited thereto, and various modifications and improved forms of the present disclosure are also provided by those skilled in the art using the basic concept of the present disclosure as defined in the following claims. belong to the scope of the right.

Claims (13)

전자 장치가 개인정보 노출 여부를 결정하는 방법에 있어서,
상기 전자 장치와 연결된 서버로 CDM(Common Data Model) 데이터를 쿼리 결과로써 요청하기 위한 CDM 쿼리를 전송하는 단계;
상기 쿼리에 대한 쿼리 결과로써, 상기 전송된 쿼리에 응답하여 HTTPS를 통해 상기 서버에 접속하고, 상기 접속된 서버로부터 전송되는 패킷을 획득하는 단계; 및
상기 획득된 패킷을 신경망 모델에 입력함으로써 상기 패킷 내 상기 전자 장치의 사용자에 대한 개인 정보가 노출되었는지 여부를 식별하는 단계; 를 포함하고,
상기 패킷을 획득하는 단계는,
WIRE SHARK를 응용한 ALTO 시스템을 이용해, 상기 획득된 패킷 내 데이터를 PCAP 파일로 저장하는 단계를 포함하며,
상기 신경망 모델은,
순환 신경망 모델(Recurrent Neural Network) 구조이고, 문법의 기초가 되는 품사를 구분하기 위한 조건부 무작위장(Conditional Random Field) 모델 및 개체명 인식(Named Entitiy Recognition) 모델을 포함하는 것을 특징으로 하는, 방법.
In a method for an electronic device to determine whether to expose personal information,
transmitting a CDM query for requesting Common Data Model (CDM) data as a query result to a server connected to the electronic device;
accessing the server through HTTPS in response to the transmitted query as a result of the query for the query, and obtaining a packet transmitted from the connected server; and
identifying whether personal information about a user of the electronic device in the packet is exposed by inputting the obtained packet into a neural network model; including,
The step of obtaining the packet includes:
Using the ALTO system to which WIRE SHARK is applied, it includes the step of storing the obtained data in the packet as a PCAP file,
The neural network model is
It is a recurrent neural network model (Recurrent Neural Network) structure, and comprises a Conditional Random Field model and a Named Entity Recognition model for distinguishing parts of speech that are the basis of grammar.
제1항에 있어서, 상기 방법은
상기 개인 정보가 노출되었는지 여부에 대한 시각 컨텐츠를 생성하는 단계; 및
상기 생성된 시각 컨텐츠를 상기 전자 장치의 화면상에 표시하는 단계; 를 포함하는, 방법.
The method of claim 1, wherein the method
generating visual content for whether the personal information has been exposed; and
displaying the generated visual content on a screen of the electronic device; A method comprising
삭제delete 삭제delete 삭제delete 제1항에 있어서, 상기 개인 정보가 노출되었는지 여부를 식별하는 단계는
상기 PCAP 파일을 상기 신경망 모델에 입력하는 단계; 및
상기 신경망 모델의 출력 값에 기초하여 상기 전자 장치의 사용자에 대한 상기 개인 정보가 노출되었는지 여부를 식별하는 단계; 를 포함하는, 방법.
The method of claim 1, wherein the step of identifying whether the personal information has been exposed comprises:
inputting the PCAP file into the neural network model; and
identifying whether the personal information about the user of the electronic device has been exposed based on an output value of the neural network model; A method comprising
개인정보 노출 여부를 결정하는 전자 장치에 있어서,
네트워크 인터페이스;
디스플레이;
하나 이상의 인스트럭션을 저장하는 메모리; 및
상기 하나 이상의 인스트럭션을 실행하는 적어도 하나의 프로세서; 를 포함하고,
상기 적어도 하나의 프로세서는 상기 하나 이상의 인스트럭션을 실행함으로써,
상기 전자 장치와 연결된 서버로 CDM(Common Data Model) 데이터를 쿼리 결과로써 요청하기 위한 CDM 쿼리를 전송하고,
상기 쿼리에 대한 쿼리 결과로써, 상기 전송된 쿼리에 응답하여 HTTPS를 통해 상기 서버에 접속하고, 상기 접속된 서버로부터 전송되는 패킷을 획득하고,
상기 획득된 패킷을 신경망 모델에 입력함으로써 상기 패킷 내 상기 전자 장치의 사용자에 대한 개인 정보가 노출되었는지 여부를 식별하고,
상기 적어도 하나의 프로세서는,
WIRE SHARK를 응용한 ALTO 시스템을 이용해, 상기 획득된 패킷 내 데이터를 PCAP 파일로 저장하고,
상기 신경망 모델은,
순환 신경망 모델(Recurrent Neural Network) 구조이고, 문법의 기초가 되는 품사를 구분하기 위한 조건부 무작위장(Conditional Random Field) 모델 및 개체명 인식(Named Entitiy Recognition) 모델을 포함하는 것을 특징으로 하는, 전자 장치.
In the electronic device for determining whether to expose personal information,
network interface;
display;
a memory storing one or more instructions; and
at least one processor executing the one or more instructions; including,
The at least one processor by executing the one or more instructions,
Transmitting a CDM query for requesting CDM (Common Data Model) data as a query result to a server connected to the electronic device,
accessing the server through HTTPS in response to the transmitted query as a result of the query for the query, and obtaining a packet transmitted from the connected server;
By inputting the obtained packet into a neural network model, it is identified whether personal information about a user of the electronic device in the packet is exposed,
the at least one processor,
Using the ALTO system to which WIRE SHARK is applied, the data in the acquired packet is stored as a PCAP file,
The neural network model is
It is a recurrent neural network model structure and comprises a Conditional Random Field model and a Named Entity Recognition model for distinguishing parts of speech that are the basis of grammar, an electronic device .
제7항에 있어서, 상기 적어도 하나의 프로세서는
상기 하나 이상의 인스트럭션을 실행함으로써,
상기 개인 정보가 노출되었는지 여부에 대한 시각 컨텐츠를 생성하고
상기 생성된 시각 컨텐츠를 상기 전자 장치의 화면상에 표시하는, 전자 장치.
8. The method of claim 7, wherein the at least one processor comprises:
By executing the one or more instructions,
create visual content about whether the personal information has been exposed, and
and displaying the generated visual content on a screen of the electronic device.
삭제delete 삭제delete 삭제delete 제7항에 있어서, 상기 적어도 하나의 프로세서는
상기 PCAP 파일을 상기 신경망 모델에 입력하고,
상기 신경망 모델의 출력 값에 기초하여 상기 전자 장치의 사용자에 대한 상기 개인 정보가 노출되었는지 여부를 식별하는, 전자 장치.
8. The method of claim 7, wherein the at least one processor comprises:
input the PCAP file to the neural network model;
and identifying whether the personal information about the user of the electronic device has been exposed based on an output value of the neural network model.
전자 장치가 개인정보 노출 여부를 결정하는 방법에 있어서,
상기 전자 장치와 연결된 서버로 CDM(Common Data Model) 데이터를 쿼리 결과로써 요청하기 위한 CDM 쿼리를 전송하는 단계;
상기 쿼리에 대한 쿼리 결과로써, 상기 전송된 쿼리에 응답하여 HTTPS를 통해 상기 서버에 접속하고, 상기 접속된 서버로부터 전송되는 패킷을 획득하는 단계; 및
상기 획득된 패킷을 신경망 모델에 입력함으로써 상기 패킷 내 상기 전자 장치의 사용자에 대한 개인 정보가 노출되었는지 여부를 식별하는 단계; 를 포함하고,
상기 패킷을 획득하는 단계는,
WIRE SHARK를 응용한 ALTO 시스템을 이용해, 상기 획득된 패킷 내 데이터를 PCAP 파일로 저장하는 단계를 포함하며,
상기 신경망 모델은,
순환 신경망 모델(Recurrent Neural Network) 구조이고, 문법의 기초가 되는 품사를 구분하기 위한 조건부 무작위장(Conditional Random Field) 모델 및 개체명 인식(Named Entitiy Recognition) 모델을 포함하는 것을 특징으로 하는, 방법을 수행하도록 하는 프로그램이 저장된 컴퓨터로 읽을 수 있는 기록매체.
In a method for an electronic device to determine whether to expose personal information,
transmitting a CDM query for requesting Common Data Model (CDM) data as a query result to a server connected to the electronic device;
accessing the server through HTTPS in response to the transmitted query as a result of the query for the query, and obtaining a packet transmitted from the connected server; and
identifying whether personal information about a user of the electronic device in the packet is exposed by inputting the obtained packet into a neural network model; including,
The step of obtaining the packet includes:
Using the ALTO system to which WIRE SHARK is applied, it includes the step of storing the obtained data in the packet as a PCAP file,
The neural network model is
It is a recurrent neural network model structure, and it is characterized by including a Conditional Random Field model and a Named Entity Recognition model for distinguishing parts of speech that are the basis of grammar. A computer-readable recording medium in which a program to be executed is stored.
KR1020200181420A 2020-12-22 2020-12-22 Method and apparatus for determining whether to expose personal information using cdm packets KR102440180B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200181420A KR102440180B1 (en) 2020-12-22 2020-12-22 Method and apparatus for determining whether to expose personal information using cdm packets

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200181420A KR102440180B1 (en) 2020-12-22 2020-12-22 Method and apparatus for determining whether to expose personal information using cdm packets

Publications (3)

Publication Number Publication Date
KR20220090332A KR20220090332A (en) 2022-06-29
KR102440180B1 true KR102440180B1 (en) 2022-09-02
KR102440180B9 KR102440180B9 (en) 2023-02-23

Family

ID=82270409

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200181420A KR102440180B1 (en) 2020-12-22 2020-12-22 Method and apparatus for determining whether to expose personal information using cdm packets

Country Status (1)

Country Link
KR (1) KR102440180B1 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101054107B1 (en) * 2011-03-25 2011-08-03 한국인터넷진흥원 A system for exposure retrieval of personal information using image features

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080029123A (en) * 2006-09-28 2008-04-03 한국전자통신연구원 Apparatus and method for generating a generalized user profile
KR101265467B1 (en) * 2010-12-17 2013-05-16 한국과학기술원 Method for extracting experience and classifying verb in blog
KR20140049148A (en) * 2012-10-16 2014-04-25 한국전자통신연구원 Method for part-of-speech tagging based on morpheme segmentation and apparatus thereof
KR20140115602A (en) * 2013-03-21 2014-10-01 주식회사 퓨전소프트 Protocol Reverse Engineering
KR102101456B1 (en) 2018-10-31 2020-04-16 (주)아이티 노매즈 Method for reducing false positives for diagnosis of personal information exposure of text files and irregular image files

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101054107B1 (en) * 2011-03-25 2011-08-03 한국인터넷진흥원 A system for exposure retrieval of personal information using image features

Also Published As

Publication number Publication date
KR20220090332A (en) 2022-06-29
KR102440180B9 (en) 2023-02-23

Similar Documents

Publication Publication Date Title
US10991366B2 (en) Method of processing dialogue query priority based on dialog act information dependent on number of empty slots of the query
US11367434B2 (en) Electronic device, method for determining utterance intention of user thereof, and non-transitory computer-readable recording medium
CN107391760B (en) User interest recognition methods, device and computer readable storage medium
US10521723B2 (en) Electronic apparatus, method of providing guide and non-transitory computer readable recording medium
CN108564941A (en) Audio recognition method, device, equipment and storage medium
US11164565B2 (en) Unsupervised learning system and method for performing weighting for improvement in speech recognition performance and recording medium for performing the method
US11532305B2 (en) Electronic apparatus and control method thereof
US11810596B2 (en) Apparatus and method for speech-emotion recognition with quantified emotional states
US11769492B2 (en) Voice conversation analysis method and apparatus using artificial intelligence
WO2021103712A1 (en) Neural network-based voice keyword detection method and device, and system
US20220114497A1 (en) Smart copy optimization in customer acquisition and customer management platforms
US20210255759A1 (en) Indication of content linked to text
KR102537113B1 (en) Method for determining a confidence level of inference data produced by artificial neural network
KR20220071059A (en) Method for evaluation of emotion based on emotion analysis model and device using the same
CN112329433A (en) Text smoothness detection method, device and equipment and computer readable storage medium
KR102703332B1 (en) Method for evaluating consultation quality
US11705110B2 (en) Electronic device and controlling the electronic device
KR102440180B1 (en) Method and apparatus for determining whether to expose personal information using cdm packets
US20210090593A1 (en) Method and device for analyzing real-time sound
US20220108550A1 (en) Electronic device and control method of same
WO2019051704A1 (en) Method and device for identifying junk file
US11972756B2 (en) Method for recognizing the voice of audio containing foreign languages
CN117522592B (en) Data configuration method, electronic device and storage medium
KR102674954B1 (en) Method and apparatus for providing search service using large language model and deep learning
CN114817456B (en) Keyword detection method, keyword detection device, computer equipment and storage medium

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
G170 Re-publication after modification of scope of protection [patent]