Nothing Special   »   [go: up one dir, main page]

KR102617515B1 - Method and device for blocking illegal and harmful information sites using favicon - Google Patents

Method and device for blocking illegal and harmful information sites using favicon Download PDF

Info

Publication number
KR102617515B1
KR102617515B1 KR1020230099758A KR20230099758A KR102617515B1 KR 102617515 B1 KR102617515 B1 KR 102617515B1 KR 1020230099758 A KR1020230099758 A KR 1020230099758A KR 20230099758 A KR20230099758 A KR 20230099758A KR 102617515 B1 KR102617515 B1 KR 102617515B1
Authority
KR
South Korea
Prior art keywords
harmful
information
favicon
site
target website
Prior art date
Application number
KR1020230099758A
Other languages
Korean (ko)
Inventor
박철우
인준영
Original Assignee
(주)에잇스니핏
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)에잇스니핏 filed Critical (주)에잇스니핏
Priority to KR1020230099758A priority Critical patent/KR102617515B1/en
Application granted granted Critical
Publication of KR102617515B1 publication Critical patent/KR102617515B1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/02Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
    • H04L63/0227Filtering policies
    • H04L63/0236Filtering by address, protocol, port number or service, e.g. IP-address or URL
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

파비콘을 이용한 불법·유해정보 사이트 차단 방법 및 장치가 개시된다. 본 발명의 일측면에 따른 파비콘을 이용한 불법·유해정보 사이트 차단 방법은, 접속 요청된 대상웹사이트의 파비콘을 취득하는 단계; 불법·유해정보 사이트들에 대한 정보를 구축한 유해사이트DB를 참조하여 파비콘을 이용하여 대상웹사이트의 유해사이트 여부를 판단하는 단계; 및 유해사이트가 아닌 경우 대상웹사이트로의 접속을 허용하는 단계를 포함한다.A method and device for blocking illegal and harmful information sites using favicons are disclosed. A method of blocking illegal and harmful information sites using a favicon according to one aspect of the present invention includes the steps of acquiring a favicon of a target website to which access has been requested; A step of determining whether the target website is a harmful site using a favicon by referring to a harmful site DB that contains information on illegal and harmful information sites; and a step of allowing access to the target website if it is not a harmful website.

Description

파비콘을 이용한 불법·유해정보 사이트 차단 방법 및 장치{Method and device for blocking illegal and harmful information sites using favicon}{Method and device for blocking illegal and harmful information sites using favicon}

본 발명은 파비콘을 이용한 불법·유해정보 사이트 차단 방법 및 장치에 관한 것이다.The present invention relates to a method and device for blocking illegal and harmful information sites using a favicon.

웹사이트를 통해 서비스되는 콘텐츠들 중에는 불쾌감을 유발하거나 유해한 영향을 미칠 수 있는 유해콘텐츠도 포함될 수 있다. 이러한 유해콘텐츠를 취급하는 불법·유해정보 사이트는 음란, 명예훼손, 공포 또는 불안감 유발, 해킹, 사행성, 불법거래, 반정부, 테러, 범죄 사이트이며, 대부분 국외에 서버를 두고 있어, 강제로 폐쇄할 수는 없기 때문에, 통상적으로는 한국에서 해당 유해 사이트로의 접속을 차단하는 방식으로 규제한다. Contents provided through the website may include harmful content that may cause discomfort or have harmful effects. Illegal and harmful information sites that handle such harmful content are obscene, defamatory, fear or anxiety-inducing, hacking, speculative, illegal transaction, anti-government, terrorist, and criminal sites, and most of them have servers located overseas, so they cannot be forcibly shut down. Since there is no such thing, Korea usually regulates it by blocking access to such harmful sites.

통상적으로 유해 사이트로의 접속을 차단하는 방식은 URL, DNS 등을 이용한다. 그러나, 유해 사이트의 운영자들은 이러한 차단 방식을 회피하기 위해 주기적으로 URL 정보나 DNS 정보를 변경하고 있어, 사용자의 유해 사이트 접속 차단 기능을 제공하는데 어려움이 있다.Typically, methods to block access to harmful sites use URL, DNS, etc. However, operators of harmful sites periodically change URL information or DNS information to avoid this blocking method, making it difficult to provide a function to block users from accessing harmful sites.

이를 위한 하나의 방식으로서 웹 사이트의 내용을 분석하는 내용 기반 차단 방식이 시도되고 있다. 그러나 웹사이트 내용에 대한 분석 정확도가 떨어지고 그 처리속도로 인해 원활한 서비스가 어려운 실정이다. As a method for this, a content-based blocking method that analyzes the content of a website is being attempted. However, the accuracy of analysis of website content is low and the processing speed makes it difficult to provide smooth service.

대한민국 공개특허 제10-2023-0059015 유해 사이트 차단 시스템 및 그 방법Republic of Korea Public Patent No. 10-2023-0059015 Harmful site blocking system and method

따라서, 본 발명은 상술한 문제점을 해결하기 위해 안출된 것으로서, URL주소가 변경되더라도 유해사이트에 대한 차단이 용이한 파비콘을 이용한 불법·유해정보 사이트 차단 방법 및 장치를 제공하기 위한 것이다.Accordingly, the present invention was developed to solve the above-mentioned problems, and is intended to provide a method and device for blocking illegal and harmful information sites using a favicon that allows easy blocking of harmful sites even if the URL address is changed.

또한, 본 발명은 비교적 간단한 데이터 비교로 인해 처리속도를 높여 원활하고 정확한 서비스를 제공할 수 있는 파비콘을 이용한 불법·유해정보 사이트 차단 방법 및 장치를 제공하기 위한 것이다. In addition, the present invention is intended to provide a method and device for blocking illegal and harmful information sites using favicons that can provide smooth and accurate services by increasing processing speed through relatively simple data comparison.

본 발명의 다른 목적들은 이하에 서술되는 바람직한 실시예를 통하여 보다 명확해질 것이다.Other objects of the present invention will become clearer through the preferred embodiments described below.

본 발명의 일 측면에 따르면, 불법·유해정보 사이트 차단 방법에 있어서, 접속 요청된 대상웹사이트의 파비콘을 취득하는 단계; 불법·유해정보 사이트들에 대한 정보를 구축한 유해사이트DB를 참조하여 상기 파비콘을 이용하여 상기 대상웹사이트의 유해사이트 여부를 판단하는 단계; 및 유해사이트가 아닌 경우 상기 대상웹사이트로의 접속을 허용하는 단계를 포함하는, 파비콘을 이용한 불법·유해정보 사이트 차단 방법 및 그 방법을 수행하는 컴퓨터-판독 가능 매체에 저장된 컴퓨터 프로그램이 제공된다.According to one aspect of the present invention, a method of blocking illegal and harmful information sites includes the steps of acquiring a favicon of a target website to which access has been requested; Determining whether the target website is a harmful site using the favicon by referring to a harmful site DB containing information on illegal and harmful information sites; A method of blocking illegal and harmful information sites using a favicon, including the step of allowing access to the target website if it is not a harmful site, and a computer program stored in a computer-readable medium for performing the method are provided.

여기서, 상기 파비콘에 대해 상기 대상웹사이트의 HTML 소스에서 탐색한 다운로드 주소를 이용하여 다운로드 받으며, 만일 상기 다운로드 주소가 없는 경우 루트 디렉토리에 파일을 호출하여 다운로드 받을 수 있다.Here, the favicon is downloaded using the download address found in the HTML source of the target website. If the download address is not found, the favicon can be downloaded by calling the file in the root directory.

또한, 상기 유해사이트 여부를 판단 시, 상기 파비콘의 원본 해시값을 이용하거나, 또는 미리 설정된 사이즈 또는 색상 중 적어도 어느 하나로 상기 파비콘을 변환한 이후의 해시값을 이용할 수 있다.In addition, when determining whether the site is a harmful site, the original hash value of the favicon can be used, or the hash value after converting the favicon to at least one of a preset size or color can be used.

또한, 상기 파비콘의 취득이 실패되는 경우, 상기 대상웹사이트의 HTML 소스를 분석하여 기본구조정보를 취득하고, 상기 유해사이트DB를 참조하여 상기 기본구조정보와 동일한 유해사이트가 존재하는지를 검색함으로써 구조기반 유해사이트 여부 판단을 수행할 수 있다.In addition, if acquisition of the favicon fails, basic structure information is acquired by analyzing the HTML source of the target website, and the structure-based information is searched for by referring to the harmful site DB to see if a harmful site identical to the basic structure information exists. You can determine whether a site is harmful or not.

또한, 상기 기본구조정보로서 상기 HTML의 <body> 태그 아래 2뎁스(depth) 내지 4 뎁스 중 어느 하나까지의 구조를 이용할 수 있다.Additionally, as the basic structure information, any structure from 2 to 4 depths under the <body> tag of the HTML can be used.

또한, 상기 유해사이트DB에는 각 유해사이트에 대해 유동성 있는 영역은 제외된 부동성구조정보를 추출할 수 있는 각각의 메타데이터 및 상기 부동성구조정보가 더 저장되며, 상기 구조기반 유해사이트 여부 판단 시 상기 대상웹사이트가 유해사이트라 판단되면, 상기 메타데이터를 이용하여 상기 대상웹사이트의 부동성구조정보를 추출하여 제2 구조기반 유해사이트 여부판단을 더 수행할 수 있다.In addition, the harmful site DB further stores each metadata and the floating structure information that can extract the floating structure information excluding the floating area for each harmful site, and the target target when determining whether or not the structure is a harmful site. If the website is determined to be a harmful site, the metadata can be used to extract the floating structure information of the target website to further determine whether the website is a harmful site based on the second structure.

또한, 미리 구축된 무해사이트DB를 참조하여 상기 기본구조정보와 동일한 무해사이트가 존재하는 경우에만 상기 제2 구조기반 유해사이트 여부판단을 수행할 수 있다.In addition, the second structure-based harmful site determination can be made only when a harmless site identical to the basic structure information exists by referring to a pre-built harmless site DB.

본 발명의 다른 측면에 따르면, 사용자단말과 통신하기 위한 통신부; 불법·유해정보 사이트들에 대한 정보를 저장하는 저장부; 상기 사용자단말로부터 접속 요청된 대상웹사이트의 파비콘을 취득하는 정보추출부; 상기 저장부의 불법·유해정보 사이트들에 대한 정보를 기반으로 상기 파비콘을 이용하여 상기 대상웹사이트의 유해사이트 여부를 판단하는 유해판단부; 및 유해사이트가 아닌 경우에만 상기 대상웹사이트로의 접속을 허용하는 접속제어부를 포함하는, 파비콘을 이용한 불법·유해정보 사이트 차단 장치가 제공된다.According to another aspect of the present invention, a communication unit for communicating with a user terminal; A storage unit that stores information about illegal and harmful information sites; an information extraction unit that acquires a favicon of a target website access requested from the user terminal; a harmfulness determination unit that determines whether the target website is a harmful site using the favicon based on information about illegal and harmful information sites in the storage unit; A device for blocking illegal and harmful information sites using a favicon is provided, including an access control unit that allows access to the target website only if it is not a harmful site.

여기서, 상기 정보추출부는 상기 파비콘의 취득이 실패되는 경우, 상기 대상웹사이트의 HTML 소스를 분석하여 기본구조정보를 취득하며, 상기 유해판단부는 상기 저장부에 저장된 불법·유해정보 사이트들에 대한 정보를 참조하여 상기 기본구조정보와 동일한 유해사이트가 존재하는지를 검색함으로써 구조기반 유해사이트 여부 판단을 수행할 수 있다.Here, if the acquisition of the favicon fails, the information extraction unit analyzes the HTML source of the target website to obtain basic structure information, and the harmfulness determination unit extracts information about illegal and harmful information sites stored in the storage unit. It is possible to determine whether a structure-based harmful site exists by referring to and searching whether a harmful site identical to the basic structure information exists.

또한, 상기 불법·유해정보 사이트들에 대한 정보에는 각 유해사이트에 대해 유동성 있는 영역은 제외된 부동성구조정보를 추출할 수 있는 각각의 메타데이터 및 상기 부동성구조정보가 더 포함되며, 상기 유해판단부는 상기 구조기반 유해사이트 여부 판단 시 상기 대상웹사이트가 유해사이트라 판단되면, 상기 메타데이터를 이용하여 상기 대상웹사이트의 부동성구조정보를 추출하여 제2 구조기반 유해사이트 여부판단을 더 수행할 수 있다.In addition, the information on the illegal and harmful information sites further includes each metadata and the floating structure information that can extract the floating structure information excluding the floating area for each harmful site, and the harmfulness determination unit When determining whether the target website is a harmful site based on the structure, if the target website is determined to be a harmful site, the metadata can be used to extract the floating structure information of the target website to further determine whether the target website is a harmful site based on the second structure. .

전술한 것 외의 다른 측면, 특징, 이점이 이하의 도면, 특허청구범위 및 발명의 상세한 설명으로부터 명확해질 것이다.Other aspects, features and advantages in addition to those described above will become apparent from the following drawings, claims and detailed description of the invention.

본 발명에 따르면, 최근 대부분의 사이트에 존재하는 파비콘을 이용하여 식별함으로써, URL 또는 DNS 등이 변경되더라도 불법·유해정보 사이트에 대한 차단이 가능하다.According to the present invention, it is possible to block illegal and harmful information sites even if the URL or DNS is changed by identifying them using the favicon that exists on most sites these days.

또한, 본 발명은 파비콘과 같은 단순한 정보를 이용함으로써 정확하고 보다 빠른 처리속도로 불법·유해정보 사이트의 차단 서비스를 원활히 제공할 수 있다.In addition, the present invention can smoothly provide a blocking service for illegal and harmful information sites with accurate and faster processing speed by using simple information such as a favicon.

도 1은 본 발명의 일 실시예에 따른 파비콘을 이용한 유해사이트 차단 장치의 구성을 도시한 기능블록도.
도 2는 본 발명의 일 실시예에 따른 파비콘을 이용한 유해사이트 차단 과정을 도시한 흐름도.
도 3은 본 발명의 일 실시예에 따른 구조정보를 더 이용한 유해사이트 차단 과정을 도시한 흐름도.
도 4는 본 발명의 일 실시예에 따른 웹사이트의 구조정보를 추출하기 위한 HTML을 도시한 예시도.
도 5는 본 발명의 일 실시예에 따른 유해사이트DB 정보를 예시한 테이블.
도 6 및 도 7은 본 발명의 일 실시예에 따른 웹사이트의 기본구조와 부동성구조를 도시한 예시도들.
도 8은 본 발명의 일 실시예에 따른 부동성구조정보를 더 활용한 유해사이트 판단 과정을 도시한 흐름도.
Figure 1 is a functional block diagram showing the configuration of a device for blocking harmful sites using a favicon according to an embodiment of the present invention.
Figure 2 is a flowchart showing the process of blocking harmful sites using a favicon according to an embodiment of the present invention.
Figure 3 is a flowchart showing a process for blocking harmful sites using structural information according to an embodiment of the present invention.
Figure 4 is an example diagram showing HTML for extracting structural information of a website according to an embodiment of the present invention.
Figure 5 is a table illustrating harmful site DB information according to an embodiment of the present invention.
Figures 6 and 7 are exemplary diagrams showing the basic structure and floating structure of a website according to an embodiment of the present invention.
Figure 8 is a flow chart illustrating a process for determining a harmful site by further utilizing immobility structure information according to an embodiment of the present invention.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.Since the present invention can make various changes and have various embodiments, specific embodiments will be illustrated in the drawings and described in detail in the detailed description. However, this is not intended to limit the present invention to specific embodiments, and should be understood to include all changes, equivalents, and substitutes included in the spirit and technical scope of the present invention.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. When a component is said to be "connected" or "connected" to another component, it is understood that it may be directly connected to or connected to the other component, but that other components may exist in between. It should be. On the other hand, when it is mentioned that a component is “directly connected” or “directly connected” to another component, it should be understood that there are no other components in between.

제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 후술될 제1 임계값, 제2 임계값 등의 용어는 실질적으로는 각각 상이하거나 일부는 동일한 값인 임계값들로 미리 지정될 수 있으나, 임계값이라는 동일한 단어로 표현될 때 혼동의 여지가 있으므로 구분의 편의상 제1, 제2 등의 용어를 병기하기로 한다. Terms such as first, second, etc. may be used to describe various components, but the components should not be limited by the terms. The above terms are used only for the purpose of distinguishing one component from another. For example, terms such as first threshold and second threshold, which will be described later, may be pre-designated as thresholds that are substantially different or partially the same, but may cause confusion when expressed with the same word, threshold. Since there is room, for convenience of classification, terms such as first and second will be used together.

본 명세서에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terms used herein are only used to describe specific embodiments and are not intended to limit the invention. Singular expressions include plural expressions unless the context clearly dictates otherwise. In this specification, terms such as “comprise” or “have” are intended to designate the presence of features, numbers, steps, operations, components, parts, or combinations thereof described in the specification, but are not intended to indicate the presence of one or more other features. It should be understood that this does not exclude in advance the possibility of the existence or addition of elements, numbers, steps, operations, components, parts, or combinations thereof.

또한, 각 도면을 참조하여 설명하는 실시예의 구성 요소가 해당 실시예에만 제한적으로 적용되는 것은 아니며, 본 발명의 기술적 사상이 유지되는 범위 내에서 다른 실시예에 포함되도록 구현될 수 있으며, 또한 별도의 설명이 생략될지라도 복수의 실시예가 통합된 하나의 실시예로 다시 구현될 수도 있음은 당연하다.In addition, the components of the embodiments described with reference to each drawing are not limited to the corresponding embodiments, and may be implemented to be included in other embodiments within the scope of maintaining the technical spirit of the present invention, and may also be included in separate embodiments. Even if the description is omitted, it is natural that a plurality of embodiments may be re-implemented as a single integrated embodiment.

또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일하거나 관련된 참조부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. In addition, when describing with reference to the accompanying drawings, identical or related reference numbers will be assigned to identical or related elements regardless of the drawing symbols, and overlapping descriptions thereof will be omitted. In describing the present invention, if it is determined that a detailed description of related known technologies may unnecessarily obscure the gist of the present invention, the detailed description will be omitted.

도 1은 본 발명의 일 실시예에 따른 파비콘을 이용한 유해사이트 차단 장치의 구성을 도시한 기능블록도이고, 도 2는 본 발명의 일 실시예에 따른 파이콘을 이용한 유해사이트 차단 과정을 도시한 흐름도이다.Figure 1 is a functional block diagram showing the configuration of a device for blocking harmful sites using Favicon according to an embodiment of the present invention, and Figure 2 is a functional block diagram showing the process of blocking harmful sites using Pycon according to an embodiment of the present invention. This is a flow chart.

도 1을 참조하면, 본 실시예에 따른 유해사이트 차단 장치는 통신부(10), 저장부(20) 및 제어부(30)를 포함하되, 제어부(30)는 정보추출부(31), 유해판단부(32) 및 접속제어부(33)를 포함할 수 있다. 제어부(30)의 각 구성부는 반드시 하드웨어적으로 구현될 필요는 없으며, 프로그램과 같이 소프트웨어적으로 구현될 수도 있음은 당업자에게는 이하의 설명을 통해 더욱 자명해질 것이다.Referring to FIG. 1, the device for blocking harmful sites according to this embodiment includes a communication unit 10, a storage unit 20, and a control unit 30, and the control unit 30 includes an information extraction unit 31 and a harmful judgment unit. (32) and a connection control unit (33). It will become more apparent to those skilled in the art through the following description that each component of the control unit 30 does not necessarily need to be implemented in hardware, and may also be implemented in software, such as a program.

유해사이트 차단 장치는 서버형태로 구현될 수 있으며, 클라이언트 즉 사용자단말(미도시)과 통신망을 통해 통신한다. 예를 들어, 사용자단말에 설치된 에이전트에 의해 접속하고자 하는 대상웹사이트에 대한 정보를 유해사이트 차단 장치로 전달한다.The device for blocking harmful sites can be implemented in the form of a server and communicates with a client, that is, a user terminal (not shown), through a communication network. For example, information about the target website to be accessed is transmitted to the harmful site blocking device by the agent installed on the user terminal.

통신부(10)는 사용자단말과 통신하기 위한 통신수단으로, 당업자에게는 자명할 것이므로 더욱 상세한 설명은 생략한다.The communication unit 10 is a communication means for communicating with a user terminal, and since it will be obvious to those skilled in the art, further detailed description will be omitted.

저장부(20)에는 불법·유해정보 사이트(이하, 유해사이트라 칭함)에 대한 정보가 데이터베이스(DB) 형태로 저장된다. 유해사이트에 대한 정보로서 URL 등이 저장될 수 있으며, 특히 본 실시예에 따르면 각 유해사이트에 대한 파비콘 정보가 저장된다. In the storage unit 20, information about illegal and harmful information sites (hereinafter referred to as harmful sites) is stored in the form of a database (DB). URLs, etc. can be stored as information about harmful sites, and in particular, according to this embodiment, favicon information about each harmful site is stored.

파비콘이란 웹 브라우저의 즐겨찾기 또는 주소 창에 뜨는 웹사이트의 아이콘을 말한다. 이름은 Favorite와 Icon의 합성어로서, 주로 사용하는 크기는 16Х16px이고 확장자는 ico이다. 유해사이트의 경우에도 파비콘을 이용하기 때문에, 이러한 파비콘에 대한 정보를 유해사이트에 대한 정보로서 유해사이트DB로서 저장한다. 파비콘의 이용 방식에 대해서는 차후 보다 상세히 설명하기로 한다. 그리고, 다른 일례에 따르면 저장부에는 유해사이트에 대한 정보로서 구조정보가 더 저장될 수 있다. 이에 대해서는 추후 상세히 설명하기로 한다.A favicon is an icon for a website that appears in the favorites or address bar of a web browser. The name is a compound word of Favorite and Icon. The mainly used size is 16Х16px and the extension is ico. Since favicons are also used in the case of harmful sites, information about these favicons is stored as information about harmful sites as a harmful site DB. How to use the favicon will be explained in more detail later. And, according to another example, structural information as information about harmful sites may be further stored in the storage unit. This will be explained in detail later.

제어부(30)는 사용자단말로부터 접속 요청된 대상웹사이트에 대한 유해사이트 여부(유해성 판단이라 칭함)를 판단하고, 유해사이트인 경우 차단하고 아닌 경우에만 접속을 허용한다.The control unit 30 determines whether the target website requested to access from the user terminal is a harmful site (referred to as a harmful site), blocks it if it is a harmful site, and allows access only if it is not.

도 2를 함께 참조하여 제어부(30)의 각 구성부의 기능에 대해 설명하기로 한다.The function of each component of the control unit 30 will be described with reference to FIG. 2.

제어부(30)의 정보추출부(31)는 접속 요청된 대상웹사이트의 파비콘을 취득한다(S210). 정보추출부는 파비콘에 대해 대상웹사이트의 HTML 소스에서 탐색한 다운로드 주소를 이용하여 다운로드 받을 수 있다. 만일 HTML 소스에 다운로드 주소가 없는 경우 루트 디렉토리에 favicon.ico 파일을 불러오려고 시도한다. 예를 들어, xkeeper.com 사이트에 파비콘 다운로드 주소가 명시되어 있지 않을 경우, [xkeeper.com/favicon.ico]을 호출하면 다운로드할 수 있다.The information extraction unit 31 of the control unit 30 acquires the favicon of the target website to which access has been requested (S210). The information extraction unit can download the favicon using the download address found in the HTML source of the target website. If there is no download address in the HTML source, it attempts to load the favicon.ico file in the root directory. For example, if the favicon download address is not specified on the xkeeper.com site, you can download it by calling [xkeeper.com/favicon.ico].

유해판단부(32)는 저장부(20)의 유해사이트DB를 기반으로 대상웹사이트의 파비콘과 동일한 파비콘을 갖는 유해사이트가 존재하는지를 검색함으로써 유해사이트 여부를 판단한다(S220). The harmfulness determination unit 32 determines whether a harmful site exists by searching for the presence of a harmful site having the same favicon as the favicon of the target website based on the harmful site DB of the storage unit 20 (S220).

여기서, 일례에 따르면, 파비콘의 해시값을 이용한 비교를 수행하여, 처리 속도와 정확도를 높일 수 있다. 해시값을 이용한 비교 방식은 당업자에게는 자명할 것이므로 더욱 상세한 설명은 생략한다.Here, according to one example, comparison using the hash value of the favicon can be performed to increase processing speed and accuracy. The comparison method using hash values will be obvious to those skilled in the art, so a more detailed description will be omitted.

또한, 유해사이트 여부를 판단 시 파비콘의 원본 해시값을 그대로 이용할 수도 있으나, 다른 일례에 따르면 미리 설정된 사이즈 또는 색상 중 적어도 어느 하나로 파비콘을 변환한 이후의 해시값을 이용할 수도 있다. 유해사이트에서 파비콘의 사이즈 또는 색상을 다르게 변경할 경우에도 차단할 수 있도록, 특정한 사이즈 또는 색상으로 변환한 이후 비교를 수행하는 것이다.In addition, when determining whether a site is harmful, the original hash value of the favicon may be used as is, but according to another example, the hash value after converting the favicon to at least one of a preset size or color may be used. In order to be able to block even if a harmful site changes the size or color of the favicon differently, the favicon is converted to a specific size or color and then compared.

접속제어부(33)는 유해판단부(32)의 판단 결과에 따라, 유해사이트가 아닌 경우에만 대상웹사이트로의 접속을 허용한다(S230).The access control unit 33 allows access to the target website only if it is not a harmful site, according to the judgment result of the harmfulness determination unit 32 (S230).

다시 말해, 본 실시예에 따르면, 유해성판단 방식으로서, 대상웹사이트의 파비콘을 이용하는 것으로, 유해사이트가 접속정보(URL 등)를 변경하더라도 파비콘을 변경하지 않는 경우 차단할 수 있게 된다.In other words, according to this embodiment, by using the favicon of the target website as a harmfulness determination method, it is possible to block the harmful site if it does not change the favicon even if the access information (URL, etc.) is changed.

여기서, S210에서 만일 파비콘의 취득이 실패되는 경우(예를 들어, 대상웹사이트 자체에 파비콘이 존재하지 않는 경우, 통신상의 이유 등으로 파비콘 다룬로드가 실패되는 경우 등)에는 상술한 바와 같은 대상웹사이트의 구조정보를 이용한 유해성 판단(이하 구조기반 유해사이트 여부 판단이라 칭함)을 수행한다.Here, if acquisition of the favicon fails in S210 (for example, if the favicon does not exist in the target website itself, if loading the favicon fails due to communication reasons, etc.), the target website as described above Harmfulness determination is performed using the structure information of the site (hereinafter referred to as structure-based harmful site determination).

도 3은 본 발명의 일 실시예에 따른 구조정보를 더 이용한 유해사이트 차단 과정을 도시한 흐름도이다.Figure 3 is a flowchart showing a process for blocking harmful sites using structural information according to an embodiment of the present invention.

도 3을 참조하면, 대상웹사이트의 파비콘 취득을 시도하고(S310), 파비콘의 취득 성공 여부를 확인하며(S320), 파비콘이 취득되면 도 2에서와 같이 파비콘을 이용한 유해성 여부 판단을 수행하여 대상웹사이트의 접속 허용 여부를 결정한다(S330).Referring to Figure 3, an attempt is made to acquire the favicon of the target website (S310), confirmation is made of whether or not the favicon has been successfully acquired (S320), and when the favicon is acquired, a determination of whether or not the favicon is harmful is performed as shown in Figure 2 and the target website is identified. Decide whether to allow access to the website (S330).

이와 달리, 파비콘의 취득이 실패되면, 대상웹사이트의 HTML 소스를 분석하여 기본구조정보를 취득하고(S340), 유해사이트DB를 참조하여 대상웹사이트의 기본구조정보와 동일한 유해사이트가 존재하는지를 검색함으로써 구조기반 유해사이트 여부 판단을 수행하여 차단 여부를 결정한다. On the other hand, if acquisition of the favicon fails, the basic structure information is acquired by analyzing the HTML source of the target website (S340), and the harmful site DB is referred to to search whether a harmful site identical to the basic structure information of the target website exists. By doing so, a structure-based determination of whether a site is harmful is performed and whether or not to block is determined.

이하, 대상웹사이트의 구조정보 및 이를 이용한 구조기반 유해사이트 여부 판단 방식에 대해 보다 상세히 설명하기로 한다.Below, we will explain in more detail the structural information of the target website and the method of determining whether it is a harmful site based on the structure using this.

도 4는 본 발명의 일 실시예에 따른 웹사이트의 구조정보를 추출하기 위한 HTML을 도시한 예시도이고, 도 5는 본 발명의 일 실시예에 따른 유해사이트DB 정보를 예시한 테이블이고, 도 6 및 도 7은 본 발명의 일 실시예에 따른 웹사이트의 기본구조와 부동성구조를 도시한 예시도들이다.Figure 4 is an example diagram showing HTML for extracting structural information of a website according to an embodiment of the present invention, Figure 5 is a table illustrating harmful site DB information according to an embodiment of the present invention, Figure 6 and 7 are exemplary diagrams showing the basic structure and floating structure of a website according to an embodiment of the present invention.

도 4를 참조하면, 대상웹사이트의 소스정보로서 HTML 정보를 확인할 수 있는데, HTML 정보를 렌더링하고, Text, attribute 등 불필요 정보를 제거하며, 예를 들어 <body> 태그 아래 2뎁스(depth) 내지 4 뎁스 중 어느 하나까지의 구조(본 도면에서는 4뎁스를 이용)를 기본구조정보로서 이용할 수 있다. 도면과 같이 <div>태그를 이용하여 뎁스를 구분할 수 있으며, <a>태그, <span>태그 등도 구조정보로서 이용할 수 있다.Referring to Figure 4, HTML information can be confirmed as the source information of the target website. HTML information is rendered, unnecessary information such as text and attributes is removed, and, for example, 2 depths under the <body> tag. Any structure of up to 4 depths (4 depths are used in this drawing) can be used as basic structural information. As shown in the drawing, the depth can be distinguished using the <div> tag, and the <a> tag and <span> tag can also be used as structural information.

이해의 편의를 위한 예시를 도시한 도 6을 함께 참조하면, 예를 들어, 3뎁스까지의 구조정보를 기본구조정보로서 활용한다. 이때, 태그값, 속성 등 변화 가능한 값은 제거된 정보를 기본구조정보로서 이용한다. 다시 말해, 웹사이트를 구성하는 틀에 대한 구조만을 이용할 뿐, 그 안의 내용들은 제거하는 것이다. 도 6에 도시된 바와 같이 웹사이트 메인 페이지 화면을 구성하는 각 영역들에 대해 2 내지 4뎁스의 구조정보를 기본구조정보로서 활용한다.Referring to Figure 6, which shows an example for convenience of understanding, for example, structural information up to 3 depths is used as basic structural information. At this time, the information removed from changeable values such as tag values and attributes is used as basic structure information. In other words, only the structure of the framework that makes up the website is used, and the contents within it are removed. As shown in Figure 6, 2 to 4 depth structural information is used as basic structural information for each area that constitutes the website main page screen.

그리고, 이러한 기본구조를 구성하는 각 영역중에는 내용 및 그 내부구조가 수시로 변하는 유동성 영역이 대부분 존재한다. 예를 들어, 실시간 주식정보, 경매정보, 도박정보 등을 제공하는 영역은 그 구조 및 내용들이 수시로 변하는데, 통상 롤링배너의 형태로 이용하며, 이 경우 그 구조와 내용들이 유동적이다. And, among each area that constitutes this basic structure, there are mostly fluid areas in which the content and internal structure change from time to time. For example, the structure and contents of areas that provide real-time stock information, auction information, gambling information, etc. change frequently, and are usually used in the form of a rolling banner, in which case the structure and contents are flexible.

따라서, 렌더링된 웹사이트 전체 구조에서 유동성 있는 구조를 갖는 영역을 확인하여, 유동성 없는 구조정보를 추출할 수 있는 메타데이터(metadata)를 생성한다. 최초 전체 구조 정보와 차후의 구조 정보를 비교하여 변화가 없는 부분을 유동성 없는 구조 정보(이하 부동성구조정보라 칭함)로 본다. 예를 들어, 유해사이트DB 구축 시, 유해사이트로 등록되는 웹사이트로 미리 설정된 시간간격(예를 들어, 10초 등)으로 2회 이상 접속하여 서로 비교함으로써 내용이 변경되는 유동성 있는 영역을 탐색할 수 있다. 이렇게 탐색한 유동성 영역을 추출할 수 있는 메타데이터를 해당 유해사이트 정보로서 유해사이트DB에 저장하는 것이다.Therefore, areas with a fluid structure are identified in the entire rendered website structure, and metadata that can extract structural information that is not fluid is generated. By comparing the initial overall structural information with the subsequent structural information, the part that does not change is considered as structural information without liquidity (hereinafter referred to as floating structural information). For example, when building a database of harmful sites, you can access websites registered as harmful sites more than twice at preset time intervals (for example, 10 seconds, etc.) and compare them to explore fluid areas where the content changes. You can. Metadata that can extract the fluidity area explored in this way is stored in the harmful site DB as relevant harmful site information.

도 6의 기본구조에서 메타데이터를 이용하여 유동성 있는 영역은 제거한 부동성구조가 도 7에 도시되어 있다. In the basic structure of FIG. 6, the immobility structure in which the fluid area is removed using metadata is shown in FIG. 7.

그리고, 유해사이트DB에 저장되는 정보를 개략적으로 예시한 도 5를 참조하면, 기본구조정보와 부동성구조정보에 대한 정보로서 각각의 해시값 및 그 메타데이터가 저장된다. 해시값을 이용하는 경우 정보비교의 속도와 정확도를 현저히 높일 수 있음은 당업자에게는 자명할 것이다.And, referring to Figure 5, which schematically illustrates the information stored in the harmful site DB, each hash value and its metadata are stored as information about basic structure information and floating structure information. It will be obvious to those skilled in the art that the speed and accuracy of information comparison can be significantly increased when using hash values.

대상웹사이트의 기본구조만을 이용하는 경우, 동일한 기본구조를 갖는 무해한 웹사이트로의 접속도 차단될 수 있는 차단오류가 발생될 수 있다. 이를 위해 상술한 바와 같은 부동성구조정보를 활용하여 제2 유해성판단을 더 수행함으로써, 무해한 웹사이트로의 접속을 차단하는 차단오류를 줄일 수 있다.If only the basic structure of the target website is used, a blocking error may occur that may block access to a harmless website with the same basic structure. To this end, by further performing a second harmfulness judgment using the above-described immobility structure information, blocking errors that block access to harmless websites can be reduced.

도 8은 본 발명의 일 실시예에 따른 부동성구조정보를 더 활용한 유해사이트 판단 과정을 도시한 흐름도이다.Figure 8 is a flowchart showing the process of determining a harmful site by further utilizing the immobility structure information according to an embodiment of the present invention.

도 8을 참조하면, 대상웹사이트의 기본구조정보를 이용한 유해성 판단할 수행하고(S810), 판단결과 유해사이트인지 여부를 확인한다(S820).Referring to FIG. 8, the harmfulness judgment is performed using the basic structure information of the target website (S810), and it is confirmed whether the site is harmful as a result of the judgment (S820).

만일 유해사이트가 아니라고 판단한 경우(즉, 동일한 기본구조를 갖는 유해사이트가 DB에 등록되어 있지 않는 경우), 대상웹사이트에 대한 사용자단말의 접속을 허용한다(S830).If it is determined that it is not a harmful site (i.e., if a harmful site with the same basic structure is not registered in the DB), the user terminal is allowed to access the target website (S830).

이와 달리, 유해사이트라 판단되는 경우, 해당 유해사이트에 대한 정보로서 저장된 메타데이터를 이용하여 부동성구조정보를 취득하여 유해사이트DB를 참조하여 제2 유해사이트 여부판단을 수행한다(S840, S850).On the other hand, if it is determined to be a harmful site, immobility structure information is acquired using metadata stored as information about the harmful site, and a determination as to whether the second harmful site is made is performed by referring to the harmful site DB (S840, S850).

본 실시예에 따르면, 기본구조를 이용한 제1 유해사이트 여부판단을 수행하고, 유해사이트라 판단되면 부동성구조정보를 이용한 제2 유해사이트 여부판단을 추가 수행함으로써, 무해사이트에 대한 차단오류를 최대한 방지할 수 있다. 또한 해시값으로 저장되는 구조정보의 비교를 수행함으로써, 보다 빠르고 정확한 유해성 판단을 수행할 수 있다.According to this embodiment, the first harmful site is determined using the basic structure, and if it is determined to be a harmful site, the second harmful site is additionally judged using the floating structure information to prevent blocking errors for harmless sites as much as possible. can do. Additionally, by comparing structural information stored as a hash value, faster and more accurate hazard determination can be made.

여기서, 일례에 따르면, 유동성 있는 영역의 개수를 이용하여 각 유해사이트에 대한 메타데이터의 갱신을 위한 유동성 있는 영역의 재탐색 주기를 결정한다. 유동성 영역이 크거나 개수가 많을수록 웹사이트 자체의 구조변경이 수행될 확률이 높을 수 있음을 이용하여, 유해사이트의 구조변경에 보다 빨리 대응할 수 있다. 물론 이때 메타데이터가 변경된 것으로 인식되면, 기본구조 자체도 변경될 확률이 높으므로 이때에는 기본구조에 대한 변경여부를 더 확인한다. Here, according to one example, the number of flexible areas is used to determine the re-search cycle of the flexible area for updating metadata for each harmful site. By utilizing the fact that the larger the liquidity area or the greater the number, the higher the probability that a structural change to the website itself will occur, it is possible to respond more quickly to structural changes to harmful sites. Of course, if the metadata is recognized as changed at this time, there is a high probability that the basic structure itself will also change, so at this time, further check whether the basic structure has changed.

그리고, 일례에 따르면, 무해사이트에 대한 웹사이트 정보를 DB화(무해사이트DB라 칭함(미도시))하고, 이를 참조하여 기본구조정보와 동일한 무해사이트가 존재하는 경우에만 상술한 제2 유해사이트 여부판단을 수행할 수 있다. 즉, 대상웹사이트와 기본구조가 동일한 유해사이트에 대한 정보는 DB에 존재하나 무해사이트가 DB에 존재하지 않는 경우에는 제2 유해사이트 여부판단을 수행하지 않고 바로 대상웹사이트에 대해 유해사이트라 판단하는 것이다.And, according to one example, website information about harmless sites is created into a database (referred to as harmless site DB (not shown)), and only when a harmless site identical to the basic structure information exists by referring to this, the second harmful site described above is created. A judgment can be made. In other words, if information about a harmful site with the same basic structure as the target website exists in the DB, but a harmless site does not exist in the DB, the target website is immediately judged to be a harmful site without performing a second harmful site determination. It is done.

상술한 본 발명에 따른 파비콘을 이용한 불법·유해정보 사이트 차단 방법을 수행하도록 하는 컴퓨터-판독 가능 매체에 저장된 컴퓨터 프로그램이 제공될 수 있다. A computer program stored in a computer-readable medium may be provided that performs the method of blocking illegal and harmful information sites using a favicon according to the present invention described above.

또한, 상술한 파비콘을 이용한 불법·유해정보 사이트 차단 방법은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현되는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체로는 컴퓨터 시스템에 의하여 해독될 수 있는 데이터가 저장된 모든 종류의 기록 매체를 포함한다. 예를 들어, ROM(Read Only Memory), RAM(Random Access Memory), 자기 테이프, 자기 디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있을 수 있다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 통신망으로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 읽을 수 있는 코드로서 저장되고 실행될 수 있다. Additionally, the method of blocking illegal and harmful information sites using the favicon described above can be implemented as computer-readable code on a computer-readable recording medium. Computer-readable recording media include all types of recording media storing data that can be deciphered by a computer system. For example, there may be Read Only Memory (ROM), Random Access Memory (RAM), magnetic tape, magnetic disk, flash memory, optical data storage device, etc. Additionally, the computer-readable recording medium can be distributed to computer systems connected through a computer communication network, and stored and executed as code that can be read in a distributed manner.

또한, 상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.In addition, although the present invention has been described above with reference to preferred embodiments, those skilled in the art will understand the present invention without departing from the spirit and scope of the present invention as set forth in the claims below. You will understand that it can be modified and changed in various ways.

10 : 통신부
20 : 저장부
30 : 제어부
10: Department of Communications
20: storage unit
30: control unit

Claims (11)

불법·유해정보 사이트 차단 방법에 있어서,
접속 요청된 대상웹사이트의 파비콘을 취득하는 단계;
불법·유해정보 사이트들에 대한 정보를 구축한 유해사이트DB를 참조하여 상기 파비콘을 이용하여 상기 대상웹사이트의 유해사이트 여부를 판단하는 단계; 및
유해사이트가 아닌 경우 상기 대상웹사이트로의 접속을 허용하는 단계를 포함하되,
상기 파비콘의 취득이 실패되는 경우, 상기 대상웹사이트의 HTML 소스를 분석하여 기본구조정보를 취득하고, 상기 유해사이트DB를 참조하여 상기 기본구조정보와 동일한 유해사이트가 존재하는지를 검색함으로써 구조기반 유해사이트 여부 판단을 수행하며,
상기 유해사이트DB에는 각 유해사이트에 대해 유동성 있는 영역은 제외된 부동성구조정보를 추출할 수 있는 각각의 메타데이터 및 상기 부동성구조정보가 더 저장되며, 상기 구조기반 유해사이트 여부 판단 시 상기 대상웹사이트가 유해사이트라 판단되면, 상기 메타데이터를 이용하여 상기 대상웹사이트의 부동성구조정보를 추출하여 제2 구조기반 유해사이트 여부판단을 더 수행하는, 파비콘을 이용한 불법·유해정보 사이트 차단 방법.
In terms of blocking illegal and harmful information sites,
Obtaining a favicon of a target website to which access has been requested;
Determining whether the target website is a harmful site using the favicon by referring to a harmful site DB containing information on illegal and harmful information sites; and
Including the step of allowing access to the target website if it is not a harmful website,
If the acquisition of the favicon fails, the basic structure information is acquired by analyzing the HTML source of the target website, and the harmful site DB is referred to to search for the presence of a harmful site identical to the basic structure information to determine whether the structure-based harmful site exists. Perform a judgment on whether or not
The harmful site DB further stores each metadata and the floating structure information that can extract the floating structure information excluding the floating area for each harmful site, and when determining whether or not the structure is a harmful site, the target website is selected. If is determined to be a harmful site, a method of blocking illegal and harmful information sites using a favicon further performs a second structure-based determination of whether it is a harmful site by extracting the floating structure information of the target website using the metadata.
청구항 1에 있어서,
상기 파비콘에 대해 상기 대상웹사이트의 HTML 소스에서 탐색한 다운로드 주소를 이용하여 다운로드 받으며, 만일 상기 다운로드 주소가 없는 경우 루트 디렉토리에 파일을 호출하여 다운로드 받는, 파비콘을 이용한 불법·유해정보 사이트 차단 방법.
In claim 1,
A method of blocking illegal and harmful information sites using a favicon in which the favicon is downloaded using a download address found in the HTML source of the target website, and if the download address is not found, the file is downloaded by calling a file in the root directory.
청구항 1에 있어서,
상기 유해사이트 여부를 판단 시, 상기 파비콘의 원본 해시값을 이용하거나, 또는 미리 설정된 사이즈 또는 색상 중 적어도 어느 하나로 상기 파비콘을 변환한 이후의 해시값을 이용하는, 파비콘을 이용한 불법·유해정보 사이트 차단 방법.
In claim 1,
A method of blocking illegal and harmful information sites using a favicon, when determining whether the site is a harmful site, using the original hash value of the favicon or a hash value after converting the favicon to at least one of a preset size or color. .
삭제delete 청구항 1에 있어서,
상기 기본구조정보로서 상기 HTML의 <body> 태그 아래 2뎁스(depth) 내지 4 뎁스 중 어느 하나까지의 구조를 이용하는, 파비콘을 이용한 불법·유해정보 사이트 차단 방법.
In claim 1,
A method of blocking illegal and harmful information sites using a favicon, using a structure from 2 to 4 depths under the <body> tag of the HTML as the basic structure information.
삭제delete 청구항 1에 있어서,
미리 구축된 무해사이트DB를 참조하여 상기 기본구조정보와 동일한 무해사이트가 존재하는 경우에만 상기 제2 구조기반 유해사이트 여부판단을 수행하는, 파비콘을 이용한 불법·유해정보 사이트 차단 방법.
In claim 1,
A method of blocking illegal and harmful information sites using a favicon, which refers to a pre-built harmless site DB and determines whether a harmful site is based on the second structure only when a harmless site identical to the basic structure information exists.
파비콘을 이용한 불법·유해정보 사이트 차단 방법을 수행하도록 하는 컴퓨터-판독 가능 매체에 저장된 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램은 컴퓨터로 하여금 이하의 단계들을 수행하도록 하며, 상기 단계들은,
접속 요청된 대상웹사이트의 파비콘을 취득하는 단계;
불법·유해정보 사이트들에 대한 정보를 구축한 유해사이트DB를 참조하여 상기 파비콘을 이용하여 상기 대상웹사이트의 유해사이트 여부를 판단하는 단계; 및
유해사이트가 아닌 경우 상기 대상웹사이트로의 접속을 허용하는 단계를 포함하되,
상기 파비콘의 취득이 실패되는 경우, 상기 대상웹사이트의 HTML 소스를 분석하여 기본구조정보를 취득하고, 상기 유해사이트DB를 참조하여 상기 기본구조정보와 동일한 유해사이트가 존재하는지를 검색함으로써 구조기반 유해사이트 여부 판단을 수행하며,
상기 유해사이트DB에는 각 유해사이트에 대해 유동성 있는 영역은 제외된 부동성구조정보를 추출할 수 있는 각각의 메타데이터 및 상기 부동성구조정보가 더 저장되며, 상기 구조기반 유해사이트 여부 판단 시 상기 대상웹사이트가 유해사이트라 판단되면, 상기 메타데이터를 이용하여 상기 대상웹사이트의 부동성구조정보를 추출하여 제2 구조기반 유해사이트 여부판단을 더 수행하는, 컴퓨터-판독 가능 매체에 저장된 컴퓨터 프로그램.
A computer program stored in a computer-readable medium that performs a method of blocking illegal and harmful information sites using a favicon, wherein the computer program causes a computer to perform the following steps, which steps include:
Obtaining a favicon of a target website to which access has been requested;
Determining whether the target website is a harmful site using the favicon by referring to a harmful site DB containing information on illegal and harmful information sites; and
Including the step of allowing access to the target website if it is not a harmful website,
If acquisition of the favicon fails, the basic structure information is acquired by analyzing the HTML source of the target website, and the harmful site DB is referred to to search for the existence of a harmful site identical to the basic structure information to determine whether the structure-based harmful site exists. Perform a judgment on whether or not
The harmful site DB further stores each metadata and the floating structure information that can extract the floating structure information excluding the floating area for each harmful site, and when determining whether or not the structure is a harmful site, the target website is selected. If it is determined that is a harmful site, a computer program stored in a computer-readable medium further performs a second structure-based determination of whether it is a harmful site by extracting the floating structure information of the target website using the metadata.
사용자단말과 통신하기 위한 통신부;
불법·유해정보 사이트들에 대한 정보를 저장하는 저장부;
상기 사용자단말로부터 접속 요청된 대상웹사이트의 파비콘을 취득하는 정보추출부;
상기 저장부의 불법·유해정보 사이트들에 대한 정보를 기반으로 상기 파비콘을 이용하여 상기 대상웹사이트의 유해사이트 여부를 판단하는 유해판단부; 및
유해사이트가 아닌 경우에만 상기 대상웹사이트로의 접속을 허용하는 접속제어부를 포함하되,
상기 정보추출부는 상기 파비콘의 취득이 실패되는 경우, 상기 대상웹사이트의 HTML 소스를 분석하여 기본구조정보를 취득하며, 상기 유해판단부는 상기 저장부에 저장된 불법·유해정보 사이트들에 대한 정보를 참조하여 상기 기본구조정보와 동일한 유해사이트가 존재하는지를 검색함으로써 구조기반 유해사이트 여부 판단을 수행하며,
상기 불법·유해정보 사이트들에 대한 정보에는 각 유해사이트에 대해 유동성 있는 영역은 제외된 부동성구조정보를 추출할 수 있는 각각의 메타데이터 및 상기 부동성구조정보가 더 포함되며, 상기 유해판단부는 상기 구조기반 유해사이트 여부 판단 시 상기 대상웹사이트가 유해사이트라 판단되면 상기 메타데이터를 이용하여 상기 대상웹사이트의 부동성구조정보를 추출하여 제2 구조기반 유해사이트 여부판단을 더 수행하는, 파비콘을 이용한 불법·유해정보 사이트 차단 장치.
A communication unit for communicating with a user terminal;
A storage unit that stores information about illegal and harmful information sites;
an information extraction unit that acquires a favicon of a target website access requested from the user terminal;
a harmfulness determination unit that determines whether the target website is a harmful site using the favicon based on information about illegal and harmful information sites in the storage unit; and
Includes an access control unit that allows access to the target website only if it is not a harmful website,
If the acquisition of the favicon fails, the information extraction unit acquires basic structure information by analyzing the HTML source of the target website, and the harmfulness determination unit refers to information on illegal and harmful information sites stored in the storage unit. By searching for the existence of a harmful site identical to the above basic structure information, a decision is made on whether or not the site is a harmful site based on the structure.
The information about the illegal and harmful information sites further includes respective metadata and the floating structure information from which floating structure information excluding the floating area can be extracted for each harmful site, and the harmful judgment unit determines the structure. If the target website is determined to be a harmful site when determining whether it is a harmful site, the metadata is used to extract the floating structure information of the target website and further determine whether it is a harmful site based on the second structure. Illegal use of favicon · Harmful information site blocking device.
삭제delete 삭제delete
KR1020230099758A 2023-07-31 2023-07-31 Method and device for blocking illegal and harmful information sites using favicon KR102617515B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020230099758A KR102617515B1 (en) 2023-07-31 2023-07-31 Method and device for blocking illegal and harmful information sites using favicon

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020230099758A KR102617515B1 (en) 2023-07-31 2023-07-31 Method and device for blocking illegal and harmful information sites using favicon

Publications (1)

Publication Number Publication Date
KR102617515B1 true KR102617515B1 (en) 2023-12-27

Family

ID=89377586

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020230099758A KR102617515B1 (en) 2023-07-31 2023-07-31 Method and device for blocking illegal and harmful information sites using favicon

Country Status (1)

Country Link
KR (1) KR102617515B1 (en)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080052097A (en) * 2006-12-07 2008-06-11 한국전자통신연구원 Harmful web site filtering method and apparatus using web structural information
KR20100022281A (en) * 2008-08-19 2010-03-02 주식회사 엘지텔레콤 Wireless internet service system for blocking access to harmful site and method thereof
CN110474889A (en) * 2019-07-26 2019-11-19 湖北乾智科技有限公司 One kind being based on the recognition methods of web graph target fishing website and device
KR20220080691A (en) * 2020-12-07 2022-06-14 주식회사 앰진시큐러스 Method for analyzing a similarity of a website based on a menu structure
US11528297B1 (en) * 2019-12-12 2022-12-13 Zimperium, Inc. Mobile device security application for malicious website detection based on representative image
KR20230059015A (en) 2021-10-25 2023-05-03 주식회사 투링크 System for blocking harmful site and method thereof

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080052097A (en) * 2006-12-07 2008-06-11 한국전자통신연구원 Harmful web site filtering method and apparatus using web structural information
KR20100022281A (en) * 2008-08-19 2010-03-02 주식회사 엘지텔레콤 Wireless internet service system for blocking access to harmful site and method thereof
CN110474889A (en) * 2019-07-26 2019-11-19 湖北乾智科技有限公司 One kind being based on the recognition methods of web graph target fishing website and device
US11528297B1 (en) * 2019-12-12 2022-12-13 Zimperium, Inc. Mobile device security application for malicious website detection based on representative image
KR20220080691A (en) * 2020-12-07 2022-06-14 주식회사 앰진시큐러스 Method for analyzing a similarity of a website based on a menu structure
KR20230059015A (en) 2021-10-25 2023-05-03 주식회사 투링크 System for blocking harmful site and method thereof

Similar Documents

Publication Publication Date Title
CN108206802B (en) Method and device for detecting webpage backdoor
KR100619178B1 (en) Method and apparatus for detecting invalid clicks on the internet search engine
CN107204960B (en) Webpage identification method and device and server
US9218482B2 (en) Method and device for detecting phishing web page
US8972856B2 (en) Document modification by a client-side application
CN109768992B (en) Webpage malicious scanning processing method and device, terminal device and readable storage medium
CN107257390B (en) URL address resolution method and system
CN110430188B (en) Rapid URL filtering method and device
KR20140014132A (en) Methods and systems for providing content provider-specified url keyword navigation
CN107786537B (en) Isolated page implantation attack detection method based on Internet cross search
CN108900554B (en) HTTP asset detection method, system, device and computer medium
CN113905275B (en) Webpage filtering method and intelligent device
EP3745292A1 (en) Hidden link detection method and apparatus for website
CN113055399A (en) Attack success detection method, system and related device for injection attack
CN108494728B (en) Method, device, equipment and medium for creating blacklist library for preventing traffic hijacking
CN114650176A (en) Phishing website detection method and device, computer equipment and storage medium
CN112637361A (en) Page proxy method, device, electronic equipment and storage medium
KR100886246B1 (en) Method and System for Providing Search Result
US9584537B2 (en) System and method for detecting mobile cyber incident
US20070027918A1 (en) Mail processing server, mail processing method, and mail processing program
CN116319089B (en) Dynamic weak password detection method, device, computer equipment and medium
KR102617515B1 (en) Method and device for blocking illegal and harmful information sites using favicon
KR102595595B1 (en) Method and device for blocking illegal and harmful information sites using website structure information
JP4807364B2 (en) Information management device
KR102631473B1 (en) Method and device for blocking illegal and harmful information sites using website source analysis

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant