KR102613260B1 - System for Integrating and Providing E-Commerce Data - Google Patents
System for Integrating and Providing E-Commerce Data Download PDFInfo
- Publication number
- KR102613260B1 KR102613260B1 KR1020230032341A KR20230032341A KR102613260B1 KR 102613260 B1 KR102613260 B1 KR 102613260B1 KR 1020230032341 A KR1020230032341 A KR 1020230032341A KR 20230032341 A KR20230032341 A KR 20230032341A KR 102613260 B1 KR102613260 B1 KR 102613260B1
- Authority
- KR
- South Korea
- Prior art keywords
- data
- commerce
- unit
- model
- natural language
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract description 56
- 230000010354 integration Effects 0.000 claims description 30
- 238000013145 classification model Methods 0.000 claims description 17
- 238000007405 data analysis Methods 0.000 claims description 9
- 230000002452 interceptive effect Effects 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 6
- 238000002372 labelling Methods 0.000 claims description 6
- 230000002547 anomalous effect Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 239000000047 product Substances 0.000 description 24
- 230000000694 effects Effects 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000013500 data storage Methods 0.000 description 3
- 230000003796 beauty Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000012517 data analytics Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000010291 electrical method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9038—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
본 개시는 이커머스 데이터 통합 제공 시스템에 관한 것이다.This disclosure relates to an e-commerce data integrated provision system.
이 부분에 기술된 내용은 단순히 배경 정보를 제공할 뿐 종래기술을 구성하는 것은 아니다.The content described in this section simply provides background information and does not constitute prior art.
이커머스 시장의 사업자는 자체 판매 채널뿐 아니라, 여러 사업자의 상품을 한 데 모아 판매하는 채널을 통해서도 상품을 판매하고 있다. 그에 따라, 동일한 상품이 다양한 채널에서, 상품명이나 세부 상품 정보를 달리하거나, 가격을 달리하거나 묶음 판매되는 등 판매방식을 달리하여 분산 판매되고 있다. 뿐만 아니라, 이러한 판매 채널은 시간과 사용자에 따라 일시적으로 생성되었다 사라지기도 하는 등, 다양한 유형으로 개발되고 있다. 그 결과, 이커머스 사업자는 다양한 채널에서 분산되어 발생하는 이커머스 데이터를 수집, 활용하는 데 어려움을 겪고 있다.Businesses in the e-commerce market sell products not only through their own sales channels, but also through channels that collect and sell products from multiple businesses. Accordingly, the same product is being distributed and sold in various channels through different sales methods, such as different product names or detailed product information, different prices, or bundled sales. In addition, these sales channels are being developed in various types, such as temporary creation and disappearance depending on time and users. As a result, e-commerce businesses are having difficulty collecting and utilizing e-commerce data distributed across various channels.
또한, 이커머스 사업자는 수입을 늘리기 위하여, 각 판매 채널에 광고 툴을 적용하거나, 유저 행동 분석 툴을 더 이용하는 등, 여러가지 부가 솔루션을 더 이용할 수 있다. 그러나, 효과적인 광고 및/또는 유저 행동 분석이 되기 위하여는, 이러한 부가 솔루션들을 비롯하여, 다양한 채널로부터 발생하는 이커머스 데이터를 통합적으로 수집, 분석할 필요가 있다. 또한 다양한 채널로부터 수집되는 데이터들을 유의미한 방식으로 시각화하여, 제공할 필요가 있다.Additionally, to increase revenue, e-commerce businesses can use various additional solutions, such as applying advertising tools to each sales channel or using more user behavior analysis tools. However, in order to effectively analyze advertising and/or user behavior, it is necessary to comprehensively collect and analyze e-commerce data generated from various channels, including these additional solutions. Additionally, there is a need to visualize and provide data collected from various channels in a meaningful way.
본 개시는 다양한 채널로부터 발생하는 다양한 유형의 이커머스 데이터를 통합하여 제공하는 시스템을 제공하는 것을 목적으로 한다.The purpose of this disclosure is to provide a system that integrates and provides various types of e-commerce data generated from various channels.
본 개시의 일 측면에 의하면, 하나 이상의 채널로부터 이커머스 데이터를 수집하여 저장하되, 빈 데이터를 추론하여 저장하는 장치 및 방법을 제공할 수 있다.According to one aspect of the present disclosure, an apparatus and method can be provided for collecting and storing e-commerce data from one or more channels, but inferring and storing empty data.
본 개시의 일 측면에 의하면, 자연어 텍스트의 질의를 입력받아 질의에 대한 답을 획득하기 위한 쿼리문과 답을 출력하는 방식을 추론하여, 질의에 대응하는 결과 데이터를 출력 방식과 함께 제공할 수 있다.According to one aspect of the present disclosure, it is possible to receive a query of a natural language text, infer a query statement for obtaining an answer to the query, and a method for outputting the answer, and provide result data corresponding to the query along with an output method.
본 발명이 해결하고자 하는 과제들은 이상에서 언급한 과제들로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.The problems to be solved by the present invention are not limited to the problems mentioned above, and other problems not mentioned can be clearly understood by those skilled in the art from the description below.
본 개시의 일 측면에 의하면, 데이터부; 하나 이상의 채널로부터 이커머스 데이터를 수집하여 상기 데이터부에 기 설정된 포맷으로 저장시키는, 수집부; 상기 기 설정된 포맷의 빈(empty) 데이터를 추론하도록 기 학습된 상품 분류 모델을 이용하여, 수집된 이커머스 데이터의 빈 데이터를 추론하고 라벨링하여 상기 데이터부에 저장시키는, 분류부; 사용자 단말로부터 자연어 형식의 요청을 입력받는, 입력부; 및 자연어 텍스트의 질의를 입력받아 질의에 대한 답을 획득하기 위한 쿼리문과 답을 출력하는 방식을 추론하도록 기 학습된 대화형 데이터 분석 모델을 이용하여, 상기 자연어 형식의 요청에 대응하는 결과 데이터와 상기 결과 데이터를 출력 방식을 제공하는, 제공부를 포함하는, 이커머스 데이터 통합 제공 장치 제공한다.According to one aspect of the present disclosure, a data unit; a collection unit that collects e-commerce data from one or more channels and stores it in a preset format in the data unit; a classification unit for inferring and labeling empty data of the collected e-commerce data using a product classification model previously learned to infer empty data of the preset format and storing the label in the data unit; An input unit that receives a request in natural language form from a user terminal; And by using an interactive data analysis model that has already been learned to infer a method of receiving a query in a natural language text and outputting a query statement and an answer to obtain an answer to the query, result data corresponding to the request in natural language format and the An e-commerce data integration provision device is provided, including a provision unit that provides a method for outputting result data.
본 개시의 일 측면에 의하면, 이커머스 데이터 통합 제공 장치가 이커머스 데이터를 통합하여 제공하는 방법에 있어서,According to one aspect of the present disclosure, in a method for an e-commerce data integration providing device to integrate and provide e-commerce data,
하나 이상의 채널로부터 이커머스 데이터를 수집하여 데이터부에 기 설정된 포맷으로 저장하는 과정;A process of collecting e-commerce data from one or more channels and storing it in a preset format in the data unit;
상기 기 설정된 포맷의 빈(empty) 데이터를 추론하도록 기 학습된 상품 분류 모델을 이용하여, 수집된 이커머스 데이터의 빈 데이터를 추론하고 라벨링하여 데이터부에 저장하여, 데이터부를 구성하는 과정; 사용자 단말로부터 자연어 형식의 요청을 입력받는 과정; 자연어 텍스트의 질의를 입력받아 질의에 대한 답을 획득하기 위한 쿼리문과 답을 출력하는 방식을 추론하도록 기 학습된 대화형 데이터 분석 모델을 이용하여, 자연어 형식의 요청에 대응하는 쿼리문과 답을 출력하는 방식을 추론하는 과정; 및 추론된 쿼리문을 구성된 데이터부에 적용함으로써, 결과 데이터와 결과 데이터를 출력하는 방식을 제공하는 과정을 포함하는, 이커머스 데이터 통합 제공 방법 제공한다.A process of inferring and labeling empty data of the collected e-commerce data using a product classification model previously learned to infer empty data of the preset format and storing the data in the data unit, thereby configuring the data unit; A process of receiving a request in natural language form from a user terminal; It outputs query statements and answers corresponding to requests in natural language format by using an interactive data analysis model that has already been learned to infer how to input queries in natural language text and output query statements and answers to obtain answers to the questions. the process of inferring a method; and a process of providing result data and a method for outputting the result data by applying the inferred query statement to the configured data unit.
본 개시의 일 측면에 의하면, 전술한 상품 분류 모델은, 데이터부에 저장된 이커머스 데이터로부터 추론에 사용되기 위한 필수 데이터를 추출하고, 특정 속성에 해당하는 데이터를 토큰화하여, 추출된 필수 데이터와 토큰을 이용하여 입력되는 이커머스 데이터로부터 특징(feature)을 추출하고, 생성된 특징으로부터 빈 데이터를 추론하는, 이커머스 데이터 통합 제공 방법 및/또는 장치를 제공한다.According to one aspect of the present disclosure, the above-described product classification model extracts essential data to be used for inference from e-commerce data stored in the data unit, tokenizes data corresponding to specific attributes, and combines the extracted essential data and Provides a method and/or device for providing integrated e-commerce data that extracts features from e-commerce data input using tokens and infers empty data from the generated features.
본 개시의 일 측면에 의하면, 전술한 이커머스 데이터 통합 제공 방법을 수행하는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체 및/또는 전술한 방법의 각 과정을 실행시키기 위하여 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터 프로그램을 제공한다.According to one aspect of the present disclosure, a computer-readable recording medium recording a program for performing the above-described e-commerce data integration method and/or a computer-readable recording medium for executing each process of the above-described method. Provides stored computer programs.
본 개시의 일 측면에 의하면, 하나 이상의 채널에 분산되어 있는 이커머스 정보들을 통합하여 제공하는 효과가 있다.According to one aspect of the present disclosure, there is an effect of providing integrated e-commerce information distributed in one or more channels.
본 개시의 일 측면에 의하면, 통합된 이커머스 정보들 중 빈 속성정보를 적절히 추론하는 효과가 있다.According to one aspect of the present disclosure, there is an effect of appropriately inferring empty attribute information among integrated e-commerce information.
본 개시의 일 측면에 의하면, 자연어를 입력받아, 통합된 이커머스 정보들로부터 입력된 자연어에 대응하는 결과 데이터를, 결과 데이터를 출력하는 적절한 방식과 함께 제공하는 효과가 있다.According to one aspect of the present disclosure, there is an effect of receiving natural language as input and providing result data corresponding to the natural language input from integrated e-commerce information together with an appropriate method of outputting the result data.
본 개시의 다양한 실시예에 따른 이커머스 데이터 통합 제공 장치 및 방법의 효과들은 이상에서 언급한 효과들에 한하지 않고, 이 분야 통상의 기술자가 본 개시의 대시보드 시스템의 효과로서 착안할 수 있는 효과를 포함한다.The effects of the e-commerce data integration providing device and method according to various embodiments of the present disclosure are not limited to the effects mentioned above, and are effects that a person skilled in the art may consider as the effect of the dashboard system of the present disclosure. Includes.
도 1은 본 개시의 일 실시예에 따른 이커머스 데이터 통합 제공 시스템을 나타내는 개념도이다.
도 2는 본 개시의 일 실시예에 따른 이커머스 데이터 통합 제공 장치를 나타내는 블록도이다.
도 3은 본 개시의 일 실시예에 따른 데이터부의 데이터 저장 포맷의 예시도이다.
도 4는 본 개시의 일 실시예에 따른 이커머스 데이터 통합 제공 방법을 나타내는 흐름도이다.
1 is a conceptual diagram showing an e-commerce data integrated provision system according to an embodiment of the present disclosure.
Figure 2 is a block diagram showing an e-commerce data integration provision device according to an embodiment of the present disclosure.
Figure 3 is an exemplary diagram of a data storage format of the data unit according to an embodiment of the present disclosure.
Figure 4 is a flowchart showing a method for providing integrated e-commerce data according to an embodiment of the present disclosure.
이하에서는, 본 개시의 실시예들을 예시적 도면을 이용하여 설명하나, 이러한 실시예 및 도면은 본 개시를 설명하기 위한 것일뿐 청구범위를 한정하지 않는다. 한편, 본 개시의 설명과 관련하여, 공지된 구성이나 기능에 대하여는 상세한 설명을 생략할 수 있다.Hereinafter, embodiments of the present disclosure will be described using exemplary drawings, but these embodiments and drawings are only for illustrating the present disclosure and do not limit the scope of the claims. Meanwhile, in relation to the description of the present disclosure, detailed descriptions of well-known structures or functions may be omitted.
또한, 본 개시의 구성 요소, 기능, 효과 등을 설명하는 데 있어서, 제1, 제2, a, b, A, B, 1), 2) 등의 용어를 사용할 수 있으나, 이는 각 구성 요소를 구별하기 위한 것으로 해당 구성 요소의 본질이나 차례 또는 순서 등을 한정하지 않는다.In addition, in describing the components, functions, effects, etc. of the present disclosure, terms such as first, second, a, b, A, B, 1), 2) may be used, but this refers to each component. It is intended for distinction and does not limit the nature, order, or order of the components in question.
또한, 명세서에 기재된 '인터페이스', '시스템', '플랫폼', '장치', '부', '모듈' 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.In addition, terms such as 'interface', 'system', 'platform', 'device', 'part', and 'module' used in the specification refer to a unit that processes at least one function or operation, which is hardware or software. Alternatively, it may be implemented through a combination of hardware and software.
한편, 본 개시의 다양한 구성 요소, 모듈, 부, 장치, 인터페이스, 시스템 등은 컴퓨터 하드웨어, 소프트웨어, 애플리케이션 및/또는 이들의 조합으로 구현될 수 있고, 이러한 다양한 구현예들은 프로그래밍 가능한 시스템상에서 실행 가능한 하나 이상의 컴퓨터 프로그램들로 구현되는 것을 포함할 수 있다.Meanwhile, various components, modules, units, devices, interfaces, systems, etc. of the present disclosure may be implemented as computer hardware, software, applications, and/or combinations thereof, and these various implementations may be executable on a programmable system. It may include implementation of the above computer programs.
본 개시의 도면 및 도면부호는, 본 개시의 실시예들을 설명하기 위한 것이고, 본 개시가 실시될 수 있는 유일한 실시형태를 나타내는 것은 아니다.The drawings and reference numerals of the present disclosure are for explaining embodiments of the present disclosure and do not represent the only embodiments in which the present disclosure may be practiced.
본 개시의 이커머스 데이터 통합 제공 방법은, 이커머스 데이터 통합 제공 장치에 의해 실행되고, 이커머스 데이터 통합 제공 장치는 컴퓨팅 디바이스 상에서 실행된다. 이커머스 데이터 통합 제공 장치는, 컴퓨팅 디바이스가 가용할 수 있는 하나 이상의 프로세서에 의해 각 기능을 수행하고, 이러한 프로세서와 연결되어 내부에 저장된 명령어들을 가지는 컴퓨터 판독가능 스토리지를 포함한다. 이때 ‘포함’이란 구성 간 물리적으로 연결된 것뿐만 아니라, 통신 수단에 의해 네트워크적으로 연결된 것을 의미할 수도 있다.The e-commerce data integration providing method of the present disclosure is executed by an e-commerce data integration providing apparatus, and the e-commerce data integration providing apparatus is executed on a computing device. The e-commerce data integration provision device performs each function by one or more processors available to the computing device, and includes computer-readable storage connected to the processor and having instructions stored therein. In this case, ‘inclusion’ may mean not only physical connection between components, but also network connection through communication means.
도 1은 본 개시의 일 실시예에 따른 이커머스 데이터 통합 제공 시스템을 나타내는 개념도이다.1 is a conceptual diagram showing an e-commerce data integrated provision system according to an embodiment of the present disclosure.
본 개시의 일 실시예에 따른 이커머스 데이터 통합 제공 시스템은, 이커머스 데이터(예: 상품에 관한 데이터, 주문서, 결제 결과, 광고 지표 등)를 수집하기 위한 채널(10), 채널(10)로부터 이커머스 데이터를 수집하여 데이터를 통합, 분석 및 저장하는 이커머스 데이터 통합 제공 장치(20) 및 이커머스 데이터 통합 제공 장치(20)에 특정 요청(request)을 전달하여 대응하는 결과 정보를 획득하는 사용자 단말(30)로 구성될 수 있다. 이때 채널(10), 이커머스 데이터 통합 제공 장치(20) 및 사용자 단말(30) 각각의 연결은, 각각을 엔드포인트로 하는 하나 이상의 네트워크를 통해 연결되는 것은 물론, 전기적인 방법에 의해 물리적으로 연결된 것일 수도 있다.The e-commerce data integrated provision system according to an embodiment of the present disclosure includes a
채널(10)은 사용자가 저장 및 관리하는 파일, 사용자의 상품을 판매하기 위한 채널(예: 오픈마켓 플랫폼, 자사 플랫폼, 입점한 이커머스 플랫폼 등), 사용자가 채널을 관리/이용하기 위해 적용하는 툴(예: 주문수집 솔루션, 이지어드민 솔루션, 퍼스트 파티 데이터 분석 솔루션 등), 및/또는 사용자가 수익을 극대화하기 위해 사용하는 채널/툴(예: 광고 채널, SNS, 리테일 미디어 솔루션, 디스플레이 광고 솔루션, 검색 광고 솔루션 등) 등일 수 있다. 이커머스 데이터 통합 제공 장치(20)는 각 채널에 맞는 방식에 따라 다양한 형식의 이커머스 데이터들을 수집한다. 예컨대, API 연결, 크롤링, 스크래핑 등의 방식을 이용하여 데이터들을 수집할 수 있으며, 이때 수집된 이커머스 데이터의 포맷은 JSON, Text, API response 등 각 채널이 제공하는 방식에 의한다.Channel 10 includes files stored and managed by the user, channels for selling the user's products (e.g. open market platform, company platform, e-commerce platform in store, etc.), and information applied by the user to manage/use the channel. tools (e.g. order collection solutions, easyadmin solutions, first party data analytics solutions, etc.), and/or channels/tools used by users to maximize revenue (e.g. advertising channels, social media, retail media solutions, display advertising solutions, etc.) , search advertising solutions, etc.). The e-commerce data
여러 채널로부터 다양한 형식의 데이터를 가져오는 경우에 이커머스 데이터 통합 제공 장치(20)는 수집된 이커머스 데이터들을, 저장 및 데이터 처리가 가능한 방식으로 전처리하여 저장할 수 있다. 이러한 전처리에는 정형화 엔진이 이용될 수 있다. 정형화 엔진은 예컨대, 다양한 포맷의 데이터들을, 열데이터와 행데이터로 구성된 테이블에 저장될 수 있는 tabular 포맷으로 가공 및 저장시키는 엔진일 수 있다. 또는, 정형화 엔진은 예컨대, 다양한 포맷의 데이터들을 Key-Value 포맷, document 포맷, wide-column 포맷, graph 포맷으로 가공 및 저장시키는 엔진일 수 있다.When fetching data in various formats from multiple channels, the e-commerce data
한편, 사용자 단말(30)은 이커머스 데이터 통합 제공 장치(20)로부터 이커머스 데이터가 통합된 결과 데이터/정보를 제공받는다. 이때, 이커머스 데이터 통합 제공 장치(20)는 통합된 결과 데이터를 시각화하기 위한 적절한 포맷 정보를 함께 제공하여, 사용자 단말(30)이 적절한 방식으로 결과 데이터를 출력하게 할 수 있다. 이커머스 데이터 통합 제공 장치(20)는 사용자 단말(30)에 의해 입력받거나 사용자 단말(30)에 의해 생성된 자연어 형식의 요청을 자연어 처리하여, 사용자가 직접 쿼리문(query)을 입력하지 않고도 적절한 결과 데이터를 확인할 수 있게 할 수 있다. 여기서 자연어 형식의 요청은, 자연어 텍스트, 자연어 음성 등의 정보를 포함하는 요청일 수 있다.Meanwhile, the user terminal 30 receives data/information resulting from the integration of e-commerce data from the e-commerce data
도 2는 본 개시의 일 실시예에 따른 이커머스 데이터 통합 제공 장치를 나타내는 블록도이다.Figure 2 is a block diagram showing an e-commerce data integration provision device according to an embodiment of the present disclosure.
본 개시의 일 실시예에 따른 이커머스 데이터 통합 제공 장치(20)는 데이터부(200), 수집부(220), 분류부(240), 입력부(260) 및 제공부(280)를 전부 또는 일부 포함한다. 수집부(220)는 각 채널로부터 이커머스 데이터를 수집하여 데이터부(200)에 저장시키고, 분류부(240)는 저장된 이커머스 데이터 중 빈(empty) 데이터를 추론하여 해당 이커머스 데이터의 정보로서 저장한다. 이커머스 데이터 통합 제공 장치(20)는 입력부(260)를 통해 사용자 단말로부터 자연어 형식의 요청을 입력받고, 제공부(280)는 데이터부(200)의 데이터로부터, 요청에 대한 결과 데이터를 획득하되, 결과 데이터를 출력하는 방식을 함께 획득한다. 본 개시의 이커머스 데이터 통합 제공 장치(20)는 다양한 실시예에 따라, 도 2가 도시하는 구성 요소의 일부가 변경, 삭제되거나 새로운 구성 요소가 더 포함된 것일 수 있다.The e-commerce data integrated
한편, 도 2에 도시된 이커머스 데이터 통합 제공 장치(20)는 장치에 한하지 않고, 각 구성(200 내지 280)의 기능을 수행하는 소프트웨어 모듈 또는 프로세서로 구현될 수도 있다.Meanwhile, the e-commerce data
수집부(220)는 하나 이상의 채널로부터 이커머스 데이터를 수집하고, 데이터부(200)에 기설정된 포맷으로 이커머스 데이터를 저장시킨다.The collection unit 220 collects e-commerce data from one or more channels and stores the e-commerce data in the
분류부(240)는 기설정된 포맷의 빈(empty) 데이터를 추론하도록 기 학습된 상품 분류 모델을 이용하여, 수집된 이커머스 데이터의 빈 데이터를 추론한다. 분류부(240)는 추론된 빈 데이터의 전부 또는 일부로서 해당 이커머스 데이터를 라벨링하여 데이터부(200)에 저장시킨다. 이러한 라벨링은, 통합된 이커머스 데이터로부터 사용자(예: 이커머스 사업자)가 제공받고 싶어하는 결과 데이터를 획득하기 위한 속성 정보로 라벨링되는 것일 수 있다. 예컨대, 이커머스 사업자는 이커머스 데이터를 통합하여 상품군별 지표(예: 매출, 공헌이익 등) 또는 브랜드별 지표를 제공받고 싶어할 수 있다. 그에 따라 상품 분류 모델은 추론된 특징(들)을 기초로 빈 데이터로서, ‘상품군’ 및/또는 ‘브랜드’를 추론하고, 추론된 상품군 및/또는 브랜드를 해당 이커머스 데이터에 레이블링 할 수 있다.The
한편, 데이터부(200)에 이커머스 데이터가 최초 저장될 때의 기설정된 포맷에는 레이블링하려는 속성이 포함되지 않을 수 있다. 즉, 상품 분류 모델은 분류부(240)는 추출된 특징으로부터 레이블링하려는 속성정보를 추론(새롭게 생성)할 수 있다. 이 경우에 분류부(240)는 레이블링하려는 속성을 데이터부(200)가 새로이 생성하도록 하고, 추론된 속성정보를 저장시킬 수 있다. 이로써, 본 개시의 일 실시예에 따른 이커머스 데이터 통합 제공 장치(20)는, 사용자가 요청하는 정보에 따라 이커머스 데이터를 적절한 속성으로 레이블링할 수 있다.Meanwhile, the preset format when e-commerce data is first stored in the
상품 분류 모델은, 데이터부(200)에 저장된 이커머스 데이터로부터 추론에 사용되기 위한 필수 데이터를 추출하고, 특정 속성에 해당하는 데이터들을 토큰화하여, 추출된 필수 데이터와 토큰을 이용하여 입력되는 이커머스 데이터로부터 특징(feature)을 추출하고, 생성된 특징으로부터 빈 데이터를 추론할 수 있다.The product classification model extracts essential data to be used for inference from the e-commerce data stored in the
도 3은 본 개시의 일 실시예에 따른 데이터부의 데이터 저장 포맷의 예시도이다.Figure 3 is an exemplary diagram of a data storage format of the data unit according to an embodiment of the present disclosure.
도 3은 데이터부(200)가 이커머스 데이터를 tabular 형식으로 저장하는 경우, 열데이터와 행데이터를 이용하여, 이커머스 데이터의 빈 열데이터를 추론하는 예시를 나타낸다. 이 경우에 상품 분류 모델은, 특정 속성에 해당하는 데이터로서 열데이터를 토큰화하여, 특징을 추출하는데 이용할 수 있다.Figure 3 shows an example of inferring empty column data of e-commerce data using column data and row data when the
도 3을 참조하면, 도 3에는 6개의 행데이터와, 4개의 열데이터를 확인할 수 있다. 각 행데이터는 4개의 속성정보를 열데이터로서 가질 수 있다.Referring to FIG. 3, 6 row data and 4 column data can be confirmed in FIG. 3. Each row data can have four attribute information as column data.
다섯번째 행데이터의 빈 데이터(도 3의 (a), (b))를 추론하기 위하여, 상품 분류 모델은 ‘brand_name’ 속성의 열데이터들과 ‘category’속성의 열데이터들을 동시 또는 이시에 토큰화하여, 빈 데이터들을 각각 추론할 수 있다.In order to infer the empty data of the fifth row data ((a) and (b) in Figure 3), the product classification model uses the column data of the 'brand_name' attribute and the column data of the 'category' attribute at the same time or at the same time as the token. In this way, each empty data can be inferred.
또는 상품 분류 모델은 다섯번째 행데이터 중 ‘company_name’이 동일한 행데이터들을 필수 데이터로서 추출하고, 추출된 행데이터들의 열데이터를 토큰화하여 빈 데이터들을 추론할 수 있다. 도 3의 다섯번째 행데이터의 경우, ‘A컴퍼니’를 ‘company_name’으로 가지므로, 상품 분류 모델은, ‘A컴퍼니’에 해당하는 모든 행데이터를 추출하고, 추출된 행데이터들의 ‘brand_name’에 해당하는, ‘아뜨랑’, ‘뷰티페미닌’을 토큰화한다. 상품 분류 모델은 ‘company_name’, ‘brand_name’, ‘channel_name’, ‘product_name’, ‘category’ 등 열데이터의 전부 또는 일부를 이용하여 다섯번째 행데이터의 ‘brand_name’ 값을 추론한다. 구체적인 추론방법은 상품 분류 모델이 학습된 방식, 행데이터가 가지는 속성 정보들에 따라 다를 수 있다. 도 3의 예시에서는 ‘channel_name’과 ‘product_name’ 각각의 유사성에 기초하여, ‘brand_name’을 ‘뷰티페미닌’으로 추론할 수 있다.Alternatively, the product classification model can extract row data with the same ‘company_name’ among the fifth row data as essential data and tokenize the column data of the extracted row data to infer empty data. In the case of the fifth row data in Figure 3, since it has 'A Company' as 'company_name', the product classification model extracts all row data corresponding to 'A Company' and adds 'brand_name' to the extracted row data. Tokenize the corresponding ‘Atrang’ and ‘Beauty Feminine’. The product classification model uses all or part of the column data such as ‘company_name’, ‘brand_name’, ‘channel_name’, ‘product_name’, and ‘category’ to infer the ‘brand_name’ value of the fifth row data. The specific inference method may vary depending on how the product classification model was learned and the attribute information contained in the row data. In the example of Figure 3, based on the similarity between ‘channel_name’ and ‘product_name’, ‘brand_name’ can be inferred as ‘Beauty Feminine’.
도 3의 다섯번째 행데이터 및 여섯번째 행데이터의 ‘category’ 열데이터(도 3의 (b) 및 (c))는, ‘channel_name’, ‘product_name’, ‘brand_name’ 각각의 유사성을 고려할 때, ‘A컴퍼니’ 행데이터들의 열데이터들로부터 추론하기에는 정확도가 떨어질 수 있다. 즉, 상품 분류 모델의, 빈 데이터를 추론하기 위한 필수 데이터 추출방식은, 빈 데이터가 속한 속성에 따라 달라질 수 있다.Considering the similarity of 'channel_name', 'product_name', and 'brand_name', the 'category' column data ((b) and (c) of Figure 3) of the fifth and sixth row data of Figure 3 is, Inferring from the column data of 'Company A' row data may be less accurate. In other words, the required data extraction method for inferring empty data in the product classification model may vary depending on the attribute to which the empty data belongs.
입력부(260)는 사용자 단말로부터 자연어 형식의 요청을 입력받는다. 이러한 자연어 형식의 요청은, 사용자 단말이 사용자로부터 입력받은 자연어 텍스트/음성을 포함하거나, 또는 사용자 단말이 사용자 입력(예: 명령 선택, 노코드 오브젝트의 배열 등)을 기초로 생성한 자연어 텍스트를 포함할 수 있다.The
제공부(280)는 자연어 텍스트의 질의를 입력받아 질의에 대한 답을 획득하기 위한 쿼리문과 답을 출력하는 방식을 추론하도록 기 학습된 대화형 데이터 분석 모델을 이용하여, 입력받은 자연어 형식의 요청에 대응하는 결과 데이터와 결과 데이터를 출력하는 방식을 제공한다. 이러한 제공은, 이커머스 데이터 통합 제공 장치(20) 내부에 제공하는 것은 물론, 사용자 단말에 제공하는 것일 수도 있다.The
대화형 데이터 분석 모델은, 자연어 텍스트 질의를 자연어 처리하여 상기 기 설정된 포맷의 데이터들로부터 답을 획득하기 위한 쿼리문을 생성하도록 기 학습된 제1모델 및/또는 자연어 텍스트 질의에 답을 출력하는 방식을 레이블링한 데이터셋을 이용하여 튜닝된 트랜스포머 모델인 제2모델을 포함할 수 있다. 그러나, 이러한 제2모델은 반드시 트랜스포머 모델에 기초하지 않고, 자연어 텍스트 질의를 입력받아 적절한 답 출력 방식을 추론하기 위하여는, 어떠한 네트워크 구조나, 어떠한 학습 방법에 의해서도 본 개시의 제2모델이 될 수 있다.The interactive data analysis model processes natural language text queries in natural language and outputs answers to first models and/or natural language text queries that have been previously learned to generate queries to obtain answers from data in the preset format. It may include a second model, which is a transformer model tuned using a labeled dataset. However, this second model is not necessarily based on the transformer model, and the second model of the present disclosure can be used using any network structure or any learning method to receive a natural language text query and infer an appropriate answer output method. there is.
제1모델이 생성하는 쿼리문은, 데이터부(200)의 데이터 저장 방식에 따라, SQL 문이거나 UnQL 문일 수 있다. 예컨대, 데이터부(200)가 관계형 데이터베이스 특징을 가지는 경우에 제1모델은 SQL 문을 생성할 수 있다.The query statement generated by the first model may be an SQL statement or an UnQL statement, depending on the data storage method of the
<표1>은 제2모델을 튜닝하는 데 이용되는 데이터셋의 예시이다.<Table 1> is an example of the dataset used to tune the second model.
<표1>을 참조하면, 제2모델은 예컨대, ‘How do customer demographics affect sales?’라는 질의, 또는 이와 유사도가 높은 질의들에 대하여는, demographic 정보를 x축으로, sales 정보를 y 축으로 하는 scatter plot을 결과 데이터 출력 방식으로서 출론하도록 튜닝된 트랜스포머 모델일 수 있다.Referring to <Table 1>, the second model, for example, for the query ‘How do customer demographics affect sales?’ or queries with a high degree of similarity, uses demographic information as the x-axis and sales information as the y-axis. It may be a transformer model tuned to use a scatter plot as a result data output method.
1
One
Q: What is the average sales per region?
A: {type: ‘bar-chart’, x-axis: ‘region’, y-axis: ‘average_sales’}
Q: What is the average sales per region?
A: {type: 'bar-chart', x-axis: 'region', y-axis: 'average_sales'}
2
2
Q: How have website visits changed over time?
A: {type: ‘line-chart’, x-axis: ‘date’, y-axis: ‘website_visits’}
Q: How have website visits changed over time?
A: {type: 'line-chart', x-axis: 'date', y-axis: 'website_visits'}
3
3
Q: How do customer demographics affect sales?
A: {type: ‘scatter-plot’, x-axis: ‘demographic’, y-axis: ‘sales’}
Q: How do customer demographics affect sales?
A: {type: 'scatter-plot', x-axis: 'demographic', y-axis: 'sales'}
4
4
Q: How do different marketing strategies impact customer acquisition?
A: {type: ‘bar-chart’, x-axis: ‘marketing_strategy’, y-axis: ‘customer_acquisition’}
Q: How do different marketing strategies impact customer acquisition?
A: {type: 'bar-chart', x-axis: 'marketing_strategy', y-axis: 'customer_acquisition'}
5
5
Q: What is the distribution of expenses across different departments?
A: {type: ‘pie-chart’, x-axis: ‘department’, y-axis: ‘expenses’}
Q: What is the distribution of expenses across different departments?
A: {type: 'pie-chart', x-axis: 'department', y-axis: 'expenses'}
6
6
Q: What is the correlation between employee satisfaction and productivity?
A: {type: ‘scatter-plot’, x-axis: ‘employee_satisfaction’, y-axis: ‘productivity’}
Q: What is the correlation between employee satisfaction and productivity?
A: {type: 'scatter-plot', x-axis: 'employee_satisfaction', y-axis: 'productivity'}
제1모델은 한국어뿐만 아니라 외국어 텍스트 질의에 대하여도 처리가능하도록 학습된 모델일 수 있다. 제1모델은 타이포, 비문, 신조어, 변칙어 및/또는 특수문자 등에 대하여도 처리가능하도록 학습된 모델일 수 있다.The first model may be a model learned to process not only Korean but also foreign language text queries. The first model may be a model learned to process typos, inscriptions, new words, anomalous words, and/or special characters.
대화형 데이터 분석 모델은 평가부와 답안 생성부로 구성되어, 경쟁적으로 반복 학습된 모델일 수 있다. 예컨대, 답안 생성부는 자연어 텍스트 질의로부터 쿼리문과 출력 방식을 생성하고, 평가부는 답안 생성부가 생성한 답안을 스코어링하여 평가할 수 있다. 답안 생성부는 평가 결과(스코어)를 기초로, 평가부의 평가 결과를 향상시키는 방향으로 다시 학습을 수행할 수 있다. 답안 생성부의 학습은 평가부의 평가 결과가 임계값(예: 정확도 99%)에 도달할 때까지 사이클을 반복하며 수행될 수 있다.The interactive data analysis model consists of an evaluation unit and an answer generation unit and may be a competitively and iteratively learned model. For example, the answer generation unit may generate a query sentence and an output method from a natural language text query, and the evaluation unit may score and evaluate the answers generated by the answer generation unit. Based on the evaluation results (scores), the answer generation unit can perform learning again in the direction of improving the evaluation results of the evaluation unit. Learning of the answer generation unit can be performed by repeating the cycle until the evaluation result of the evaluation unit reaches a threshold (e.g., 99% accuracy).
이러한 대화형 데이터 분석 모델의 도입으로, 사용자는 명령어를 익히지 않고도, 본 개시의 일 실시예에 따른 이커머스 데이터 통합 제공 장치(20)로부터 통합된 이커머스 데이터를 손쉽게 획득할 수 있다. 또한, 사용자는 본 개시의 일 실시예에 따른 이커머스 데이터 통합 제공 장치(20)를 이용하여, 요청하는 데이터에 따라 적절한 방식으로 시각화된 이커머스 데이터를 획득하여, 의미있는 정보를 얻을 수 있다.With the introduction of this interactive data analysis model, users can easily obtain integrated e-commerce data from the e-commerce data
도 4는 본 개시의 일 실시예에 따른 이커머스 데이터 통합 제공 방법을 나타내는 흐름도이다.Figure 4 is a flowchart showing a method for providing integrated e-commerce data according to an embodiment of the present disclosure.
이커머스 데이터 통합 제공 장치는, 하나 이상의 채널로부터, 이커머스 데이터를 수집하여 데이터부에 기 설정된 포맷으로 저장한다(S400).The e-commerce data integrated provision device collects e-commerce data from one or more channels and stores it in a preset format in the data unit (S400).
이커머스 데이터 통합 제공 장치는, 기 설정된 포맷의 빈(empty) 데이터를 추론하도록 기 학습된 상품 분류 모델을 이용하여, 수집된 이커머스 데이터의 빈 데이터를 추론하고 라벨링하여 데이터부에 저장함으로써, 데이터부를 구성한다(S410).The e-commerce data integration providing device uses a product classification model that has been previously learned to infer empty data in a preset format, infers and labels empty data of the collected e-commerce data and stores it in the data unit, Construct wealth (S410).
이커머스 데이터 통합 제공 장치는, 사용자 단말로부터 자연어 형식의 요청을 입력받는다(S420).The e-commerce data integration provision device receives a request in natural language format from the user terminal (S420).
이커머스 데이터 통합 제공 장치는, 자연어 텍스트의 질의를 입력받아 질의에 대한 답을 획득하기 위한 쿼리문과 답을 출력하는 방식을 추론하도록 기 학습된 대화형 데이터 분석 모델을 이용하여, 입력된 자연어 형식의 요청에 대응하는 쿼리문과, 답을 출력하는 방식을 추론한다(S430).The e-commerce data integration provision device receives a query in natural language text and uses an interactive data analysis model that has been previously learned to infer how to output the query statement and answer to obtain the answer to the query, The query statement corresponding to the request and the method of outputting the answer are inferred (S430).
이커머스 데이터 통합 제공 장치는, 추론된 쿼리문을, S410 단계에서 구성된 데이터부에 적용함으로써, 결과 데이터와, 결과 데이터를 출력하는 방식을 제공한다(S440).The e-commerce data integration providing device provides result data and a method of outputting the result data by applying the inferred query statement to the data unit configured in step S410 (S440).
한편, 도 4는 이커머스 데이터 통합 제공 방법의 동작 방법을 예시적으로 나타내는 것이고, 이커머스 데이터 통합 제공 방법이 반드시 도 4의 단계에 따라 순차적으로 실행되는 것은 아니다. 예컨대, 도 2의 각 단계는 본 개시의 이커머스 데이터 통합 제공 방법의 본질에 반하지 않는 범위 내에서 병렬적이거나, 순서를 달리하거나, 일부 단계가 생략되어 수행될 수 있다.Meanwhile, Figure 4 illustrates an exemplary operation method of the e-commerce data integrated provision method, and the e-commerce data integrated provision method is not necessarily executed sequentially according to the steps of Figure 4. For example, each step in FIG. 2 may be performed in parallel, in a different order, or with some steps omitted, as long as it does not conflict with the essence of the method for providing integrated e-commerce data of the present disclosure.
본 개시의 전술한 장치 또는 방법의 다양한 실시예는, 하나 이상의 컴퓨터 프로그램으로 구현되는 것을 포함할 수 있다. 이러한 컴퓨터 프로그램은, 하나 이상의 입력 장치, 하나 이상의 출력 장치, 메모리를 포함하고, 메모리, 입력 장치, 출력 장치 간 데이터 및 명령을 송수신하도록 결합된 하나 이상의 프로그래밍 가능한 프로세서를 포함하는 컴퓨터 시스템에 의해 실행, 구동, 작동, 운영될 수 있다. 컴퓨터 시스템은 예컨대, 서버, 네트워크 기기, 셋톱박스, 내장형 장치, 컴퓨터 확장 모듈, 개인용 컴퓨터, 랩톱, PDA(Personal Data Assistant), 클라우드 컴퓨팅 시스템 또는 모바일 장치일 수 있으나, 이에 한하지 않는다. 컴퓨터 프로그램들(예: 펌웨어, 미들웨어, OS, 소프트웨어, 애플리케이션, 소스 코드)은 프로그래밍 가능한 프로세서를 구동 내지 제어하기 위한 명령어들을 포함하며, 컴퓨터가 읽을 수 있는 기록매체에 저장된다.Various embodiments of the above-described device or method of the present disclosure may include being implemented with one or more computer programs. Such a computer program is executed by a computer system including one or more input devices, one or more output devices, memory, and one or more programmable processors coupled to transmit and receive data and instructions between the memory, the input devices, and the output devices, It can be driven, operated, and operated. A computer system may be, for example, but not limited to, a server, network device, set-top box, embedded device, computer expansion module, personal computer, laptop, personal data assistant (PDA), cloud computing system, or mobile device. Computer programs (e.g. firmware, middleware, OS, software, applications, source code) include instructions for driving or controlling a programmable processor and are stored in a computer-readable recording medium.
여기서, 컴퓨터가 읽을 수 있는 기록매체란, 컴퓨터 시스템에 의하여 읽힐 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체는 예컨대, ROM, 자기 테이프, 플로피 디스크, 메모리 카드, 하드 디스크, 광자기 디스크, 스토리지 디바이스 등일 수 있으나, 이에 한하지 않음은 명확하다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수도 있다.Here, computer-readable recording media includes all types of recording devices that store data that can be read by a computer system. Computer-readable recording media may be, for example, ROM, magnetic tape, floppy disk, memory card, hard disk, magneto-optical disk, storage device, etc., but are clearly not limited thereto. Additionally, the computer-readable recording medium may be distributed in a computer system connected to a network, and the computer-readable code may be stored and executed in a distributed manner.
이상은 본 개시의 다양한 실시예들을 설명한 것으로, 이 분야 통상의 기술자가 채용할 수 있는 다양한 구성, 물질, 수단, 방법, 지식에 의해 다양한 변형이 가능하다. 이러한 실시예들은 본 개시의 기술적 사상을 설명하기 위한 것일 뿐, 본 개시의 기술적 사상과 그 범위를 한정하지 않는다.The above is a description of various embodiments of the present disclosure, and various modifications are possible depending on various configurations, materials, means, methods, and knowledge that can be employed by those skilled in the art. These embodiments are only for illustrating the technical idea of the present disclosure and do not limit the technical idea or scope of the present disclosure.
20: 이커머스 데이터 통합 제공 장치
200: 데이터부
220: 수집부
240: 분류부
260: 입력부
280: 제공부
20: E-commerce data integration provision device
200: data unit
220: Collection department
240: Classification department
260: input unit
280: Provider
Claims (6)
복수의 채널로부터 이커머스 데이터를 수집하여 상기 데이터부에 기 설정된 포맷으로 저장시키는, 수집부;
상기 기 설정된 포맷의 빈(empty) 데이터를 추론하도록 기 학습된 상품 분류 모델을 이용하여, 수집된 이커머스 데이터의 빈 데이터를 추론하고 라벨링하여 상기 데이터부에 저장시키는, 분류부;
사용자 단말로부터 자연어 형식의 요청을 입력받는, 입력부; 및
자연어 텍스트의 질의를 입력받아 질의에 대한 답을 획득하기 위한 쿼리문과 답을 출력하는 방식을 추론하도록 기학습된 대화형 데이터 분석 모델을 이용하여, 상기 자연어 형식의 요청에 대응하는 결과 데이터와 상기 결과 데이터를 출력 방식을 제공하는, 제공부를 포함하되,
상기 복수의 채널은, 사용자가 저장 및 관리하는 파일, 사용자의 상품을 판매하기 위한 채널, 사용자가 채널을 관리하기 위해 사용하는 툴 및 사용자가 수익을 극대화하기 위해 사용하는 채널 중, 적어도 두 개 이상을 포함하고,
상기 상품 분류 모델은, 상기 데이터부에 저장된 이커머스 데이터로부터 추론에 사용되기 위한 필수 데이터를 추출하고, 특정 속성에 해당하는 데이터를 토큰화하여, 추출된 필수 데이터와 토큰을 이용하여 입력되는 이커머스 데이터로부터 특징(feature)을 추출하고, 생성된 특징으로부터 상기 빈 데이터 및라벨링하기위한속성정보를추론하고,
상기 대화형 데이터 분석 모델은, 자연어 텍스트 질의를 자연어 처리하여 상기 기 설정된 포맷의 데이터들로부터 답을 획득하기 위한 쿼리문을 생성하도록 기학습된 제1모델과, 자연어 텍스트 질의에 답을 출력하는 방식을 레이블링한 데이터셋을 이용하여 튜닝된 트랜스포머 모델인 제2모델을 포함하고,
상기 제1모델은, 한국어 및 외국어 텍스트 질의에 대하여 처리 가능하도록 기학습되고, 질의에 포함되는 타이포, 비문, 신조어, 변칙어 및 특수문자에 대하여 처리 가능하도록 기학습된 모델이고,
상기 분류부는,
상기 데이터부의 데이터를 저장하기 위한 포맷에 상기 속성정보에 관한 속성이 포함되지 않은 경우, 상기 속성정보에 관한 속성을 상기 데이터부가 새로이 생성하도록 하여, 상기 데이터부에, 상기 빈 데이터와 상기 속성정보를 저장시키는,
이커머스 데이터 통합 제공 장치.data department;
a collection unit that collects e-commerce data from a plurality of channels and stores it in a preset format in the data unit;
a classification unit for inferring and labeling empty data of the collected e-commerce data using a product classification model previously learned to infer empty data of the preset format and storing the label in the data unit;
An input unit that receives a request in natural language form from a user terminal; and
By using an interactive data analysis model that is pre-trained to receive a query in natural language text and infer how to output a query statement and answer to obtain an answer to the query, result data corresponding to the request in natural language format and the result Includes a provision unit that provides a data output method,
The plurality of channels include at least two of the following: files stored and managed by the user, channels for selling the user's products, tools used by the user to manage the channel, and channels used by the user to maximize profits. Including,
The product classification model extracts essential data to be used for inference from the e-commerce data stored in the data unit, tokenizes data corresponding to specific attributes, and inputs e-commerce data using the extracted essential data and tokens. Extracting features from data, inferring the empty data and attribute information for labeling from the generated features,
The interactive data analysis model includes a first model that is pre-trained to generate a query to obtain an answer from data in the preset format by processing natural language text queries in natural language, and a method for outputting answers to natural language text queries. Includes a second model, which is a transformer model tuned using a labeled dataset,
The first model is a model that has been pre-trained to be able to process Korean and foreign language text queries, and to be able to process typos, inscriptions, new words, anomalous words, and special characters included in the query,
The classification department,
If the format for storing data in the data unit does not include an attribute related to the attribute information, the attribute related to the attribute information is newly created in the data unit, and the empty data and the attribute information are stored in the data unit. to save,
E-commerce data integration provider.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020230032341A KR102613260B1 (en) | 2023-03-13 | 2023-03-13 | System for Integrating and Providing E-Commerce Data |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020230032341A KR102613260B1 (en) | 2023-03-13 | 2023-03-13 | System for Integrating and Providing E-Commerce Data |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102613260B1 true KR102613260B1 (en) | 2023-12-13 |
Family
ID=89157602
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020230032341A KR102613260B1 (en) | 2023-03-13 | 2023-03-13 | System for Integrating and Providing E-Commerce Data |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102613260B1 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100067611A (en) * | 2008-12-11 | 2010-06-21 | 액센처 글로벌 서비스 게엠베하 | Online ad detection and ad campaign analysis |
KR20190100581A (en) * | 2018-02-21 | 2019-08-29 | 김재우 | Purchasing agency shoping mall integrated management system |
KR20210063878A (en) * | 2019-11-25 | 2021-06-02 | 주식회사 데이터마케팅코리아 | A method and an apparatus for providing chatbot services of analyzing marketing information |
KR102463404B1 (en) * | 2021-10-26 | 2022-11-08 | 씨그로 주식회사 | Dashboard System for Information Matching |
-
2023
- 2023-03-13 KR KR1020230032341A patent/KR102613260B1/en active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100067611A (en) * | 2008-12-11 | 2010-06-21 | 액센처 글로벌 서비스 게엠베하 | Online ad detection and ad campaign analysis |
KR20190100581A (en) * | 2018-02-21 | 2019-08-29 | 김재우 | Purchasing agency shoping mall integrated management system |
KR20210063878A (en) * | 2019-11-25 | 2021-06-02 | 주식회사 데이터마케팅코리아 | A method and an apparatus for providing chatbot services of analyzing marketing information |
KR102463404B1 (en) * | 2021-10-26 | 2022-11-08 | 씨그로 주식회사 | Dashboard System for Information Matching |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220414688A1 (en) | Predictive analytics for leads generation and engagement recommendations | |
US11295375B1 (en) | Machine learning based computer platform, computer-implemented method, and computer program product for finding right-fit technology solutions for business needs | |
US9911131B1 (en) | Method and system for obtaining leads based on data derived from a variety of sources | |
CN115002200B (en) | Message pushing method, device, equipment and storage medium based on user portrait | |
EP2778970A1 (en) | Facet group ranking for search results | |
US20190080352A1 (en) | Segment Extension Based on Lookalike Selection | |
CN109002470A (en) | Knowledge mapping construction method and device, client | |
Imanbayev et al. | Analysis and mathematical modeling of big data processing | |
US10146881B2 (en) | Scalable processing of heterogeneous user-generated content | |
US20140108439A1 (en) | Interest Expansion Using A Taxonomy | |
Usuelli | R machine learning essentials | |
JP7525750B1 (en) | Server and computer program | |
US12197463B2 (en) | Creating descriptors for business analytics applications | |
KR102613260B1 (en) | System for Integrating and Providing E-Commerce Data | |
US20200160359A1 (en) | User-experience development system | |
Wiley et al. | A Monte Carlo simulation study of two approaches for aggregating conjoint data | |
CN113127597A (en) | Processing method and device for search information and electronic equipment | |
CN114722789B (en) | Data report integrating method, device, electronic equipment and storage medium | |
US20150193708A1 (en) | Perspective analyzer | |
CN114416848A (en) | Data blood relationship processing method and device based on data warehouse | |
Mia | Big data analytics | |
US20210117825A1 (en) | Method and system for processing a search result of a search engine system | |
CN113779967A (en) | Enterprise transformation information generation method and device, storage medium and electronic equipment | |
KR20210112974A (en) | System and method for creating brand index using concentration ratio and computer program for the same | |
CN111460300A (en) | Network content pushing method and device and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20230313 |
|
PA0201 | Request for examination | ||
PA0302 | Request for accelerated examination |
Patent event date: 20230314 Patent event code: PA03022R01D Comment text: Request for Accelerated Examination Patent event date: 20230313 Patent event code: PA03021R01I Comment text: Patent Application |
|
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20230519 Patent event code: PE09021S01D |
|
AMND | Amendment | ||
PE0601 | Decision on rejection of patent |
Patent event date: 20230913 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20230519 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |
|
X091 | Application refused [patent] | ||
AMND | Amendment | ||
PX0901 | Re-examination |
Patent event code: PX09011S01I Patent event date: 20230913 Comment text: Decision to Refuse Application Patent event code: PX09012R01I Patent event date: 20230628 Comment text: Amendment to Specification, etc. |
|
PX0701 | Decision of registration after re-examination |
Patent event date: 20231207 Comment text: Decision to Grant Registration Patent event code: PX07013S01D Patent event date: 20231127 Comment text: Amendment to Specification, etc. Patent event code: PX07012R01I Patent event date: 20230913 Comment text: Decision to Refuse Application Patent event code: PX07011S01I Patent event date: 20230628 Comment text: Amendment to Specification, etc. Patent event code: PX07012R01I |
|
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20231208 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20231208 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |