JP6335898B2 - 製品認識に基づく情報分類 - Google Patents
製品認識に基づく情報分類 Download PDFInfo
- Publication number
- JP6335898B2 JP6335898B2 JP2015525462A JP2015525462A JP6335898B2 JP 6335898 B2 JP6335898 B2 JP 6335898B2 JP 2015525462 A JP2015525462 A JP 2015525462A JP 2015525462 A JP2015525462 A JP 2015525462A JP 6335898 B2 JP6335898 B2 JP 6335898B2
- Authority
- JP
- Japan
- Prior art keywords
- product
- word
- profile information
- recognition
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 claims description 43
- 238000000605 extraction Methods 0.000 claims description 27
- 230000011218 segmentation Effects 0.000 claims description 6
- 230000003796 beauty Effects 0.000 claims 1
- 238000005516 engineering process Methods 0.000 description 16
- 239000000284 extract Substances 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Image Analysis (AREA)
Description
本出願は、「Information Classification Method and System Based on Product Recognition」と題される、2012年7月30日に出願された中国特許出願第201210266047.3号に対する外国優先権を主張し、その全体が参照により本明細書に組み込まれる。
製品プロファイルと関連する売り手プロファイルの供給された製品フィールドは前処理される。前処理としては、例えば、セグメント化、大文字と小文字の変換、および/またはステム抽出が挙げられ得る。ハッシュ値は、対応する特性として各ワードまたはフレーズに対して計算される。
製品プロファイルのキーワードフィールドは前処理される。前処理としては、例えば、セグメント化、大文字と小文字の変換、および/またはステム抽出が挙げられ得る。ハッシュ値は、対応する特性として各ワードまたはフレーズに対して計算される。
製品プロファイルの属性フィールドは前処理される。前処理としては、例えば、セグメント化、大文字と小文字の変換、および/またはステム抽出が挙げられ得る。ハッシュ値は、対応する特性として各ワードまたはフレーズに対して計算される。
製品プロファイルのタイトルフィールドは前処理される。前処理としては、例えば、セグメント化、チャンクからの部分文字列の抽出、大文字と小文字の変換、および/またはステム抽出が挙げられ得る。ハッシュ値は、候補ワードの対応する特性として各ワードまたはフレーズに対して計算される。例えば、語彙的カテゴリ分類がタイトルフィールドに適用されてもよく、タイトル内の接続詞、前置詞、および/または句読点によって別のフレーズから分離される短いフレーズがチャンクと称される。
以下の特性は、製品プロファイル情報から抽出され得る。
本技術は、それぞれの製品ワードがすべて大文字にされているかどうかを決定することができる。すべて大文字にされている文字は通常、省略形を指す。決定の結果が正である、すなわち、製品ワードがすべて大文字にされている場合、その対応する特性値は1であり、そうでなければ、その対応する特性値は0である。例えば、このような特性値の決定方法は、特に指定されない限り以下のタイプ特性に適用することができる。
この特性の抽出は、製品ワードが成功裏に抽出される製品プロファイル情報に適用することができる。正のサンプルからのそれぞれの製品ワード内のワードおよび/またはフレーズとは異なる、予め設定された個数(2など)のワードおよび/またはフレーズは、負のサンプルとして使用される。1つ以上の特性は次に、負のサンプルから抽出される。この動作は、正のサンプルからの抽出特性と同じまたは類似であり、これは、簡潔さのために本明細書に詳述されない。例えば、製品プロファイル情報に関して、102で抽出されたそれぞれの製品ワードは、初期設定で正のサンプルと見なされる。それぞれの製品ワードとは異なるタイトル内のワードおよび/またはフレーズは、負のサンプルとして使用され得る。一例としてタイトル「4GB MP3 Player」を使用すると、正のサンプルの製品ワード(または製品ワード)は、「MP3 Player」であるが、負のサンプルは、「MP3」、「Player」、「4GB」等であり得る。
104で取得された特性provide_products_featureに従う各ワードまたはフレーズに対応する特性の頻度(または出現回数)は、統計から計算される。閾値よりも高い特性の頻度は、対数を取られてもよい。事前確率モデルP(Y)を取得するために正規化がさらに行われる。例えば、対数を行うときに底の数に制限がなく、これは、2、10、または自然対数であり得る。
104で取得された特性subject_candidate_featureおよびkeyword_featureは、二部グラフの2つの頂点集合を形成するために使用され得る。キーワードフィールド内のワードまたはフレーズが同じ製品プロファイル内のタイトルフィールド内のワードまたはフレーズと同時に現れる場合、辺がこのような2つの頂点間に確立される。辺の重み値は、2つの頂点が同じ製品プロファイルで同時に現れる回数である。製品ワードが成功裏に抽出されるすべての製品プロファイル情報を検討した後、重み付けされた二部グラフが取得される。キーワード条件付き確率モデルP(K|Y)を決定するために重み付けされた二部グラフにランダムウォーキングが行われる。
104で取得された特性subject_candidate_featureおよびattr_desc_featureは、二部グラフの2つの頂点集合を形成するために使用され得る。属性フィールド内のワードまたはフレーズが同じ製品プロファイル内のタイトルフィールド内のワードまたはフレーズと同時に現れる場合、このような2つの頂点間に辺が確立される。辺の重み値は、2つの頂点が同じ製品プロファイルで同時に現れる回数である。製品ワードが成功裏に抽出されるすべての製品プロファイル情報を検討した後、重み付けされた二部グラフが取得される。キーワード条件付き確率モデルP(A|Y)を決定するために重み付けされた二部グラフにランダムウォーキングが行われる。
104で取得された特性subject_candidate_featureが候補製品ワードとして使用されてもよく、分類条件付き確率モデルP(Ca|Y)を決定するために候補製品ワードの統計から分類分布が計算されてもよい。
104で取得された特性subject_candidate_featureは、候補製品ワードとして使用されてもよく、企業条件付き確率モデルP(Co|Y)を決定するために候補製品ワードの統計から企業分布が計算されてもよい。
抽出されたワードまたはフレーズの確率を決定するタイトルモデルは、タイトルに基づく製品ワードである。このような質問は、二分割の質問としてモデル化されてもよく、共通の二項分類モデルが選択されてもよい。対応する特性は、104で抽出されたpositive_label_featureおよびnegative_label_featureである。
P(Y|O)=P(T|Y)P(K|Y)P(A|Y)P(S|Y)P(Ca|Y)P(Co|Y)P(Y)
Claims (20)
- コンピュータによって実行される方法であって、
製品認識に対する要求を受信することであって、製品認識に対する前記要求が、製品に関連する情報を表す認識のための製品プロファイル情報を含む、受信することと、
認識のための前記製品プロファイル情報のタイトルに基づいて、認識のための前記製品プロファイル情報の1つ以上の候補製品ワードを決定することと、
前記決定された1つ以上の候補製品ワードのそれぞれのハッシュ値を計算し、前記ハッシュ値を、1つ以上のそれぞれの特性として抽出することと、
前記決定された1つ以上の候補製品ワードおよび対応する前記抽出されたそれぞれの特性を総合的学習モデルに入力することによって、認識のための前記製品プロファイル情報に対応する製品ワードを決定することと、
前記決定された製品ワードに従って、認識のための前記製品プロファイル情報を分類することと、を含む、方法。 - 前記1つ以上の候補製品ワードを前記決定することは、
認識のための前記製品プロファイル情報の前記タイトルを接続詞、前置詞、または句読点によってセグメント化することと、
それぞれの候補製品ワードとして、前記セグメント化された1つ以上の文字列に含まれるワードまたはフレーズを使用することと、を含む、請求項1に記載の方法。 - 前記決定された1つ以上の候補製品ワードのそれぞれのハッシュ値を計算し、前記ハッシュ値を、前記1つ以上のそれぞれの特性として前記抽出することは、
認識のための前記製品プロファイル情報のタイトルフィールドを取得することと、
前記タイトルフィールドに含まれるワードまたはフレーズのハッシュ値を決定することと、
認識のための前記製品プロファイル情報のタイトル特性として前記タイトルフィールドに含まれる前記ワードまたはフレーズの前記ハッシュ値を使用することと、を含む、請求項1に記載の方法。 - 前記決定された1つ以上の候補製品ワードのそれぞれのハッシュ値を計算し、前記ハッシュ値を、前記1つ以上のそれぞれの特性として前記抽出することは、
認識のための前記製品プロファイル情報に関する売り手プロファイルの供給された製品フィールドを取得することと、
前記供給された製品フィールドに含まれるワードまたはフレーズのハッシュ値を決定することと、
認識のための前記製品プロファイル情報の供給された製品特性として前記供給された製品フィールドに含まれる前記ワードまたはフレーズの前記ハッシュ値を使用することと、を含む、請求項1に記載の方法。 - 前記決定された1つ以上の候補製品ワードのそれぞれのハッシュ値を計算し、前記ハッシュ値を、前記1つ以上のそれぞれの特性として前記抽出することは、
認識のための前記製品プロファイル情報の属性フィールドを取得することと、
前記属性フィールドに含まれるワードまたはフレーズのハッシュ値を決定することと、
認識のための前記製品プロファイル情報の属性特性として前記属性フィールドに含まれる前記ワードまたはフレーズの前記ハッシュ値を使用することと、を含む、請求項1に記載の方法。 - 前記決定された1つ以上の候補製品ワードのそれぞれのハッシュ値を計算し、前記ハッシュ値を、前記1つ以上のそれぞれの特性として前記抽出することは、
認識のための前記製品プロファイル情報のキーワードフィールドを取得することと、
前記キーワードフィールドに含まれるワードまたはフレーズのハッシュ値を決定することと、
認識のための前記製品プロファイル情報のキーワード特性として前記キーワードフィールドに含まれる前記ワードまたはフレーズの前記ハッシュ値を使用することと、を含む、請求項1に記載の方法。 - 前記決定された1つ以上の候補製品ワードのそれぞれのハッシュ値を計算し、前記ハッシュ値を、前記1つ以上のそれぞれの特性として前記抽出することに代えて、
前記1つ以上の候補製品ワードのそれぞれ、または前記1つ以上の候補製品ワードのそれぞれに関連する1つ以上のワード、フレーズ、またはチャンクがあらかじめ定められた条件を満たすかどうかを示す、認識のための前記製品プロファイル情報の正ラベル特性を決定することを含む、請求項1に記載の方法。 - 前記決定された1つ以上の候補製品ワードのそれぞれのハッシュ値を計算し、前記ハッシュ値を、前記1つ以上のそれぞれの特性として前記抽出することに代えて、
前記1つ以上の候補製品ワードとは異なる、認識のための前記製品プロファイル情報中の1つ以上のワード、フレーズ、またはチャンクがあらかじめ定められた条件を満たすかどうかを示す、認識のための前記製品プロファイル情報の負ラベル特性を決定することを含む、請求項1に記載の方法。 - 前記総合的学習モデルを生成することをさらに有する、請求項1に記載の方法。
- 前記総合的学習モデルを生成することは、
製品に関連する情報を表す、学習のための製品プロファイル情報を取得することと、
学習のための前記製品プロファイル情報におけるワードまたはフレーズの条件を指定するプリセット条件に基づいて、学習のための前記製品プロファイル情報から1つ以上の製品ワードを抽出することと、
前記抽出された1つ以上の製品ワードそれぞれのハッシュ値を計算し、前記ハッシュ値を、1つ以上の特性として抽出することと、
前記抽出された特性および学習のための前記製品プロファイル情報に基づく事前確率モデルまたは条件付き確率モデルを、1つ以上の学習サブモデルとして決定することと、
前記1つ以上の学習サブモデルに基づいて、前記総合的学習モデルを決定することと、を含む、請求項9に記載の方法。 - 学習のための前記製品プロファイル情報から1つ以上の製品ワードを前記抽出することは、
学習のための前記製品プロファイル情報からタイトルフィールド、および複数のフィールドのうちの少なくとも1つを取得することであって、前記複数のフィールドが、製品プロファイルに関する売り手プロファイルの供給された製品フィールド、前記製品プロファイルの属性フィールド、および前記製品プロファイルのキーワードフィールドを含む、取得することと、
前記製品プロファイル情報に対応する前記製品ワードとして、前記プリセット条件のうちの少なくとも1つを満たすワードまたはフレーズを決定することと、を含む、請求項10に記載の方法。 - 前記プリセット条件は、
前記ワードまたはフレーズが、前記製品プロファイルの前記タイトルフィールド、および前記複数のフィールドのうちの少なくとも1つのフィールドに現れることと、
前記ワードまたはフレーズが、前記製品プロファイルの前記タイトルフィールドに現れ、前記ワードまたはフレーズが前記複数のフィールドに現れる回数が、閾値よりも高いことと、を含む、請求項11に記載の方法。 - 認識のための前記製品プロファイル情報に対応する前記製品ワードを前記決定することは、
前記それぞれの候補製品ワードおよび前記それぞれの候補製品ワードに対応する1つ以上の特性を前記総合的学習モデルに入力することによって、前記製品ワードとしてのそれぞれの候補製品ワードのそれぞれの確率を決定することと、
最高確率を有する候補製品ワードを、認識のための前記製品プロファイル情報に対応する前記製品ワードとして選択することと、を含む、請求項1に記載の方法。 - 前記決定された製品ワードに従って、認識のための前記製品プロファイル情報を前記分類することは、
1つ以上のプリセット分類キーワードに基づいて、前記製品ワードを前記プリセット分類キーワードにマッチングさせることと、
前記マッチングの結果に基づいて、製品認識のための前記製品プロファイル情報の分類を決定することと、を含む、請求項1に記載の方法。 - コンピュータによって実行される方法であって、
製品に関連する情報を表す、学習のための製品プロファイル情報を取得することと、
学習のための前記製品プロファイル情報におけるワードまたはフレーズの条件を指定するプリセット条件に基づいて、学習のための前記製品プロファイル情報から1つ以上の製品ワードを抽出することと、
前記抽出された1つ以上の製品ワードそれぞれのハッシュ値を計算し、前記ハッシュ値を、1つ以上の特性として抽出することと、
前記抽出された特性および学習のための前記製品プロファイル情報に基づく事前確率モデルまたは条件付き確率モデルを、1つ以上の学習サブモデルとして決定することと、
前記1つ以上の学習サブモデルに基づいて、総合的学習モデルを決定することと、を含む、方法。 - 製品認識に対する要求を受信することであって、製品認識に対する前記要求が、製品に関連する情報を表す認識のための製品プロファイル情報を含む、受信することと、
前記総合的学習モデルおよび認識のための前記製品プロファイル情報に基づいて、認識のための前記製品プロファイル情報に対応する製品ワードを決定することと、さらに含み、
前記製品ワードを決定することは、
前記認識のための前記製品プロファイル情報のタイトルから1つ以上の候補製品ワードを決定し、
前記1つ以上の候補製品ワードのそれぞれのハッシュ値を計算することで、1つ以上のそれぞれの特性を決定し、
前記決定された1つ以上の候補製品ワードと、対応する前記決定されたそれぞれの特性と、を前記総合的学習モデルに入力することによって、認識のための前記製品プロファイル情報に対応する製品ワードを決定することを含む、請求項15に記載の方法。 - 前記決定された製品ワードに基づいて、認識のための前記製品プロファイル情報を分類することをさらに含む、請求項16に記載の方法。
- プロセッサと、メモリと、を備えるシステムであって、前記メモリは、
製品認識のための1つ以上の学習サブモデルおよび前記1つ以上の学習サブモデルに基づく総合的学習モデルを記憶する、記憶モジュールと、
前記システムが、製品に関連する情報を表す認識のための製品プロファイル情報を含む製品認識に対する要求を受信すると、認識のための前記製品プロファイル情報のタイトルに基づいて、認識のための前記製品プロファイル情報の1つ以上の候補製品ワードを決定する、第1の決定モジュールと、
前記決定された候補製品ワードのそれぞれのハッシュ値を計算し、前記ハッシュ値を、1つ以上の特性として抽出する、特性抽出モジュールと、
前記候補製品ワードと、対応する前記抽出された特性とを前記総合的学習モデルに入力することによって、前記製品プロファイル情報に対応する製品ワードを決定する、第2の決定モジュールと、
前記決定された製品ワードに基づいて、製品認識のための前記製品プロファイル情報を分類する、分類モジュールと、を備え、
前記プロセッサが前記各モジュールを実行するシステム。 - 前記メモリが、前記1つ以上の学習サブモデルおよび総合的学習モジュールを生成して、前記記憶モジュールに前記1つ以上の学習サブモデルおよび前記総合的学習モジュールを記憶させる、生成モジュールをさらに備える、請求項18に記載のシステム。
- 前記生成モジュールは、
学習のための前記製品プロファイル情報からタイトルフィールド、および複数のフィールドのうちの少なくとも1つを取得することであって、前記複数のフィールドが、製品プロファイルに関する売り手プロファイルの供給された製品フィールド、前記製品プロファイルの属性フィールド、および前記製品プロファイルのキーワードフィールドを含む、取得することと、
前記製品プロファイル情報に対応する前記製品ワードとして、プリセット条件のうちの少なくとも1つを満たすワードまたはフレーズを決定することと、をさらに行い、
前記プリセット条件は、
前記ワードまたはフレーズが、前記製品プロファイルの前記タイトルフィールド、および前記複数のフィールドのうちの少なくとも1つのフィールドに現れることと、
前記ワードまたはフレーズが、前記製品プロファイルの前記タイトルフィールドに現れ、前記ワードまたはフレーズが前記複数のフィールドに現れる回数が、閾値よりも高いことと、を含む、請求項19に記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210266047.3A CN103577989B (zh) | 2012-07-30 | 2012-07-30 | 一种基于产品识别的信息分类方法及信息分类系统 |
CN201210266047.3 | 2012-07-30 | ||
PCT/US2013/051865 WO2014022172A2 (en) | 2012-07-30 | 2013-07-24 | Information classification based on product recognition |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015529901A JP2015529901A (ja) | 2015-10-08 |
JP6335898B2 true JP6335898B2 (ja) | 2018-05-30 |
Family
ID=48980277
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015525462A Expired - Fee Related JP6335898B2 (ja) | 2012-07-30 | 2013-07-24 | 製品認識に基づく情報分類 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20140032207A1 (ja) |
JP (1) | JP6335898B2 (ja) |
KR (1) | KR20150037924A (ja) |
CN (1) | CN103577989B (ja) |
TW (1) | TWI554896B (ja) |
WO (1) | WO2014022172A2 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102469758B1 (ko) | 2015-09-02 | 2022-11-22 | 삼성전자주식회사 | 서버 장치, 사용자 단말 장치, 그 제어 방법 및 전자 시스템 |
CN106557505B (zh) * | 2015-09-28 | 2021-04-27 | 北京国双科技有限公司 | 一种信息分类方法及装置 |
CN105354597B (zh) * | 2015-11-10 | 2019-03-19 | 网易(杭州)网络有限公司 | 一种游戏物品的分类方法及装置 |
US11580589B2 (en) * | 2016-10-11 | 2023-02-14 | Ebay Inc. | System, method, and medium to select a product title |
TWI621084B (zh) * | 2016-12-01 | 2018-04-11 | 財團法人資訊工業策進會 | 跨區域商品對應方法、系統及非暫態電腦可讀取記錄媒體 |
CN107133287B (zh) * | 2017-04-19 | 2021-02-02 | 上海筑网信息科技有限公司 | 建筑安装行业工程清单归类解析方法及系统 |
JP7162417B2 (ja) * | 2017-07-14 | 2022-10-28 | ヤフー株式会社 | 推定装置、推定方法、及び推定プログラム |
CN107977794B (zh) * | 2017-12-14 | 2021-09-17 | 方物语(深圳)科技文化有限公司 | 工业产品的数据处理方法、装置、计算机设备及存储介质 |
JP7100797B2 (ja) * | 2017-12-28 | 2022-07-14 | コニカミノルタ株式会社 | 文書スコアリング装置、プログラム |
CN110968887B (zh) * | 2018-09-28 | 2022-04-05 | 第四范式(北京)技术有限公司 | 在数据隐私保护下执行机器学习的方法和系统 |
US10956487B2 (en) | 2018-12-26 | 2021-03-23 | Industrial Technology Research Institute | Method for establishing and processing cross-language information and cross-language information system |
CN112182448A (zh) * | 2019-07-05 | 2021-01-05 | 百度在线网络技术(北京)有限公司 | 页面信息处理方法、装置及设备 |
CN113220980B (zh) * | 2020-02-06 | 2024-10-22 | 北京沃东天骏信息技术有限公司 | 物品属性词识别方法、装置、设备及存储介质 |
US20210304121A1 (en) * | 2020-03-30 | 2021-09-30 | Coupang, Corp. | Computerized systems and methods for product integration and deduplication using artificial intelligence |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7082426B2 (en) * | 1993-06-18 | 2006-07-25 | Cnet Networks, Inc. | Content aggregation method and apparatus for an on-line product catalog |
US5983170A (en) * | 1996-06-25 | 1999-11-09 | Continuum Software, Inc | System and method for generating semantic analysis of textual information |
CN1997992A (zh) * | 2003-03-26 | 2007-07-11 | 维克托·西 | 用于无线网络的在线智能多语种比较商店代理 |
WO2004107237A1 (en) * | 2003-05-29 | 2004-12-09 | Rtm Technologies | Raffle-based collaborative product selling and buying system |
US7505969B2 (en) * | 2003-08-05 | 2009-03-17 | Cbs Interactive, Inc. | Product placement engine and method |
US7587309B1 (en) * | 2003-12-01 | 2009-09-08 | Google, Inc. | System and method for providing text summarization for use in web-based content |
US7870039B1 (en) * | 2004-02-27 | 2011-01-11 | Yahoo! Inc. | Automatic product categorization |
US20070005649A1 (en) * | 2005-07-01 | 2007-01-04 | Microsoft Corporation | Contextual title extraction |
JP4368336B2 (ja) * | 2005-07-13 | 2009-11-18 | 富士通株式会社 | カテゴリ設定支援方法及び装置 |
US7987182B2 (en) * | 2005-08-19 | 2011-07-26 | Fourthwall Media, Inc. | System and method for recommending items of interest to a user |
US7885859B2 (en) * | 2006-03-10 | 2011-02-08 | Yahoo! Inc. | Assigning into one set of categories information that has been assigned to other sets of categories |
US8326890B2 (en) * | 2006-04-28 | 2012-12-04 | Choicebot, Inc. | System and method for assisting computer users to search for and evaluate products and services, typically in a database |
US7996440B2 (en) * | 2006-06-05 | 2011-08-09 | Accenture Global Services Limited | Extraction of attributes and values from natural language documents |
US7979459B2 (en) * | 2007-06-15 | 2011-07-12 | Microsoft Corporation | Scalable model-based product matching |
JP2009026195A (ja) * | 2007-07-23 | 2009-02-05 | Yokohama National Univ | 商品分類装置、商品分類方法及びプログラム |
US8346534B2 (en) * | 2008-11-06 | 2013-01-01 | University of North Texas System | Method, system and apparatus for automatic keyword extraction |
US8386519B2 (en) * | 2008-12-30 | 2013-02-26 | Expanse Networks, Inc. | Pangenetic web item recommendation system |
CN101576910A (zh) * | 2009-05-31 | 2009-11-11 | 北京学之途网络科技有限公司 | 一种自动识别产品命名实体的方法及装置 |
CN102081865A (zh) * | 2009-11-27 | 2011-06-01 | 英业达股份有限公司 | 应用行动装置进行互动学习及监控的系统及其方法 |
US8775160B1 (en) * | 2009-12-17 | 2014-07-08 | Shopzilla, Inc. | Usage based query response |
CN102193936B (zh) * | 2010-03-09 | 2013-09-18 | 阿里巴巴集团控股有限公司 | 一种数据分类的方法及装置 |
TWI483129B (zh) * | 2010-03-09 | 2015-05-01 | Alibaba Group Holding Ltd | Retrieval method and device |
WO2011146527A2 (en) * | 2010-05-17 | 2011-11-24 | Zirus, Inc. | Mammalian genes involved in infection |
US8417651B2 (en) * | 2010-05-20 | 2013-04-09 | Microsoft Corporation | Matching offers to known products |
US20110302167A1 (en) * | 2010-06-03 | 2011-12-08 | Retrevo Inc. | Systems, Methods and Computer Program Products for Processing Accessory Information |
TWI518613B (zh) * | 2010-08-13 | 2016-01-21 | Alibaba Group Holding Ltd | How to publish product information and website server |
US8898169B2 (en) * | 2010-11-10 | 2014-11-25 | Google Inc. | Automated product attribute selection |
US20120123863A1 (en) * | 2010-11-13 | 2012-05-17 | Rohit Kaul | Keyword publication for use in online advertising |
CN102033950A (zh) * | 2010-12-23 | 2011-04-27 | 哈尔滨工业大学 | 电子产品命名实体自动识别系统的构建方法及识别方法 |
US8650136B2 (en) * | 2011-02-24 | 2014-02-11 | Ketera Technologies, Inc. | Text classification with confidence grading |
CN102332025B (zh) * | 2011-09-29 | 2014-08-27 | 奇智软件(北京)有限公司 | 一种智能垂直搜索方法和系统 |
-
2012
- 2012-07-30 CN CN201210266047.3A patent/CN103577989B/zh active Active
- 2012-11-13 TW TW101142222A patent/TWI554896B/zh not_active IP Right Cessation
-
2013
- 2013-07-24 US US13/949,970 patent/US20140032207A1/en not_active Abandoned
- 2013-07-24 WO PCT/US2013/051865 patent/WO2014022172A2/en active Application Filing
- 2013-07-24 KR KR20157002406A patent/KR20150037924A/ko not_active Application Discontinuation
- 2013-07-24 JP JP2015525462A patent/JP6335898B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN103577989A (zh) | 2014-02-12 |
TWI554896B (zh) | 2016-10-21 |
WO2014022172A2 (en) | 2014-02-06 |
CN103577989B (zh) | 2017-11-14 |
KR20150037924A (ko) | 2015-04-08 |
US20140032207A1 (en) | 2014-01-30 |
JP2015529901A (ja) | 2015-10-08 |
TW201405341A (zh) | 2014-02-01 |
WO2014022172A3 (en) | 2014-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6335898B2 (ja) | 製品認識に基づく情報分類 | |
US10838997B2 (en) | Method and device for generating text tag | |
WO2020244073A1 (zh) | 基于语音的用户分类方法、装置、计算机设备及存储介质 | |
US9092420B2 (en) | Apparatus and method for automatically generating grammar for use in processing natural language | |
US8983826B2 (en) | Method and system for extracting shadow entities from emails | |
CN109299280B (zh) | 短文本聚类分析方法、装置和终端设备 | |
US20150112664A1 (en) | System and method for generating a tractable semantic network for a concept | |
CN104881458B (zh) | 一种网页主题的标注方法和装置 | |
CN115630640B (zh) | 一种智能写作方法、装置、设备及介质 | |
JP5137567B2 (ja) | 検索フィルタリング装置及び検索フィルタリングプログラム | |
US20180293246A1 (en) | Video retrieval methods and apparatuses | |
CN110008309B (zh) | 一种短语挖掘方法及装置 | |
CN111291177A (zh) | 一种信息处理方法、装置和计算机存储介质 | |
CN109829151B (zh) | 一种基于分层狄利克雷模型的文本分割方法 | |
CN103246687A (zh) | 基于特征信息的Blog自动摘要方法 | |
US20160188569A1 (en) | Generating a Table of Contents for Unformatted Text | |
CN112347241A (zh) | 一种摘要提取方法、装置、设备及存储介质 | |
CN107861948B (zh) | 一种标签提取方法、装置、设备和介质 | |
US8463591B1 (en) | Efficient polynomial mapping of data for use with linear support vector machines | |
CN103761225B (zh) | 一种数据驱动的中文词语义相似度计算方法 | |
CN112183117A (zh) | 一种翻译评价的方法、装置、存储介质及电子设备 | |
CN107239455B (zh) | 核心词识别方法及装置 | |
CN109753646B (zh) | 一种文章属性识别方法以及电子设备 | |
CN107729509B (zh) | 基于隐性高维分布式特征表示的篇章相似度判定方法 | |
JP5342574B2 (ja) | トピックモデリング装置、トピックモデリング方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160629 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170725 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170801 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171101 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180403 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180501 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6335898 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |