Nothing Special   »   [go: up one dir, main page]

TWI575391B - 社群資料篩選系統、方法及其非揮發性電腦可讀取紀錄媒體 - Google Patents

社群資料篩選系統、方法及其非揮發性電腦可讀取紀錄媒體 Download PDF

Info

Publication number
TWI575391B
TWI575391B TW102121561A TW102121561A TWI575391B TW I575391 B TWI575391 B TW I575391B TW 102121561 A TW102121561 A TW 102121561A TW 102121561 A TW102121561 A TW 102121561A TW I575391 B TWI575391 B TW I575391B
Authority
TW
Taiwan
Prior art keywords
information
community
filtering
data
user
Prior art date
Application number
TW102121561A
Other languages
English (en)
Other versions
TW201500941A (zh
Inventor
呂俊宏
李宜勳
謝文泰
陳泰宏
張裕淇
Original Assignee
財團法人資訊工業策進會
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 財團法人資訊工業策進會 filed Critical 財團法人資訊工業策進會
Priority to TW102121561A priority Critical patent/TWI575391B/zh
Priority to CN201310359197.3A priority patent/CN104240107B/zh
Priority to US14/281,912 priority patent/US9607031B2/en
Publication of TW201500941A publication Critical patent/TW201500941A/zh
Application granted granted Critical
Publication of TWI575391B publication Critical patent/TWI575391B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

社群資料篩選系統、方法及其非揮發性電腦可讀取紀錄媒體
本發明是有關於一種社群資料處理技術,且特別是有關於一種社群資料篩選系統、方法及其非揮發性電腦可讀取紀錄媒體。
企業在規劃或推出產品時,需要緊密地掌握客戶的需求與偏好,以瞭解市場趨勢,並推出符合客戶期待的產品。
在企業對客戶進行產品的推銷,或是欲得知客戶需求以求產品的改進時,往往只能依靠客戶過往與企業間的互動行為及紀錄來判斷客戶的偏好,進而依照這些舊有的資訊進行客戶關係管理(customer relationship management;CRM),以及規劃未來將如何行銷其產品。然而,一方面客戶的詳細需求可能並不會在既有的互動行為及紀錄中完全表現,另一方面客戶的偏好可能隨著時間變化,而使這些互動行為及紀錄過時且不適用於目前或未來的行銷。
因此,如何設計一個新的社群資料篩選系統、方法及其非揮發性電腦可讀取紀錄媒體,藉由社群資料來輔助企業對客戶目前的需求與偏好可以達到更精準的估測,以解決上述的問題,乃為此一業界亟待解決的問題。
因此,本發明之一態樣是在提供一種社群資料篩選系統,包含:資料庫、擷取模組、過濾模組以及判斷模組。資料庫用以儲存複數人員資料及其對應的複數識別資訊。擷取模組鏈結資料庫,用以自資料庫的人員資料中擷取對應指定人員之人員資料及其識別資訊,並根據識別資訊產生複數搜尋資訊,其中搜尋資訊係用於複數社群資料源中,擷取社群資料源之複數使用者資訊及其對應之至少一社群互動資訊。過濾模組鏈結擷取模組,用以依據指定人員之人員資料,自使用者資訊及其對應之至少一社群互動資訊中,進行過濾處理以擷取出至少一過濾資訊,其中每一過濾資訊係為被判斷對應指定人員之使用者資訊及其對應之社群互動資訊。判斷模組鏈結過濾模組,用以根據過濾資訊,判斷對應指定人員之至少一關鍵字詞。
因此,本發明之另一態樣是在提供社群資料篩選方法,包含:自資料庫的複數人員資料及其對應的複數識別資訊中,擷取對應指定人員之人員資料及其識別資訊;根據識別資訊產生複數搜尋資訊;根據搜尋資訊,於複數社群資料源中,擷取社群資料源之複數使用者資訊及其對應之至少一社群互動資訊;依據指定人員之人員資料,自使 用者資訊及其對應之至少一社群互動資訊中,進行過濾處理以擷取出至少一過濾資訊,其中每一過濾資訊係為被判斷對應指定人員之使用者資訊及其對應之社群互動資訊;以及根據過濾資訊,判斷對應指定人員之至少一關鍵字詞。
依據本發明一實施例,其中社群資料篩選系統及方法更包含儲存所擷取出之使用者資訊及其分別對應之至少一社群互動資訊於社群資料庫,且提供所儲存之資訊以進行過濾處理。
依據本發明另一實施例,其中所擷取之每一社群互動資訊中更包括有對應每一社群互動資料之時間資訊,判斷至少一關鍵字詞之步驟更包含根據過濾資訊及指定時間資訊,判斷對應指定人員及對應指定時間之至少一關鍵字詞。
依據本發明又一實施例,其中社群資料篩選系統及方法於擷取過濾資訊、進行過濾處理時,對使用者資訊所對應之社群互動資訊進行語意分析及匹配,分別產生每一使用者資訊之社群互動資訊間之行為性關聯值,其中行為性關聯值係依據社群互動資訊間之時間性關聯值、地域性關聯值和字詞性關聯值而產生;依據社群互動資訊之行為性關聯值,找出其大於關聯性門檻值者其社群互動資訊所對應之使用者資訊,以判斷其係對應於候選人員;比對指定人員之人員資料和對應候選人員的所有使用者資訊;以及決定對應候選人員之使用者資訊及社群互動資訊,是否為至少一過濾資訊。
依據本發明又一實施例,其中社群資料篩選系統及方 法於擷取過濾資訊時,分別從每一使用者資訊及其對應之社群互動資訊擷取出社群人際關係資訊,以對應每一使用者資訊;依據使用者資訊及其對應社群人際關係資訊,找出至少二組的社群人際關係資訊之間的相似度大於相似度門檻值者,判斷至少二組的使用者資訊為對應於候選人員;比對指定人員之人員資料和對應候選人員的使用者資訊;以及決定對應候選人員之使用者資訊及社群互動資訊,是否為至少一過濾資訊。擷取過濾資訊之步驟更包含:在比對指定人員之人員資料和對應候選人員的使用者資訊,以決定每一對應候選人員之使用者資訊及社群互動資訊是否為至少一過濾資訊之前,進行資料分群及消岐處理,將經過資料分群及消岐處理後所得的候選人員之使用者資訊及社群互動資訊,決定為過濾資訊。擷取過濾資訊之步驟更包含:對擷取使用者資訊中之使用者名稱和指定人員之識別資訊進行混合比對;擷取使用者資訊中之個人資料;以及根據個人資料、行為性關聯值及混合比對之結果,進行資料分群以及消岐處理。
因此,本發明之又一態樣是在提供一種非揮發性電腦可讀取紀錄媒體,儲存電腦程式,用以執行一種社群資料濾篩方法,包含:自資料庫的複數人員資料及其對應的複數識別資訊中,擷取對應指定人員之人員資料及其識別資訊;根據識別資訊產生複數搜尋資訊;根據搜尋資訊,於複數社群資料源中,擷取社群資料源之複數使用者資訊及其對應之至少一社群互動資訊;依據指定人員之人員資 料,自使用者資訊及其對應之至少一社群互動資訊中,進行過濾處理以擷取出至少一過濾資訊,其中每一過濾資訊係為被判斷對應指定人員之使用者資訊及其對應之社群互動資訊;以及根據過濾資訊,判斷對應指定人員之至少一關鍵字詞。
應用本發明之優點在於藉由社群資料篩選系統、方法及其非揮發性電腦可讀取紀錄媒體,根據資料庫的人員資料及識別資訊,快速地從社群資料源擷取使用者資訊及社群互動資訊進行分析與比對,判斷相符的資訊與關鍵字詞,而輕易地達到上述之目的。
1‧‧‧社群資料篩選系統
100‧‧‧資料庫
101‧‧‧人員資料
102‧‧‧擷取模組
103‧‧‧識別資訊
104‧‧‧社群資料庫
105‧‧‧搜尋資訊
106‧‧‧過濾模組
107‧‧‧使用者資訊
108‧‧‧判斷模組
109‧‧‧社群互動資訊
110‧‧‧客戶篩選模組
111‧‧‧過濾資訊
112‧‧‧社群資料源
113‧‧‧關鍵字詞
115‧‧‧客戶篩選資料
117‧‧‧目標人員
200‧‧‧語意分析及匹配單元
201‧‧‧行為性關聯值
202‧‧‧社群人際關係擷取單元
203‧‧‧社群人際關係資訊
204‧‧‧使用者名稱擷取單元
205‧‧‧混合比對結果
206‧‧‧個人資料擷取單元
207‧‧‧個人資料
208‧‧‧資料分群及消岐單元
210‧‧‧比對單元
30‧‧‧資訊形態偏好分析元件
32‧‧‧動態分析元件
34‧‧‧斷詞分析元件
第1A圖為本發明一實施例中,一種社群資料篩選系統之方塊圖。
第1B圖為本發明另一實施例中,一種社群資料篩選系統之方塊圖。
第2圖為本發明一實施例中,過濾模組更詳細的方塊圖。
第3圖為本發明一實施例中,語意分析及匹配單元更詳細的方塊圖。
第4圖為本發明一實施例中,一種社群資料篩選方法之流程圖。
請參照第1A圖。第1A圖為本發明一實施例中,一種 社群資料篩選系統1之方塊圖。社群資料篩選系統1主要包含:資料庫100、擷取模組102、過濾模組106、以及判斷模組108。
資料庫100用以儲存複數人員資料101及其對應的複數識別資訊103。資料庫100於一實施例中,可例如但不限於為企業內部的客戶資料庫,以儲存有與客戶相關的人員資料101。其對應的識別資訊103可包含例如但不限於中文姓名、英文姓名、電子郵件帳號、暱稱、住址、職業、服務單位、畢業或正在就讀的學校、生日、電話、消費紀錄等資訊。
擷取模組102鏈結資料庫100,用以自資料庫100的人員資料101中,擷取對應一指定人員(例如一個特定客戶)的人員資料101及其識別資訊103。舉例來說,上述的指定人員可以是擷取模組102自行從資料庫100選取,例如隨機選擇或依照一順序來依序選取,又或者可以由社群資料篩選系統1自其選擇性配置的輸入模組或操作介面(未繪示)來接收一使用者的輸入後以選擇一個指定的人員,擷取模組102即可依據使用者的輸入從資料庫100中擷取出對應的相關資訊。在一些實施例中,輸入模組或操作介面,可以是鍵盤、滑鼠、觸控螢幕、麥克風、應用程式介面、人機介面等,或是其中兩種以上組合。
擷取模組102進一步根據識別資訊103產生複數搜尋資訊105。搜尋資訊105可用於複數社群資料源,例如第1A圖所繪示的社群資料源112中,以擷取社群資料源112 中的複數使用者資訊107及其對應之至少一社群互動資訊109。社群資料源之數目可隨不同實施例調整,社群資料源例如但不限於Facebook、Twitter、Plurk、Google+、Youtube等社群網站的伺服器或資料庫,亦或者是Yahoo、Sina、sohu等入口網站的網路購物、部落格、微網誌、論壇、交友服務等資訊等。
於不同實施例中,擷取模組102可利用前述的識別資訊103(例如中文姓名、英文姓名、電子郵件帳號、綽號)中的部分或其組合等資訊產生搜尋資訊105,用以於社群資料源112中搜尋部份相符或完全相符的資料。依據搜尋資訊105可從這些社群資料源112中擷取出的使用者資訊107,例如社群平台所記錄其用戶的使用者資料如個人資料或登錄資料等。在一些實施例中,所擷取的使用者資訊107,其與識別資訊103的中文姓名、英文姓名、暱稱、住址、職業、服務單位、畢業或正在就讀的學校、生日、電話等,可以是某種程度近似、部份相符或完全相符。社群互動資訊109則可以是對應使用者資訊107在各類社群平台或入口網站的發佈訊息、按讚、網路購物歷史資訊、網路瀏覽歷史資訊、社群人際關係資訊、地區移動歷史資訊等。其中,社群互動資訊109還可包含與這些資訊相關的時間資訊。舉例來說,社群互動資訊109可包含此使用者發佈訊息與瀏覽網路資訊的時間。
舉例來說,當資料庫100所儲存的人員資料101有一位使用者李愛國,且其對應識別資訊103包含如生日為 12月23日、英文姓名為Tom、地址為台北市、電子郵件帳號為leeguo@gmail.com等資訊。而一般不同社群資料源中所儲存的使用者資料並不完全相同,也就是說,每一社群資料源可能會記錄不同種類、不同欄位的資料。擷取模組102可從數個社群資料源中擷取出所需要的複數使用者資訊及每一使用者所分別對應的社群互動資訊予以儲存,例如擷取出的使用者資訊的種類可包括資料源、名稱、年齡、居住城市、畢業學校等,社群互動資訊的種類可包括好友、發布訊息、按讚訊息等。儲存方式可以有多種形式,例如將所有擷取資料全部儲存在一表格中,或是分成數個不同的關聯式表格來儲存,或是儲存成一記錄檔案。過濾模組106鏈結擷取模組102,用以依據指定人員之人員資料101,自使用者資訊社群互動資訊107中,進行過濾處理以擷取出至少一過濾資訊111。
第1B圖為本發明另一實施例之社群資料篩選系統方塊圖,除了和第1A圖相同的元件之外,更進一步包含有社群資料庫104以及客戶篩選模組110。請參照第1B圖,社群資料篩選系統1可選擇性地設置或可鏈結到外部的一個社群資料庫104,以鏈結於擷取模組102及過濾模組106,並儲存擷取模組102所擷取出之使用者資訊107及其對應的社群互動資訊109,以提供所儲存之資訊予過濾模組106進行處理。因此,過濾模組106可直接從擷取模組102獲取使用者資訊107及社群互動資訊109,亦或間接地透過社群資料庫104獲取使用者資訊107及社群互動資訊109。
在第1A圖和第1B圖的實施例中,過濾模組106可藉由過濾處理產生過濾資訊111,過濾資訊111係為被判斷對應指定人員之使用者資訊107及社群互動資訊109。關於過濾模組106更詳細的元件結構與過濾處理更詳細的進行方式,將於後續的段落有更細部的說明。更進一步地,於一實施例中,過濾模組106所產生的過濾資訊111,可經由社群資料篩選系統1選擇性配置的顯示模組或操作介面(未繪示)顯示,並接收確認輸入的資訊,此確認輸入的資訊可以是由一使用者來輸入,或是經由社群資料篩選系統1將過濾資訊111和其他可供比對確認的資訊進行自動比對,比對結果相符時自動產生。過濾模組106可在接收到過濾資訊111及確認輸入資訊之後,判斷被確認的過濾資訊11為適格之過濾資訊111,以更為提高過濾資訊111的準確性。
判斷模組108鏈結過濾模組106,用以根據過濾資訊111,判斷對應指定人員之至少一關鍵字詞113。此關鍵字詞,可能是此指定人員的喜好、需求、消費傾向、關注議題、有興趣物品等資訊。因此,企業將可根據判斷的關鍵字詞來了解客戶想得知的產品資訊,進而規劃行銷方案或是選擇是適當的客戶來進行行銷。
於另一實施例中,擷取模組102所擷取的每一筆社群互動資訊107中,更可包括有對應的時間資訊,例如每一筆社群互動資訊107所發布的時間或是社群互動資訊107中所提及的時間。判斷模組108還可根據過濾資訊111 和一指定時間資訊,判斷對應指定人員及對應指定時間的關鍵字詞113。例如,當指定時間資訊係為一年時,判斷模組108將可從過濾資訊111中,找出其中社群互動資訊107所對應的時間資訊(發布時間或內容提及時間)係為搜尋當日起1年以內的社群互動資訊107,再依據1年以內的社群互動資訊107來判斷對應指定人員及對應指定時間的關鍵字詞,避免過久以前的資訊影響判斷的結果。
於又一實施例中,判斷模組108亦可選擇性地鏈結於資料庫100,以將對應指定人員之關鍵字詞113,儲存於資料庫100中作為對應指定人員之人員資料的對應關鍵字詞113的資料,或是更新資料庫100中原有的關鍵字詞113資料。鏈結於資料庫100的客戶篩選模組110,將可用以透過例如社群資料篩選系統1選擇性配置的輸入模組接收客戶篩選資料115,以依據資料庫100之人員資料101及其對應的關鍵字詞113的資料,篩選出對應客戶篩選資料115之至少一目標人員117。
更進一步時,過濾模組更可經由語意分析技術、社群人際關係擷取技術、資料分群/消岐技術或混合比對技術等,來產生過濾資訊111。請參照第2圖。第2圖為本發明又一實施例中,過濾模組106更詳細的方塊圖。於本實施例中,過濾模組106可以進一步包含語意分析及匹配單元200、社群人際關係擷取單元202、使用者名稱擷取單元204、個人資料擷取單元206、資料分群及消岐單元208以及比對單元210等其中任一單元,或其中任兩種以上之組 合。其中,語意分析及匹配單元200、社群人際關係擷取單元202、使用者名稱擷取單元204以及個人資料擷取單元206分別接收人員資料101、識別資訊103、使用者資訊107及社群互動資訊109,以進行各自的處理程序。
語意分析及匹配單元的相關技術說明說明如下,請參照第3圖。第3圖為本發明一實施例中,語意分析及匹配單元200更詳細的方塊圖。語意分析及匹配單元200對使用者資訊107所對應之社群互動資訊109進行語意分析及匹配。於本實施例中,語意分析及匹配單元200包含資訊形態偏好分析元件30、動態分析元件32以及斷詞分析元件34。
資訊形態偏好分析元件30對社群互動資訊109進行資訊形態分析。舉例來說,互動資訊可被分析為是文字格式、影音格式或圖片格式的資訊。動態分析元件32對社群互動資訊109進行時間分析以及地點分析。舉例來說,動態分析元件32可根據訊息發佈的時間戳記與其發佈的來源網路位址,判斷此訊息發佈的時間與地點。
斷詞分析元件34可對社群互動資訊109進行關聯性分析以及關鍵字偵測。舉例來說,斷詞分析元件34可將社群互動資訊109的文字內容拆成多個單字或詞彙,分析這些單字或詞彙彼此間,或是與時間及地點資訊的關聯,以及單獨或共同出現的頻率,以進行關鍵字的偵測與字詞間的關聯性分析。根據上述的分析,語意分析及匹配單元200可產生時間性關聯值、地域性關聯值和字詞性關聯值, 並根據這些關聯值的統計計算產生每一個使用者資訊107所對應的社群互動資訊109間的行為性關聯值201。
資訊形態偏好分析元件30、動態分析元件32以及斷詞分析元件34可對前述所擷取出社群互動資訊,例如使用者的發布訊息內容進行分析,以辨識出文字格式、發布時間及偵測關鍵字。以關鍵字的偵測來舉例說明,當以BMW為關鍵字時,可分析所有發布訊息中的文字,找出包含有BMW的發布訊息。當發布訊息的時間較為久遠時,可能被視為時效性不佳而不予擷取。
社群人際關係擷取單元202分別從每一使用者資訊107及其對應之社群互動資訊109中,擷取出社群人際關係資訊203,以對應每一使用者資訊107。社群人際關係資訊203可為例如但不限於社群網站中,此使用者所加的好友或是曾藉由發佈訊息溝通的對象相關的資訊。
社群人際關係擷取單元202可從前述所擷取出的社群互動資訊,例如使用者的好友資料行分析,以辨識出相關的社群人際關係資訊203。於一實施例中,除使用者的好友資料外,社群人際關係擷取單元202亦可進一步地根據使用者好友的好友資料,即第二層的好友關係做為資料源,以達到更複雜的社群人際關係分析。
使用者名稱擷取單元204擷取使用者資訊107中的使用者名稱,並將使用者名稱和指定人員之識別資訊103進行混合比對。使用者名稱可例如但不限於為此使用者的中文姓名、英文姓名、暱稱或電子郵件帳號的資訊。其中 上述的混合比對,是由使用者名稱擷取單元204參考各種具身份識別性質的識別資訊103,例如姓名、電話號碼、電子郵件帳號等資訊,對使用者名稱進行字詞拼音轉換比對、部份比對、字首比對、字尾比對和代稱比對其中之一,或其中二種以上之組合,以產生混合比對結果205。其中,指定人員之識別資訊103亦可進行拆解與組合,取部份或全部的資訊內容來與使用者名稱進行混合比對。
個人資料擷取單元206擷取使用者資訊中之個人資料207。個人資料207可包含例如但不限於使用者的住址、職業、服務單位、畢業或正在就讀的學校、生日、電話等。
資料分群及消岐單元208根據個人資料207、行為性關聯值201及混合比對205之結果,進行資料分群以及消岐處理。資料分群及消歧單元可採用一般習知的資料分群技術和資料消歧技術,例如資料分群技術可以是K-Means、Nelder-Mead搜尋法、粒子群體最佳化演等,資料消歧技術可以利用決策樹、最大熵、消歧義資料、或其他等方法來判斷資料之間是否為相同或相異。
比對單元210可綜合上述的資訊進行比對處理。舉例來說,比對單元210可先藉由個人資料207以及由使用者名稱產生的混合比對結果205,先與指定人員之人員資料101比對,以篩選出可能的對應候選人員。接著,比對單元210可根據經過資料分群以及消岐處理過後的社群人際關係資訊203,找出至少二組的社群人際關係資訊203之間的 相似度大於一個預設的相似度門檻值者,以判斷至少二組的使用者資訊107為對應於候選人員,再比對指定人員之人員資料101和對應候選人員的使用者資訊107,以決定對應候選人員之使用者資訊107及社群互動資訊109,是否為過濾資訊111。
並且,比對單元210更依據社群互動資訊109之行為性關聯值201,找出其大於預設的關聯性門檻值者,其社群互動資訊所對應之使用者資訊107,以判斷其係對應於候選人員,再比對指定人員之人員資料和對應候選人員的所有使用者資訊107,以決定對應候選人員之使用者資訊107及社群互動資訊109,是否為過濾資訊111。
比對單元210可對前述從社群資料源中所擷取出的複數個使用者資料(例如包括李愛國、Tom Lee、AiKuoLee、AiGuoLee及Tom1223等多筆資料),與資料庫100中的人員資料101(例如李愛國、Tom、leeguo及生日等)個人資料混合比對,並可因而排除掉所擷取複數個使用者資料中差異性較大的使用者資料,例如AiKuoLee。比對單元210亦可判斷如第1組及第6組資料間的社群人際關係資訊203間的相似度大於預設的相似度門檻值,而判斷此二組的使用者資訊107為對應於候選人員。比對單元210更可根據張貼訊息判斷這些訊息間的行為性關聯值,例如第1、3及7組的張貼訊息時間相近且關注相同的議題來判斷這些社群互動資訊109所對應之使用者資訊107係對應於候選人員。比對單元210可進一步比對指定人員之人員 資料101和對應候選人員的所有使用者資訊107,以進一步確定哪些使用者資訊107可為過濾資訊111。
在產生過濾資訊111後,判斷模組108將可據以判斷對應指定人員之關鍵字詞113。以前述實施例為例關鍵字詞113例如可以是BMW。
因此,本發明的藉由社群資料篩選系統1可根據資料庫的人員資料及識別資訊,快速地從社群資料源擷取使用者資訊及社群互動資訊,並以多種方式進行分析與比對,進而判斷相符的資訊與關鍵字詞,有效率且精確地獲得人員的喜好與關注議題的相關資訊。
請參照第4圖。第4圖為本發明一實施例中,一種社群資料篩選方法400之流程圖。社群資料篩選方法400可應用於如第1圖所示的社群資料篩選系統1中,或經由其他硬體元件如資料庫、一般處理器、計算機、伺服器、或其他具特定邏輯電路的獨特硬體裝置或具特定功能的設備來實作,如將程式碼和處理器/晶片整合成獨特硬體。此社群資料篩選方法400可實作為一電腦程式,並儲存於一電腦可讀取記錄媒體中,而使電腦讀取此記錄媒體後執行即時地點推薦方法。電腦可讀取記錄媒體可為唯讀記憶體、快閃記憶體、軟碟、硬碟、光碟、隨身碟、磁帶、可由網路存取之資料庫或熟悉此技藝者可輕易思及具有相同功能之電腦可讀取紀錄媒體。社群資料篩選方法400下列步驟(應瞭解到,在本實施方式中所提及的步驟,除特別敘明其順序者外,均可依實際需要調整其前後順序,甚至 可同時或部分同時執行)。
於步驟401,擷取模組102自資料庫100的人員資料101及其對應的識別資訊103中,擷取對應指定人員之人員資料101及其識別資訊103。
於步驟402,擷取模組102根據識別資訊103產生搜尋資訊105。
於步驟403,擷取模組102根據搜尋資訊105,於社群資料源(如第1圖中的社群資料源112)中,擷取社群資料源之使用者資訊107及其對應之社群互動資訊109。
於步驟404,過濾模組106依據指定人員之人員資料101,自使用者資訊107及其對應之社群互動資訊109中,進行過濾處理以擷取出過濾資訊111,其中每一過濾資訊111係為被判斷對應指定人員之使用者資訊107及其對應之社群互動資訊109
於步驟405,判斷模組108根據過濾資訊111,判斷對應指定人員之關鍵字詞113。
該方法的其他細部技術或實施方式,可參考前述社群資料篩選系統1及其實施例的說明,不再重複贅述。
雖然本揭示內容已以實施方式揭露如上,然其並非用以限定本揭示內容,任何熟習此技藝者,在不脫離本揭示內容之精神和範圍內,當可作各種之更動與潤飾,因此本揭示內容之保護範圍當視後附之申請專利範圍所界定者為準。
1‧‧‧社群資料篩選系統
100‧‧‧資料庫
101‧‧‧人員資料
102‧‧‧擷取模組
103‧‧‧識別資訊
105‧‧‧搜尋資訊
106‧‧‧過濾模組
107‧‧‧使用者資訊
108‧‧‧判斷模組
109‧‧‧社群互動資訊
111‧‧‧過濾資訊
112‧‧‧社群資料源

Claims (15)

  1. 一種社群資料篩選系統,包含:一資料庫,用以儲存複數人員資料及其對應的複數識別資訊;一擷取模組,鏈結該資料庫,用以自該資料庫的該等人員資料中擷取對應一指定人員之人員資料及其該等識別資訊,並根據該等識別資訊產生複數搜尋資訊,其中該等搜尋資訊係用於複數社群資料源中,擷取該等社群資料源之複數使用者資訊及其對應之至少一社群互動資訊;一過濾模組,鏈結該擷取模組,用以依據該指定人員之人員資料,自該等使用者資訊及其對應之該至少一社群互動資訊中,進行一過濾處理以擷取出至少一過濾資訊,其中每一該過濾資訊係為被判斷對應該指定人員之使用者資訊及其對應之該社群互動資訊;以及一判斷模組,鏈結該過濾模組,用以根據該過濾資訊,判斷對應該指定人員之至少一關鍵字詞,其中該過濾模組更包含一語意分析及匹配單元,用以於該過濾模組進行該過濾處理時,係對該等使用者資訊所對應之該社群互動資訊進行語意分析及匹配,分別產生每一使用者資訊之該社群互動資訊間之一行為性關聯值,其中該行為性關聯值係依據該社群互動資訊間之一時間性關聯值、一地域性關聯值和一字詞性關聯值而產生;以及一比對模組依據該社群互動資訊之該行為性關聯值,找出其大於一關聯性門檻值者其該社群互動資訊所對應之該等使用者資訊,以判斷其係對應於一候選人員,再比對該指定人員之該人員資料和對應該候選人員的所有該等使用者資訊,以決定對應該候選 人員之該等使用者資訊及該社群互動資訊,是否為該至少一過濾資訊。
  2. 如請求項1所述之社群資料篩選系統,更包括一社群資料庫,鏈結該擷取模組及該過濾模組,用以儲存該擷取模組所擷取出之該等使用者資訊及其分別對應之該至少一社群互動資訊,且提供所儲存之資訊以供該過濾模組進行該過濾處理。
  3. 如請求項1所述之社群資料篩選系統,其中所擷取之每一該社群互動資訊中更包括有對應每一該社群互動資料之一時間資訊;以及該判斷模組更用以根據該過濾資訊及一指定時間資訊,判斷對應該指定人員及對應該指定時間之該至少一關鍵字詞。
  4. 如請求項1所述之社群資料篩選系統,其中該過濾模組更包含一社群人際關係擷取單元,用以分別從每一該使用者資訊及其對應之該社群互動資訊擷取出一社群人際關係資訊,以對應每一該使用者資訊;以及該過濾模組更用以依據該等使用者資訊及其對應社群人際關係資訊,找出至少二組的該社群人際關係資訊之間的相似度大於一相似度門檻值者,判斷該至少二組的使用者資訊為對應於一候選人員,再比對該指定人員之該人員資料和對應該候選人員的使用者資訊,以決定對應該候選人員之該等使用者資訊及該社群互動資訊,是否為該至少一過濾資訊。
  5. 如請求項4所述之社群資料篩選系統,其中該過濾模組更於比對該指定人員之該人員資料和對應該候選人員的使用者資訊,以決定每一對應該候選人員之該等使用者資訊及該社群互動資訊是否為該至少一過濾資訊之前,進行一資料分群及消岐處理,將經過該資料分群及消岐處理後所得的該候選人員之該等使用者資訊及該社群互動資訊,決定為該過濾資訊。
  6. 如請求項1所述之社群資料篩選系統,其中該過濾模組更包含:一使用者名稱擷取單元,以擷取該等使用者資訊中之一使用者名稱,以和該指定人員之該等識別資訊進行一混合比對;一個人資料擷取單元,以擷取該等使用者資訊中之一個人資料;以及一資料分群及消岐單元,以根據該個人資料、該行為性關聯值及該混合比對之結果,進行資料分群以及消岐處理。
  7. 如請求項1所述之社群資料篩選系統,其中該語意分析及匹配單元更包含:一資訊形態偏好分析元件,用以對該等社群互動資訊進行一資訊形態分析;一動態分析元件,用以對該等社群互動資訊進行一時間分析以及一地點分析;以及一斷詞分析元件,用以對該等社群互動資訊進行一關聯 性分析以及一關鍵字偵測。
  8. 一種社群資料篩選方法,包含:自一資料庫的複數人員資料及其對應的複數識別資訊中,擷取對應一指定人員之一人員資料及其該等識別資訊;根據該等識別資訊產生複數搜尋資訊;根據該等搜尋資訊,於複數社群資料源中,擷取該等社群資料源之複數使用者資訊及其對應之至少一社群互動資訊;依據該指定人員之人員資料,自該等使用者資訊及其對應之該至少一社群互動資訊中,進行一過濾處理以擷取出至少一過濾資訊,其中每一該過濾資訊係為被判斷對應該指定人員之使用者資訊及其對應之該社群互動資訊,其中擷取該過濾資訊之步驟更包含:於進行該過濾處理時,對該等使用者資訊所對應之該社群互動資訊進行語意分析及匹配,分別產生每一使用者資訊之該社群互動資訊間之一行為性關聯值,其中該行為性關聯值係依據該社群互動資訊間之一時間性關聯值、一地域性關聯值和一字詞性關聯值而產生;依據該社群互動資訊之該行為性關聯值,找出其大於一關聯性門檻值者其該社群互動資訊所對應之該等使用者資訊,以判斷其係對應於一候選人員;比對該指定人員之該人員資料和對應該候選人員的所有該等使用者資訊;以及決定對應該候選人員之該等使用者資訊及該社群互動資訊,是否為該至少一過濾資訊;以及 根據該過濾資訊,判斷對應該指定人員之至少一關鍵字詞。
  9. 如請求項8所述之社群資料篩選方法,其中更包含儲存該擷取模組所擷取出之該等使用者資訊及其分別對應之該至少一社群互動資訊於一社群資料庫,且提供所儲存之資訊以進行該過濾處理。
  10. 如請求項8所述之社群資料篩選方法,其中所擷取之每一該社群互動資訊中更包括有對應每一該社群互動資料之一時間資訊,判斷該至少一關鍵字詞之步驟更包含根據該過濾資訊及一指定時間資訊,判斷對應該指定人員及對應該指定時間之該至少一關鍵字詞。
  11. 如請求項8所述之社群資料篩選方法,其中擷取該過濾資訊之步驟更包含:分別從每一該使用者資訊及其對應之該社群互動資訊擷取出一社群人際關係資訊,以對應每一該使用者資訊;依據該等使用者資訊及其對應社群人際關係資訊,找出至少二組的該社群人際關係資訊之間的相似度大於一相似度門檻值者,判斷該至少二組的使用者資訊為對應於一候選人員;比對該指定人員之該人員資料和對應該候選人員的使用者資訊;以及決定對應該候選人員之該等使用者資訊及該社群互動資訊,是否為該至少一過濾資訊。
  12. 如請求項11所述之社群資料篩選方法,其中擷取該過濾資訊之步驟更包含:在比對該指定人員之該人員資料和對應該候選人員的使用者資訊,以決定每一對應該候選人員之該等使用者資訊及該社群互動資訊是否為該至少一過濾資訊之前,進行一資料分群及消岐處理,將經過該資料分群及消岐處理後所得的該候選人員之該等使用者資訊及該社群互動資訊,決定為該過濾資訊。
  13. 如請求項8所述之社群資料篩選方法,其中擷取該過濾資訊之步驟更包含:對擷取該等使用者資訊中之一使用者名稱和該指定人員之該等識別資訊進行一混合比對;擷取該等使用者資訊中之一個人資料;以及根據該個人資料、該行為性關聯值及該混合比對之結果,進行資料分群以及消岐處理。
  14. 如請求項8所述之社群資料篩選方法,其中該語意分析及匹配包含一關聯性分析以及一關鍵字偵測、一資訊形態分析、一時間分析、一地點分析或其組合。
  15. 一種非揮發性電腦可讀取紀錄媒體,儲存一電腦程式,用以執行一種社群資料濾篩方法,其中該社群資料濾篩方法包含:自一資料庫的複數人員資料及其對應的複數識別資訊 中,擷取對應一指定人員之一人員資料及其該等識別資訊;根據該等識別資訊產生複數搜尋資訊;根據該等搜尋資訊,於複數社群資料源中,擷取該等社群資料源之複數使用者資訊及其對應之至少一社群互動資訊;依據該指定人員之人員資料,自該等使用者資訊及其對應之該至少一社群互動資訊中,進行一過濾處理以擷取出至少一過濾資訊,其中每一該過濾資訊係為被判斷對應該指定人員之使用者資訊及其對應之該社群互動資訊,其中擷取該過濾資訊之步驟更包含:於進行該過濾處理時,對該等使用者資訊所對應之該社群互動資訊進行語意分析及匹配,分別產生每一使用者資訊之該社群互動資訊間之一行為性關聯值,其中該行為性關聯值係依據該社群互動資訊間之一時間性關聯值、一地域性關聯值和一字詞性關聯值而產生;依據該社群互動資訊之該行為性關聯值,找出其大於一關聯性門檻值者其該社群互動資訊所對應之該等使用者資訊,以判斷其係對應於一候選人員;比對該指定人員之該人員資料和對應該候選人員的所有該等使用者資訊;以及決定對應該候選人員之該等使用者資訊及該社群互動資訊,是否為該至少一過濾資訊;以及根據該過濾資訊,判斷對應該指定人員之至少一關鍵字詞。
TW102121561A 2013-06-18 2013-06-18 社群資料篩選系統、方法及其非揮發性電腦可讀取紀錄媒體 TWI575391B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
TW102121561A TWI575391B (zh) 2013-06-18 2013-06-18 社群資料篩選系統、方法及其非揮發性電腦可讀取紀錄媒體
CN201310359197.3A CN104240107B (zh) 2013-06-18 2013-08-16 社群数据筛选系统及其方法
US14/281,912 US9607031B2 (en) 2013-06-18 2014-05-20 Social data filtering system, method and non-transitory computer readable storage medium of the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW102121561A TWI575391B (zh) 2013-06-18 2013-06-18 社群資料篩選系統、方法及其非揮發性電腦可讀取紀錄媒體

Publications (2)

Publication Number Publication Date
TW201500941A TW201500941A (zh) 2015-01-01
TWI575391B true TWI575391B (zh) 2017-03-21

Family

ID=52020164

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102121561A TWI575391B (zh) 2013-06-18 2013-06-18 社群資料篩選系統、方法及其非揮發性電腦可讀取紀錄媒體

Country Status (3)

Country Link
US (1) US9607031B2 (zh)
CN (1) CN104240107B (zh)
TW (1) TWI575391B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107710858B (zh) * 2015-04-13 2021-12-03 瑞典爱立信有限公司 用于减少由于ProSe操作引起的服务小区中断的方法
TWI649712B (zh) * 2017-12-08 2019-02-01 財團法人工業技術研究院 電子裝置、決策流程模組的呈現方法及電腦可讀式媒體
CN110020375B (zh) * 2017-12-28 2023-06-27 沈阳新松机器人自动化股份有限公司 一种社交网络用户影响力的评估方法
TWI779311B (zh) * 2020-07-08 2022-10-01 合作金庫人壽保險股份有限公司 職業類別判斷系統和職業類別判斷方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200935250A (en) * 2007-12-20 2009-08-16 Yahoo Inc Recommendation system using social behavior analysis and vocabulary taxonomies
TW201001179A (en) * 2008-06-27 2010-01-01 Ind Tech Res Inst System and method for establishing personal social network, trusted network and social networking system
TW201115371A (en) * 2009-10-28 2011-05-01 Ind Tech Res Inst Systems and methods for organizing collective social intelligence information using an organic object data model
US20110179161A1 (en) * 2010-01-21 2011-07-21 International Business Machines Corporation Aggregation of social network data

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6483523B1 (en) * 1998-05-08 2002-11-19 Institute For Information Industry Personalized interface browser and its browsing method
US6845354B1 (en) * 1999-09-09 2005-01-18 Institute For Information Industry Information retrieval system with a neuro-fuzzy structure
US6845345B1 (en) * 2001-02-06 2005-01-18 Advanced Micro Devices, Inc. System for monitoring and analyzing diagnostic data of spin tracks
TWI337715B (en) * 2006-11-08 2011-02-21 Inst Information Industry Method and system for complex event processing
US10242104B2 (en) 2008-03-31 2019-03-26 Peekanalytics, Inc. Distributed personal information aggregator
CN102053979B (zh) * 2009-10-27 2012-12-12 华为技术有限公司 一种信息收集方法和系统
US20110125770A1 (en) 2009-11-25 2011-05-26 Nokia Corporation Method and apparatus for facilitating identity resolution
CN102117331B (zh) * 2011-03-07 2014-09-17 北京百度网讯科技有限公司 视频搜索方法及系统
CN102231188A (zh) * 2011-07-05 2011-11-02 上海合合信息科技发展有限公司 结合文字识别和图像匹配的名片识别方法
TWI482031B (zh) * 2012-11-14 2015-04-21 Inst Information Industry 在雲端儲存服務下提供以檔案為關聯之社群互動方法、系統以及儲存有此方法之電腦可讀取記錄媒體

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200935250A (en) * 2007-12-20 2009-08-16 Yahoo Inc Recommendation system using social behavior analysis and vocabulary taxonomies
TW201001179A (en) * 2008-06-27 2010-01-01 Ind Tech Res Inst System and method for establishing personal social network, trusted network and social networking system
TW201115371A (en) * 2009-10-28 2011-05-01 Ind Tech Res Inst Systems and methods for organizing collective social intelligence information using an organic object data model
US20110179161A1 (en) * 2010-01-21 2011-07-21 International Business Machines Corporation Aggregation of social network data
TW201202958A (en) * 2010-01-21 2012-01-16 Ibm Aggregation of social network data

Also Published As

Publication number Publication date
TW201500941A (zh) 2015-01-01
CN104240107B (zh) 2017-12-05
US9607031B2 (en) 2017-03-28
US20140372459A1 (en) 2014-12-18
CN104240107A (zh) 2014-12-24

Similar Documents

Publication Publication Date Title
US20240273154A1 (en) Automatic article enrichment by social media trends
Eberendu Unstructured Data: an overview of the data of Big Data
US11122009B2 (en) Systems and methods for identifying geographic locations of social media content collected over social networks
US10235464B2 (en) Method and apparatus for recommending hashtags
US10146878B2 (en) Method and system for creating filters for social data topic creation
US10825110B2 (en) Entity page recommendation based on post content
US20130297581A1 (en) Systems and methods for customized filtering and analysis of social media content collected over social networks
US20130304818A1 (en) Systems and methods for discovery of related terms for social media content collection over social networks
US20130297694A1 (en) Systems and methods for interactive presentation and analysis of social media content collection over social networks
US20150120583A1 (en) Process and mechanism for identifying large scale misuse of social media networks
US11416680B2 (en) Classifying social media inputs via parts-of-speech filtering
US9256593B2 (en) Identifying product references in user-generated content
US10002187B2 (en) Method and system for performing topic creation for social data
US10021061B1 (en) Message presentation management in a social networking environment
US9542669B1 (en) Encoding and using information about distributed group discussions
CA2977847A1 (en) Automated extraction tools and their use in social content tagging systems
US20160092960A1 (en) Product recommendations over multiple stores
US20160335367A1 (en) Entity disambiguation using multisource learning
TWI575391B (zh) 社群資料篩選系統、方法及其非揮發性電腦可讀取紀錄媒體
TW201719569A (zh) 社交業務特徵用戶的識別方法和裝置
EP2962213A1 (en) Federated social media analysis system and method thereof
US20100169318A1 (en) Contextual representations from data streams
WO2021114634A1 (zh) 文本标注方法、设备及存储介质
US10339559B2 (en) Associating social comments with individual assets used in a campaign
US20160124946A1 (en) Managing a set of data