CN112364169A - 基于nlp的wifi识别方法、电子设备和介质 - Google Patents
基于nlp的wifi识别方法、电子设备和介质 Download PDFInfo
- Publication number
- CN112364169A CN112364169A CN202110039208.4A CN202110039208A CN112364169A CN 112364169 A CN112364169 A CN 112364169A CN 202110039208 A CN202110039208 A CN 202110039208A CN 112364169 A CN112364169 A CN 112364169A
- Authority
- CN
- China
- Prior art keywords
- wifi
- name information
- label
- wifi name
- corpus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于nlp的wifi识别方法、电子设备和介质,方法包括步骤S1、获取多个已标注标签的wifi名称信息作为语料构建语料库,所述语料库中的标签包括公共wifi标签和M个类别的wifi标签;步骤S2、从所述语料库中获取所有第m标签对应的wifi名称信息,构建第m目标关键词列表;步骤S3、获取待识别的wifi名称信息,并判断所述待识别的wifi名称信息中是否包括所述第m目标关键词列表中的关键词,若包括,则将所述识别的wifi名称信息标注为第m标签;步骤S4、每间隔预设时间段,将该时间段内所述步骤S3中标注为第m标签的所有wifi名称信息作为语料更新所述语料库,并返回步骤S2。本发明提高了wifi识别的准确度和效率。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于nlp的wifi识别方法、电子设备和介质。
背景技术
在对wifi数据进行处理的过程中,通常需要对wifi添加标签,来区分wifi类别。现有的处理方式通常是通过人工标注的方式对wifi添加标签,每一类标签代表一种wifi类别,例如医院wifi、商场wifi等,但是人工标注成本高,效率低。且添加完标签存入数据库后基本不再更改,导致数据陈旧,无法实现更新。然而wifi数据更新较快,例如有些设备没变,但是对应的wifi标签已经改变,再或者一段时间后,需要对新增的wifi进行标签标注,若不及时更新wifi标签,无法保证wifi标签的准确性。因此,如何实现自动识别wifi标签,且能实时更新标注情况,成为亟待解决的技术问题。
发明内容
本发明目的在于,提供一种基于nlp的wifi识别方法、电子设备和介质,能够自动识别wifi标签,且能实时更新标注情况,提高了wifi识别的准确度和效率。
根据本发明第一方面,提供了一种基于nlp的wifi识别方法,包括以下步骤:
步骤S1、获取多个已标注标签的wifi名称信息作为语料构建语料库,所述语料库中的标签包括公共wifi标签和M个类别的wifi标签,所述M个类别的wifi标签分别为第一标签、第二标签…第m标签…第M标签,m=1,2…M,M为正整数,所述wifi名称信息为文本信息;
步骤S2、从所述语料库中获取所有第m标签对应的wifi名称信息,构建第m目标关键词列表;
步骤S3、获取待识别的wifi名称信息,并判断所述待识别的wifi名称信息中是否包括所述第m目标关键词列表中的关键词,若包括,则将所述识别的wifi名称信息标注为第m标签;
步骤S4、每间隔预设时间段,将该时间段内所述步骤S3中标注为第m标签的所有wifi名称信息作为语料更新所述语料库,并返回步骤S2。
根据本发明第二方面,提供一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行本发明第一方面所述的方法。
根据本发明第三方面,提供一种计算机可读存储介质,所述计算机指令用于执行本发明第一方面所述的方法。
本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明提供的一种基于nlp的wifi识别方法、电子设备和介质可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:
本发明所述方法能够自动识别wifi标签,且能实时更新标注情况,提高了wifi识别的准确度和效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
图1为本发明实施例提供的基于nlp的wifi识别方法流程图。
具体实施方式
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于nlp的wifi识别方法、电子设备和介质的具体实施方式及其功效,详细说明如后。
本发明实施例提供了一种基于自然语言处理(Natural Langunge Possns,简称nlp)的wifi识别方法,如图1所示,包括以下步骤:
步骤S1、获取多个已标注标签的wifi名称信息作为语料构建语料库,所述语料库中的标签包括公共wifi标签和M个类别的wifi标签,所述M个类别的wifi标签分别为第一标签、第二标签…第m标签…第M标签,m=1,2…M,M为正整数,所述wifi名称信息为文本信息;
其中,可以从预先设立的第一数据库中获取已标注标签的wifi名称信息。需要说明的是,wifi名称信息包括公共wifi名称信息和私有wifi名称信息,公共wifi名称信息通常无需识别分类,需要分类识别的wifi名称信息为私有wifi名称信息,待识别的wifi名称信息是要确定为M个类别的wifi标签中的一种。所述wifi名称信息在数据库中是唯一的,每一wifi名称信息只能对应一个标签。
作为一种示例,所述wifi名称信息即wifi的ssid,可以理解的是,所述wifi名称信息亦可为唯一标识wifi,且包含能够区分wifi类别的其他文本信息。
步骤S2、从所述语料库中获取所有第m标签对应的wifi名称信息,构建第m目标关键词列表;
可以理解的是,通过步骤S2可以获取每一标签对应的目标关键词列表,通过后续步骤可实现对多类wifi进行识别。。
步骤S3、获取待识别的wifi名称信息,并判断所述待识别的wifi名称信息中是否包括所述第m目标关键词列表中的关键词,若包括,则将所述识别的wifi名称信息标注为第m标签;
其中,所述待识别的wifi名称信息包括已标注标签的wifi名称信息和未标注标签的wifi名称信息。待识别的wifi名称信息可以从预先设立的第二数据库中获取未标注标签的wifi名称信息,也可以从第一数据库中获取已标注标签的wifi名称信息,第一数据库和第二数据库可以为同一个数据库,也可以单独设立,方便获取wifi名称信息。
当待识别的wifi名称信息为未标注标签的wifi名称信息,可以为未标注标签的wifi名称信息确定对应的标签。当待识别的wifi名称信息为已标注标签的wifi名称信息,若wifi名称信息已变更,则可以实时更正wifi名称信息对应的标签信息,提高了wifi信息识别的准确率。
步骤S4、每间隔预设时间段,将该时间段内所述步骤S3中标注为第m标签的所有wifi名称信息作为语料更新所述语料库,并返回步骤S2。
其中,所述预设时间段可以根据具体的应用需求来设定,设定过短可能浪费计算资源,设定过长可能会导致wifi标签更新不及时,从而导致wifi识别的精确度降低,因此可将时间段设置为[20天,45天],优选的,所述预设时间段为一个月。
本发明实施例所述方法能够自动识别wifi名称信息,且能每间隔预设的时间段更新语料库,从而基于更新的语料库更新目标关键词,进而可以实现实时更新wifi标签,提高了wifi识别的准确度和效率。
需要说明的是,本发明一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序仅是为了引用方便的目的予以编排,并不意味着步骤执行的必然顺序,即可以被重新安排。当其操作完成时处理可以被终止,但是还可以具有未包括在附图中的附加步骤。处理可以对应于方法、函数、规程、子例程、子程序等等。
作为一种实施例,所述步骤S2包括:
步骤S21、将所获取所有第m标签对应的wifi名称信息进行分词处理,得到分词列表;
其中,步骤S2可以采用现有的分词算法进行分词,例如jieba分词,在此不再展开表述。所述分词列表中包括多个分词。
步骤S22、基于预先构建的停用词库对所述分词列表进行去停用词处理,得到第一关键词列表;
其中,第一关键词列表中包括多个关键词,停用词库是基于本发明实施例的使用场景预先单独构建的,具体的,所述方法还包括步骤S20、构建所述停用词库,包括:
步骤S201、基于wifi名称信息的命名规则从基础停用词库中选择对应的基础停用词加入所述停用词库中;
其中,所述wifi名称信息的命名规则包括不包含标点符号。基础停用词库为通用的停用词库,所取的基础停用词包括城市名称、结构助词、代词等等适合本发明实施例使用场景的基础停用词,在此不再一一列举。
步骤S202、从所述语料库中获取多个公共wifi的wifi名称信息,基于所述多个公共wifi的wifi名称信息确定公共wifi的高频关键词加入所述停用词库中。
由于公共wifi无需进行识别,因此可将公共wifi的高频关键词加入停用词中,使得在构建第m目标关键词列表时直接将wifi的高频关键词滤除掉,避免出现噪声和多余的计算,提高了wifi识别的准确度和效率。
作为一种实施例,所述步骤S202进一步包括:
步骤S2021、将所获取的多个公共wifi的wifi名称信息进行分词处理,得到公共wifi的分词列表;
其中,步骤S2021亦可以采用现有的分词算法进行分词,例如jieba分词,在此不再展开表述。所述公共wifi的分词列表中包括多个公共wifi分词。
步骤S2022、基于所述基础停用词库对所述公共wifi的分词列表进行去停用词处理,得到公共wifi的第一关键词列表;
其中,所述公共wifi的第一关键词列表中包括多个公共wifi的关键词。
步骤S2023、从所述公共wifi的第一关键词列表中获取公共wifi的高频关键词。
步骤S23、从所述第一关键词列表中获取高频关键词构建所述目标关键词列表。
作为一种实施例,步骤S23和所述步骤S2023中,均可在经过停用词过滤后得到而定的第一关键词列表中,进一步提取出高频关键词作为目标关键词,从而提高wifi信息的识别准确度,所述步骤S23和所述步骤S2023中,从所述第一关键词列表中获取高频关键词均可采用以下步骤实现:
步骤S231、所述关键词列表为{a1,a2…an…aN}, an表示第n个关键词,n=1,2…N,N为正整数,获取an的词频TF(an)和逆文档频率IDF(an)、TF-IDF(an):
TF (an)=该类标签的wifi名称信息中an个数/该类标签的wifi名称信息中的总关键词个数;
可以理解的是“该类标签”指的是an对应的wifi标签类别。
IDF(an)=log(所有类别标签的wifi名称信息总个数/(1+所有类别标签的wifi名称信息中出现an的wifi名称信息个数));
可以理解的是,所有类别标签指的是语料库中包含an对应的wifi标签类别以及其他wifi标签的所有类别标签。
TF-IDF(an)= TF (an)* IDF(an);
步骤S232、获取TF-IDF值大于预设TF-IDF阈值的关键词作为该关键词列表中的高频关键词。
需要说明的是,TF-IDF阈值可以根据具体的wifi名称信息识别精确度等因素来设定。
作为步骤S232的变形,可以将关键词列表中所有关键词对应的TF-IDF值按照降序排序,并选择前Q个TF-IDF值对应的关键词作为目标关键词。Q的具体数据可以根据具体的wifi名称信息识别精确度等因素来设定。
可以理解的是,当获取所述第m目标关键词列表后,步骤S3中,可以直接逐一将待识别的wifi名称信息,与M个目标关键词列表进行匹配,确定待识别的wifi名称信息的标签,与第m目标关键词列表进行匹配判断其待识别的wifi名称信息是否应该是第m标签。也基于某一类别的目标关键词作为正样本,将非该类别的目标关键词作为负样本训练分类模型,再提取待识别的wifi名称信息的关键词输入分类模型中进行识别,在此不再展开描述。
本发明实施例还提供一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行本发明实施例所述的方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机指令用于执行本发明实施例所述的方法。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
Claims (10)
1.一种基于nlp的wifi识别方法,其特征在于,包括以下步骤:
步骤S1、获取多个已标注标签的wifi名称信息作为语料构建语料库,所述语料库中的标签包括公共wifi标签和M个类别的wifi标签,所述M个类别的wifi标签分别为第一标签、第二标签…第m标签…第M标签,m=1,2…M,M为正整数,所述wifi名称信息为文本信息;
步骤S2、从所述语料库中获取所有第m标签对应的wifi名称信息,构建第m目标关键词列表;
步骤S3、获取待识别的wifi名称信息,并判断所述待识别的wifi名称信息中是否包括所述第m目标关键词列表中的关键词,若包括,则将所述识别的wifi名称信息标注为第m标签;
步骤S4、每间隔预设时间段,将该时间段内所述步骤S3中标注为第m标签的所有wifi名称信息作为语料更新所述语料库,并返回步骤S2。
2.根据权利要求1所述的方法,其特征在于,
所述待识别的wifi名称信息包括已标注标签的wifi名称信息和未标注标签的wifi名称信息。
3.根据权利要求1所述的方法,其特征在于,
所述步骤S2包括:
步骤S21、将所获取所有第m标签对应的wifi名称信息进行分词处理,得到分词列表;
步骤S22、基于预先构建的停用词库对所述分词列表进行去停用词处理,得到第一关键词列表;
步骤S23、从所述第一关键词列表中获取高频关键词构建所述目标关键词列表。
4.根据权利要求3所述的方法,其特征在于,
所述方法还包括步骤S20、构建所述停用词库,包括:
步骤S201、基于wifi名称信息的命名规则从基础停用词库中选择对应的基础停用词加入所述停用词库中;
步骤S202、从所述语料库中获取多个公共wifi的wifi名称信息,基于所述多个公共wifi的wifi名称信息确定公共wifi的高频关键词加入所述停用词库中。
5.根据权利要求4所述的方法,其特征在于,
所述步骤S202包括:
步骤S2021、将所获取的多个公共wifi的wifi名称信息进行分词处理,得到公共wifi的分词列表;
步骤S2022、基于所述基础停用词库对所述公共wifi的分词列表进行去停用词处理,得到公共wifi的第一关键词列表;
步骤S2023、从所述公共wifi的第一关键词列表中获取公共wifi的高频关键词。
6.根据权利要求5所述的方法,其特征在于,
所述步骤S23和所述步骤S2023中,从所述第一关键词列表中获取高频关键词包括:
步骤S231、所述关键词列表为{a1,a2…an…aN}, an表示第n个关键词,n=1,2…N,N为正整数,获取an的词频TF(an)和逆文档频率IDF(an)、TF-IDF(an):
TF (an)=该类标签的wifi名称信息中an个数/该类标签的wifi名称信息中的总关键词个数;
IDF(an)=log(所有类别标签的wifi名称信息总个数/(1+所有类别标签的wifi名称信息中出现an的wifi名称信息个数));
TF-IDF(an)= TF (an)* IDF(an);
步骤S232、获取TF-IDF值大于预设TF-IDF阈值的关键词作为该关键词列表中的高频关键词。
7.根据权利要求1所述的方法,其特征在于,
所述wifi名称信息为wifi的ssid信息。
8.根据权利要求1所述的方法,其特征在于,
所述预设时间段为一个月。
9.一种电子设备,其特征在于,包括:
至少一个处理器;
以及,与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行前述权利要求1-8任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,存储有计算机可执行指令,所述计算机可执行指令用于执行前述权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110039208.4A CN112364169B (zh) | 2021-01-13 | 2021-01-13 | 基于nlp的wifi识别方法、电子设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110039208.4A CN112364169B (zh) | 2021-01-13 | 2021-01-13 | 基于nlp的wifi识别方法、电子设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112364169A true CN112364169A (zh) | 2021-02-12 |
CN112364169B CN112364169B (zh) | 2022-03-04 |
Family
ID=74534828
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110039208.4A Active CN112364169B (zh) | 2021-01-13 | 2021-01-13 | 基于nlp的wifi识别方法、电子设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112364169B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113891323A (zh) * | 2021-12-07 | 2022-01-04 | 杭州云信智策科技有限公司 | 一种基于WiFi的用户标签获取系统 |
CN114997165A (zh) * | 2022-06-02 | 2022-09-02 | 中债金科信息技术有限公司 | 一种文本分类方法及装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105989184A (zh) * | 2015-08-25 | 2016-10-05 | 中国银联股份有限公司 | 一种分类方法及装置 |
CN107766371A (zh) * | 2016-08-19 | 2018-03-06 | 中兴通讯股份有限公司 | 一种文本信息分类方法及其装置 |
CN108112026A (zh) * | 2017-12-13 | 2018-06-01 | 北京奇虎科技有限公司 | WiFi识别方法及装置 |
CN110287321A (zh) * | 2019-06-26 | 2019-09-27 | 南京邮电大学 | 一种基于改进特征选择的电力文本分类方法 |
US20200026724A1 (en) * | 2017-03-30 | 2020-01-23 | Lenovo (Beijing) Limited | Data processing method and apparatus, and electronic device thereof |
US20200081977A1 (en) * | 2017-10-20 | 2020-03-12 | Tencent Technology (Shenzhen) Company Limited | Keyword extraction method and apparatus, storage medium, and electronic apparatus |
CN111343564A (zh) * | 2018-11-30 | 2020-06-26 | 北京嘀嘀无限科技发展有限公司 | 无线网络的类别确定方法、装置、电子设备及存储介质 |
CN111767403A (zh) * | 2020-07-07 | 2020-10-13 | 腾讯科技(深圳)有限公司 | 一种文本分类方法和装置 |
-
2021
- 2021-01-13 CN CN202110039208.4A patent/CN112364169B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105989184A (zh) * | 2015-08-25 | 2016-10-05 | 中国银联股份有限公司 | 一种分类方法及装置 |
CN107766371A (zh) * | 2016-08-19 | 2018-03-06 | 中兴通讯股份有限公司 | 一种文本信息分类方法及其装置 |
US20200026724A1 (en) * | 2017-03-30 | 2020-01-23 | Lenovo (Beijing) Limited | Data processing method and apparatus, and electronic device thereof |
US20200081977A1 (en) * | 2017-10-20 | 2020-03-12 | Tencent Technology (Shenzhen) Company Limited | Keyword extraction method and apparatus, storage medium, and electronic apparatus |
CN108112026A (zh) * | 2017-12-13 | 2018-06-01 | 北京奇虎科技有限公司 | WiFi识别方法及装置 |
CN111343564A (zh) * | 2018-11-30 | 2020-06-26 | 北京嘀嘀无限科技发展有限公司 | 无线网络的类别确定方法、装置、电子设备及存储介质 |
CN110287321A (zh) * | 2019-06-26 | 2019-09-27 | 南京邮电大学 | 一种基于改进特征选择的电力文本分类方法 |
CN111767403A (zh) * | 2020-07-07 | 2020-10-13 | 腾讯科技(深圳)有限公司 | 一种文本分类方法和装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113891323A (zh) * | 2021-12-07 | 2022-01-04 | 杭州云信智策科技有限公司 | 一种基于WiFi的用户标签获取系统 |
CN114997165A (zh) * | 2022-06-02 | 2022-09-02 | 中债金科信息技术有限公司 | 一种文本分类方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112364169B (zh) | 2022-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109885692B (zh) | 知识数据存储方法、装置、计算机设备和存储介质 | |
CN107004159B (zh) | 主动机器学习 | |
CN110532397B (zh) | 基于人工智能的问答方法、装置、计算机设备及存储介质 | |
CN112711660B (zh) | 文本分类样本的构建方法和文本分类模型的训练方法 | |
WO2022222300A1 (zh) | 开放关系抽取方法、装置、电子设备及存储介质 | |
CN110598001A (zh) | 联合实体关系抽取方法、装置及存储介质 | |
EP3499384A1 (en) | Word and sentence embeddings for sentence classification | |
WO2017096454A1 (en) | Clustering documents based on textual content | |
CN111475617A (zh) | 事件主体抽取方法、装置及存储介质 | |
CN111814487B (zh) | 一种语义理解方法、装置、设备及存储介质 | |
CN111078837A (zh) | 智能问答信息处理方法、电子设备及计算机可读存储介质 | |
CN109783801B (zh) | 一种电子装置、多标签分类方法及存储介质 | |
CN112632278A (zh) | 一种基于多标签分类的标注方法、装置、设备及存储介质 | |
CN113704429A (zh) | 基于半监督学习的意图识别方法、装置、设备及介质 | |
CN111552766B (zh) | 使用机器学习来表征在引用图形上应用的参考关系 | |
CN111984792A (zh) | 网站分类方法、装置、计算机设备及存储介质 | |
CN112364169B (zh) | 基于nlp的wifi识别方法、电子设备和介质 | |
CN111639500A (zh) | 语义角色标注方法、装置、计算机设备及存储介质 | |
CN112328655A (zh) | 文本标签挖掘方法、装置、设备及存储介质 | |
CN112380348B (zh) | 元数据处理方法、装置、电子设备及计算机可读存储介质 | |
CN112800226A (zh) | 用于获取文本分类模型的方法、用于文本分类的方法、装置及设备 | |
US11580499B2 (en) | Method, system and computer-readable medium for information retrieval | |
CN111797115A (zh) | 一种员工信息的搜索方法及装置 | |
CN116561390A (zh) | 一种获取目标任务数据集的数据处理系统 | |
CN115640376A (zh) | 文本标注方法、装置、电子设备和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |