CN110209658B - 数据清洗方法和装置 - Google Patents
数据清洗方法和装置 Download PDFInfo
- Publication number
- CN110209658B CN110209658B CN201910480675.3A CN201910480675A CN110209658B CN 110209658 B CN110209658 B CN 110209658B CN 201910480675 A CN201910480675 A CN 201910480675A CN 110209658 B CN110209658 B CN 110209658B
- Authority
- CN
- China
- Prior art keywords
- training sample
- training
- sample set
- feature extraction
- training samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
Description
Claims (16)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910480675.3A CN110209658B (zh) | 2019-06-04 | 2019-06-04 | 数据清洗方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910480675.3A CN110209658B (zh) | 2019-06-04 | 2019-06-04 | 数据清洗方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110209658A CN110209658A (zh) | 2019-09-06 |
CN110209658B true CN110209658B (zh) | 2021-09-14 |
Family
ID=67790664
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910480675.3A Active CN110209658B (zh) | 2019-06-04 | 2019-06-04 | 数据清洗方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110209658B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110928862A (zh) * | 2019-10-23 | 2020-03-27 | 深圳市华讯方舟太赫兹科技有限公司 | 数据清洗方法、数据清洗设备以及计算机存储介质 |
CN111259000A (zh) * | 2020-01-20 | 2020-06-09 | 佛山科学技术学院 | 一种数据清洗方法 |
CN112348107A (zh) * | 2020-11-17 | 2021-02-09 | 百度(中国)有限公司 | 图像数据清洗方法及装置、电子设备和介质 |
CN112783883B (zh) * | 2021-01-22 | 2024-09-06 | 广东电网有限责任公司东莞供电局 | 一种多源数据接入下数据标准化清洗方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106503656A (zh) * | 2016-10-24 | 2017-03-15 | 厦门美图之家科技有限公司 | 一种图像分类方法、装置和计算设备 |
CN107878244A (zh) * | 2017-11-27 | 2018-04-06 | 深圳市菊水皇家科技有限公司 | 一种数据清洗和预测方法及电动汽车移动充电宝系统 |
CN108960331A (zh) * | 2018-07-10 | 2018-12-07 | 重庆邮电大学 | 一种基于行人图像特征聚类的行人再识别方法 |
CN109344146A (zh) * | 2018-09-13 | 2019-02-15 | 海南电网有限责任公司电力科学研究院 | 一种大规模过电压数据智能自清洗方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9336484B1 (en) * | 2011-09-26 | 2016-05-10 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration (Nasa) | System and method for outlier detection via estimating clusters |
CN106202922A (zh) * | 2016-07-06 | 2016-12-07 | 吴本刚 | 一种基于聚类算法的变压器故障诊断系统 |
CN107067077A (zh) * | 2017-04-18 | 2017-08-18 | 武汉大学 | 一种卷积神经网络的加权算法 |
CN108776683B (zh) * | 2018-06-01 | 2022-01-21 | 广东电网有限责任公司 | 一种基于孤立森林算法和神经网络的电力运维数据清洗方法 |
CN108875821A (zh) * | 2018-06-08 | 2018-11-23 | Oppo广东移动通信有限公司 | 分类模型的训练方法和装置、移动终端、可读存储介质 |
CN109241903B (zh) * | 2018-08-30 | 2023-08-29 | 平安科技(深圳)有限公司 | 样本数据清洗方法、装置、计算机设备及存储介质 |
CN109284372B (zh) * | 2018-09-03 | 2023-07-25 | 平安证券股份有限公司 | 用户操作行为分析方法、电子装置及计算机可读存储介质 |
CN109299271B (zh) * | 2018-10-30 | 2022-04-05 | 腾讯科技(深圳)有限公司 | 训练样本生成、文本数据、舆情事件分类方法及相关设备 |
-
2019
- 2019-06-04 CN CN201910480675.3A patent/CN110209658B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106503656A (zh) * | 2016-10-24 | 2017-03-15 | 厦门美图之家科技有限公司 | 一种图像分类方法、装置和计算设备 |
CN107878244A (zh) * | 2017-11-27 | 2018-04-06 | 深圳市菊水皇家科技有限公司 | 一种数据清洗和预测方法及电动汽车移动充电宝系统 |
CN108960331A (zh) * | 2018-07-10 | 2018-12-07 | 重庆邮电大学 | 一种基于行人图像特征聚类的行人再识别方法 |
CN109344146A (zh) * | 2018-09-13 | 2019-02-15 | 海南电网有限责任公司电力科学研究院 | 一种大规模过电压数据智能自清洗方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110209658A (zh) | 2019-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109214343B (zh) | 用于生成人脸关键点检测模型的方法和装置 | |
CN108830235B (zh) | 用于生成信息的方法和装置 | |
CN109104620B (zh) | 一种短视频推荐方法、装置和可读介质 | |
CN110209658B (zh) | 数据清洗方法和装置 | |
CN109492128B (zh) | 用于生成模型的方法和装置 | |
CN109740018B (zh) | 用于生成视频标签模型的方法和装置 | |
CN108416310B (zh) | 用于生成信息的方法和装置 | |
CN108989882B (zh) | 用于输出视频中的音乐片段的方法和装置 | |
CN110188719B (zh) | 目标跟踪方法和装置 | |
CN109376267B (zh) | 用于生成模型的方法和装置 | |
CN109919244B (zh) | 用于生成场景识别模型的方法和装置 | |
CN109993150B (zh) | 用于识别年龄的方法和装置 | |
WO2020000876A1 (zh) | 用于生成模型的方法和装置 | |
CN110009059B (zh) | 用于生成模型的方法和装置 | |
CN109034069B (zh) | 用于生成信息的方法和装置 | |
CN111078940B (zh) | 图像处理方法、装置、计算机存储介质及电子设备 | |
CN109961032B (zh) | 用于生成分类模型的方法和装置 | |
CN109389096B (zh) | 检测方法和装置 | |
CN110211121B (zh) | 用于推送模型的方法和装置 | |
CN109934142B (zh) | 用于生成视频的特征向量的方法和装置 | |
CN112149699A (zh) | 用于生成模型的方法、装置和用于识别图像的方法、装置 | |
CN109816023B (zh) | 用于生成图片标签模型的方法和装置 | |
CN113033677A (zh) | 视频分类方法、装置、电子设备和存储介质 | |
CN109816670B (zh) | 用于生成图像分割模型的方法和装置 | |
CN109919220B (zh) | 用于生成视频的特征向量的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder | ||
CP01 | Change in the name or title of a patent holder |
Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing. Patentee after: Douyin Vision Co.,Ltd. Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing. Patentee before: Tiktok vision (Beijing) Co.,Ltd. Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing. Patentee after: Tiktok vision (Beijing) Co.,Ltd. Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing. Patentee before: BEIJING BYTEDANCE NETWORK TECHNOLOGY Co.,Ltd. |
|
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230704 Address after: 100190 1309, 13th floor, building 4, Zijin Digital Park, Haidian District, Beijing Patentee after: Beijing volcano Engine Technology Co.,Ltd. Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing. Patentee before: Douyin Vision Co.,Ltd. |