CN117975372B - 一种基于YOLOv8和Transformer编码器相结合的工地安全检测系统及方法 - Google Patents
一种基于YOLOv8和Transformer编码器相结合的工地安全检测系统及方法 Download PDFInfo
- Publication number
- CN117975372B CN117975372B CN202410369788.7A CN202410369788A CN117975372B CN 117975372 B CN117975372 B CN 117975372B CN 202410369788 A CN202410369788 A CN 202410369788A CN 117975372 B CN117975372 B CN 117975372B
- Authority
- CN
- China
- Prior art keywords
- module
- model
- image data
- encoder
- construction site
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010276 construction Methods 0.000 title claims abstract description 33
- 238000001514 detection method Methods 0.000 title claims abstract description 27
- 238000000034 method Methods 0.000 title claims abstract description 14
- 239000013598 vector Substances 0.000 claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 28
- 238000012360 testing method Methods 0.000 claims abstract description 23
- 238000003062 neural network model Methods 0.000 claims abstract description 16
- 238000012795 verification Methods 0.000 claims abstract description 15
- 238000002372 labelling Methods 0.000 claims abstract description 9
- 238000007689 inspection Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 abstract description 7
- 230000000694 effects Effects 0.000 abstract description 3
- 238000012544 monitoring process Methods 0.000 description 5
- 230000000391 smoking effect Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000001681 protective effect Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明提出一种基于YOLOv8和Transformer编码器相结合的工地安全检测系统及方法,属于工地安全检测技术领域,包括:工地安全图像采集模块,用于在工地采集图像,并收集传回的图像数据;图像数据标注与数据集划分模块,对图像数据进行标注,将图像数据划分训练集、验证集及测试集;神经网络模型,基于改进的SPPFS模块插入YOLO v8l模型的主干网络,将主干网络的输出向量转换为高维向量,高维向量接入编码器,编码器的输出接入多层感知器,多层感知器用于对潜在的安全情况进行检测及分类;精简了YOLOv8主干网络以平衡精度和效果,有效提高了对大目标的特征提取能力,提高了检测效率和对小目标的检测精度。
Description
技术领域
本发明属于工地安全检测技术领域,具体涉及一种基于YOLOv8和Transformer编码器相结合的工地安全检测系统及方法。
背景技术
工地施工作业过程中,存在着较多安全隐患,安全事故的发生率居高不下。在长期的实践论证中,人工巡检的效率极低,很依赖于现场经验丰富的管理人员,需要他们实时的进行观察和检查,又费时又费力,存在着自动化水平较低、工作量较大和检查项目有限的情况,极容易出现漏检等情况,造成安全隐患。
而近年来,图像识别技术取得了重大进展,但传统的图像识别系统在处理工地现场的小目标时,往往受限于网络结构和算法效率,难以实现快速准确的识别。YOLOv8虽然在目标检测领域有所突破,但在小目标识别方面仍有改进空间。Transformer编码器在特征提取方面表现出色,但其如何与图像信息充分整合仍有研究空间。传统方法将图像简单分割后向量化输入到transformer编码器,损失了图像的部分信息,因此无法有效应用于工地安全检测,获取准确的检测结果。
发明内容
本发明针对现有技术下的问题,提供了一种基于YOLOv8和Transformer编码器相结合的工地安全检测系统及方法,本发明旨在通过结合YOLOv8和Transformer编码器这两种技术,并引入独创的SPPFS模块,解决现有技术中的不足。
为了达到上述目的,本申请采用的技术方案为:
第一方面,本发明提供了一种基于YOLOv8和Transformer编码器相结合的工地安全检测系统,包括:
工地安全图像采集模块,用于在工地采集图像,并收集传回的图像数据;
图像数据标注与数据集划分模块,对图像数据进行标注,将图像数据划分训练集、验证集及测试集;
神经网络模型,基于改进的SPPFS模块插入YOLO v8l模型的主干网络,将主干网络的输出向量转换为高维向量,高维向量接入transformer编码器,transformer编码器的输出接入多层感知器,多层感知器用于对潜在的安全情况进行检测及分类;通过训练集对神经网络模型进行训练,训练主干网络的卷积层参数,Transformer编码器的参数及模型尾部多层感知器参数;使用验证集对模型进行调优,获得训练完成的模型;利用测试集对训练完成的模型进行测试,获取输出;测试通过的模型用于对工地现场图像进行处理,识别潜在的安全风险。
进一步的,所述神经网络模型完整的网络结构为:图像输入-CBS-CBS-C2f-CBS-C2f-CBS-C2f-SPPFS-Transformer编码器-多层感知器-输出。
进一步的,CBS模块由Conv, BN, SiLU模块构成,结构为:Conv-BN-SiLU。
进一步的,C2f模块由Conv, Split, Bottleneck, Concat模块构成,结构为:Conv-Split-Bottleneck_1-Bottleneck_2-Concat-Conv。
进一步的,SPPFS模块由SPPF特征金字塔模块改进,SPPFS模块由Conv,MaxPooling_1, MaxPooling_2, Concat, Conv模块组成,其中,Conv, MaxPooling_1,MaxPooling_2分别与Concat层相连。
进一步的,Bottleneck模块为两层Conv和一层Concat模块顺次连接,并且模块输入与Concat相连。
进一步的,主干网络和Transformer编码器的连接方式为,将主干网络的2020512格式转换为400个512维的向量,输入到transformer编码器运算。
第二方面,本发明提供了一种如第一方面所述的基于YOLOv8和Transformer编码器相结合的工地安全检测系统的工作方法,包括:
通过工地安全图像采集模块在工地采集图像,并收集传回的图像数据;
通过图像数据标注与数据集划分模块对图像数据进行标注,将图像数据划分训练集、验证集及测试集;
通过神经网络模型对工地现场图像进行处理,识别潜在的安全风险;神经网络模型预先通过训练集进行训练,使用验证集对模型进行调优,利用测试集对训练完成的模型进行测试,获取输出。
与现有技术相比,本发明的优点和积极效果在于:
本发明融合了YOLOv8和Transformer编码器在特征提取方面的优势,精简了YOLOv8主干网络以平衡精度和效果,优化SPPFS模块以弱化对大目标的特征提取能力,换来更快的速度和对小目标的精确检测,具体是将基于SPPF模块改进的SPPFS模块插入YOLOv8l模型的主干网络的尾部,以替换原有的SPPF模块;删除主干网络尾部的CBS模块和C2f模块,直接接入SPPFS模块;将主干网络的输出向量由4040512的特征向量展平,转换为1600个512维的高维向量以满足transformer编码器的输入,然后将高维向量接入transformer编码器,然后将编码器的输出接入一个多层感知器,最后多层感知器可以对潜在的安全情况进行检测及分类;改进的YOLO v8m主干网络包括CBS模块,C2f模块,SPPFS模块,有效提高了对大目标的特征提取能力,提高了检测效率和对小目标的检测精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的流程图;
图2为本发明构建的SPPFS模块的结构图;
图3为本发明构建的完整深度学习网络结构图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和实施例对本发明作进一步说明。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用不同于在此描述的其他方式来实施,因此,本发明并不限于下面公开说明书的具体实施例的限制。
实施例1,如图1~图3所示,本申请提供了一种基于YOLOv8和Transformer编码器相结合的工地安全检测系统,本发明的工地安全检测系统通过结合YOLOv8主干网络和Transformer编码器,以及独创的SPPFS模块,实现了对工地现场小目标图像的高效识别,包括:
工地安全图像采集模块,用于在工地采集图像,并收集传回的图像数据;
图像数据标注与数据集划分模块,对图像数据进行标注,将图像数据划分训练集、验证集及测试集;
神经网络模型,基于改进的SPPFS模块插入YOLO v8l模型的主干网络,将主干网络的输出向量转换为高维向量,高维向量接入transformer编码器,transformer编码器的输出接入多层感知器,多层感知器用于对潜在的安全情况进行检测及分类;通过训练集对神经网络模型进行训练,训练主干网络的卷积层参数,Transformer编码器的参数及模型尾部多层感知器参数;使用验证集对模型进行调优,获得训练完成的模型;利用测试集对训练完成的模型进行测试,获取输出;测试通过的模型用于对工地现场图像进行处理,识别潜在的安全风险。
其中,如图3所示,所搭建的神经网络完整的网络结构为:图像输入-CBS-CBS-C2f-CBS-C2f-CBS-C2f-SPPFS-Transformer编码器-多层感知器-输出。即共有4个CBS模块,3个C2f模块。
其中,CBS模块由Conv, BN, SiLU模块构成,结构为:Conv-BN-SiLU。模块顺次相连;C2f模块由Conv,Split, Bottleneck, Concat模块构成。结构为:Conv-Split-Bottleneck_1-Bottleneck_2-Concat-Conv。其中Split,Split与Bottleneck_1的中间过程, Bottleneck_1, Bottleneck_2分别和Concat模块相连。
其中,如图2所示, SPPFS模块由SPPF特征金字塔模块改进,针对小目标检测做了独创性的优化,模块由Conv, MaxPooling_1, MaxPooling_2, Concat, Conv模块组成。其中,Conv, MaxPooling_1, MaxPooling_2分别与Concat层相连。
其中,MaxPooling_1, MaxPooling_2,是最大池化层,可以去除冗余信息,扩大感知野。
其中,Bottleneck模块为两层Conv和一层Concat模块顺次链接,并且模块输入也与Concat相连。
其中,Conv为卷积层,进行图像卷积。BN为批量归一化,计算公式为:
其中,是归一化并缩放后的输出,和是可学习的缩放和偏移参数,是输入值,是小批量(mini-batch)的均值,是小批量的方差,是一个很小的常数,用于数值稳定性。
SiLU为一种激活函数,计算公式为:
其中,x为该激活函数的输入,以向量表示。
SiLU函数的特点是,在输入值接近于0时,它的输出接近于输入值,而在输入值远离0时,它的输出接近于输入值的符号。这种特性使得SiLU在处理小的输入值时表现非常好。
Split为分割模块,将输入分割为通道数减半的两个输出。Concat为融合模块,将同样大小但参数不一致的通道合并叠加。
Transformer编码器为标准的Transformer编码器结构,由归一化层,多头注意力层和前馈神经网络组成;具体如图3中,包括依次设置的Norm层-多头注意力层-Concat层—Norm层-MLP层-Concat层。多层感知器包括MLP层和Prediction层。
本发明融合了YOLOv8和Transformer编码器在特征提取方面的优势,精简了YOLOv8主干网络以平衡精度和效果,优化SPPFS模块以弱化对大目标的特征提取能力,换来更快的速度和对小目标的精确检测。
实施例2
本发明提供了一种基于YOLOv8和Transformer编码器相结合的工地安全检测系统的搭建方法,包括:
步骤一:搭建工地安全图像采集模块。选用工业无人机,监控,巡检机器人等在工地采集图像,并收集传回的图像。
步骤二:对图像数据进行标注,标注内容可以针对具体关注的安全问题自定义。比如安全帽、防护衣的穿戴情况,在禁烟区域发现吸烟行为等。之后对数据划分训练集、验证集及测试集。
步骤三:搭建独创的神经网络模型。将基于SPPF模块改进的SPPFS模块插入YOLOv8l模型的主干网络的尾部,以替换原有的SPPF模块。删除主干网络尾部的CBS模块和C2f模块,直接接入SPPFS模块。将主干网络的输出向量由4040512的特征向量展平,转换为1600个512维的高维向量以满足transformer编码器的输入,然后将高维向量接入transformer编码器,然后将编码器的输出接入一个多层感知器,最后多层感知器可以对潜在的安全情况进行检测及分类。改进的YOLO v8m主干网络包括CBS模块,C2f模块,SPPFS模块。
步骤四:对步骤三所述神经网络模型进行训练,利用步骤二所划分的数据集进行训练,训练主干网络的卷积层参数,Transformer编码器的参数及模型尾部多层感知器参数。
步骤五:利用测试集对训练完成的模型进行测试,获取输出,得到所关注的安全问题的标注及判断,如步骤二所示是否有安全帽、防护衣违规穿戴情况,或禁烟区域发现吸烟行为等。
步骤六:进行实地部署,接入工地安全检测工具。
具体的,步骤一:建立工地安全图像采集模块
1. 部署工业无人机、监控摄像头和巡检机器人等设备在工地现场,根据工地的具体环境和需要监控的重点区域进行布置。
2. 设备定时对工地现场进行图像采集,确保图像的清晰度和覆盖范围,以全面监控工地的安全状况。
步骤二、图像数据标注与数据集划分:
1. 对收集到的图像进行人工标注,利用LabeImg对搜集到的图像针对工地安全相关进行标注,标注的内容包括安全帽、防护衣穿戴情况,以及禁烟区域内的吸烟行为等。
2. 将标注好的图像数据划分为训练集、验证集和测试集,按照70%训练集、15%验证集、15%测试集的比例进行划分。
步骤三、搭建神经网络模型:
1. 在YOLOv8l主干网络的基础上,移除尾部的CBS层和C2f模块。
2. 将SPPF模块升级为SPPFS模块,以优化小目标的识别能力。
3. 将SPPFS模块输出转换为多维向量,接入Transformer编码器,确保其能够接收并处理来自主干网络的特征向量。
4. 在Transformer编码器后添加多层感知器(MLP),用于最终的识别和分类。
步骤四、模型训练:
1. 使用训练集对神经网络进行训练,调整主干网络、Transformer编码器和MLP的参数。
2. 在训练过程中,监控模型的性能,如准确率、召回率等指标。
3. 使用验证集对模型进行调优,防止过拟合。
步骤五、模型测试与评估:
1. 使用测试集对训练完成的模型进行评估,确保其在实际应用中的有效性。
2. 分析模型输出,验证其在识别安全问题(如安全帽、防护衣违规穿戴,禁烟区吸烟等)的准确性。
步骤六、系统部署与实时监控:
1. 将训练好的模型部署到工地安全监控系统中。
2. 实现实时图像分析,利用模型对工地现场图像进行处理,识别潜在的安全风险。
3. 设计预警机制,当模型识别到安全问题时,立即通知相关人员进行干预。
步骤七、持续优化与维护:
1. 定期收集新的图像数据,用于模型的持续学习和优化。
2. 监控系统运行情况,确保其稳定性和准确性。
3. 根据工地安全监控的实际需求,不断调整和完善模型,以适应新的安全挑战。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作其他形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例应用于其他领域,但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。
Claims (5)
1.一种基于YOLOv8和Transformer编码器相结合的工地安全检测系统,其特征在于,包括:
工地安全图像采集模块,用于在工地采集图像,并收集传回的图像数据;
图像数据标注与数据集划分模块,对图像数据进行标注,将图像数据划分训练集、验证集及测试集;
神经网络模型,基于改进的SPPFS模块插入YOLO v8l模型的主干网络,将主干网络的输出向量转换为高维向量,高维向量接入transformer编码器,transformer编码器的输出接入多层感知器,多层感知器用于对潜在的安全情况进行检测及分类;通过训练集对神经网络模型进行训练,训练主干网络的卷积层参数,Transformer编码器的参数及模型尾部多层感知器参数;使用验证集对模型进行调优,获得训练完成的模型;利用测试集对训练完成的模型进行测试,获取输出;测试通过的模型用于对工地现场图像进行处理,识别潜在的安全风险;
所述神经网络模型完整的网络结构为:图像输入-CBS-CBS-C2f-CBS-C2f-CBS-C2f-SPPFS-Transformer编码器-多层感知器-输出,
SPPFS模块由SPPF特征金字塔模块改进,SPPFS模块由Conv, MaxPooling_1,MaxPooling_2, Concat, Conv模块组成,其中,Conv, MaxPooling_1, MaxPooling_2分别与Concat层相连;
主干网络和Transformer编码器的连接方式为,将主干网络的2020512格式转换为400个512维的向量,输入到transformer编码器运算。
2.根据权利要求1所述的一种基于YOLOv8和Transformer编码器相结合的工地安全检测系统,其特征在于,CBS模块由Conv, BN, SiLU模块构成,结构为:Conv-BN-SiLU。
3.根据权利要求1所述的一种基于YOLOv8和Transformer编码器相结合的工地安全检测系统,其特征在于,C2f模块由Conv, Split, Bottleneck, Concat模块构成,结构为:Conv-Split-Bottleneck_1-Bottleneck_2-Concat-Conv。
4.根据权利要求3所述的一种基于YOLOv8和Transformer编码器相结合的工地安全检测系统,其特征在于,Bottleneck模块为两层Conv和一层Concat模块顺次连接,并且模块输入与Concat相连。
5.一种如权利要求1所述的基于YOLOv8和Transformer编码器相结合的工地安全检测系统的工作方法,其特征在于,包括:
通过工地安全图像采集模块在工地采集图像,并收集传回的图像数据;
通过图像数据标注与数据集划分模块对图像数据进行标注,将图像数据划分训练集、验证集及测试集;
通过神经网络模型对工地现场图像进行处理,识别潜在的安全风险;神经网络模型预先通过训练集进行训练,使用验证集对模型进行调优,利用测试集对训练完成的模型进行测试,获取输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410369788.7A CN117975372B (zh) | 2024-03-29 | 2024-03-29 | 一种基于YOLOv8和Transformer编码器相结合的工地安全检测系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410369788.7A CN117975372B (zh) | 2024-03-29 | 2024-03-29 | 一种基于YOLOv8和Transformer编码器相结合的工地安全检测系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117975372A CN117975372A (zh) | 2024-05-03 |
CN117975372B true CN117975372B (zh) | 2024-06-28 |
Family
ID=90855801
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410369788.7A Active CN117975372B (zh) | 2024-03-29 | 2024-03-29 | 一种基于YOLOv8和Transformer编码器相结合的工地安全检测系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117975372B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118429730A (zh) * | 2024-07-04 | 2024-08-02 | 中冶检测认证有限公司 | 基于计算机视觉的压型钢板腐蚀程度检测方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116665148A (zh) * | 2023-05-29 | 2023-08-29 | 福建工程学院 | 基于合成孔径雷达数据的海上船舶检测方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114120360A (zh) * | 2021-11-17 | 2022-03-01 | 杭州海康威视数字技术股份有限公司 | 胁迫认证检测方法、装置及电子设备 |
CN116778587A (zh) * | 2023-06-29 | 2023-09-19 | 上海交通大学医学院附属第九人民医院 | 一种基于深度学习的活体年龄推断方法、设备、存储介质 |
CN117315556A (zh) * | 2023-10-10 | 2023-12-29 | 福建农林大学 | 改进的Vision Transformer昆虫细粒度识别方法 |
CN117392568A (zh) * | 2023-10-23 | 2024-01-12 | 湘潭大学 | 一种复杂场景下无人机巡检变电设备的方法 |
CN117557534A (zh) * | 2023-11-21 | 2024-02-13 | 太原科技大学 | 基于模型自优化的x射线焊缝缺陷智能评测方法 |
CN117392116A (zh) * | 2023-12-01 | 2024-01-12 | 湘潭大学 | 一种超宽幅金属表面瑕疵检测与识别方法 |
CN117649556A (zh) * | 2023-12-04 | 2024-03-05 | 天津农学院 | 一种基于图像的异常状态识别方法 |
-
2024
- 2024-03-29 CN CN202410369788.7A patent/CN117975372B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116665148A (zh) * | 2023-05-29 | 2023-08-29 | 福建工程学院 | 基于合成孔径雷达数据的海上船舶检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117975372A (zh) | 2024-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113283344B (zh) | 一种基于语义分割网络的矿用输送带跑偏检测方法 | |
CN110263686A (zh) | 一种基于深度学习的施工工地图像安全帽检测方法 | |
CN111505424A (zh) | 一种基于深度卷积神经网络的大型实验装置电力设备故障诊断方法 | |
CN108038424B (zh) | 一种适用于高空作业的视觉自动化检测方法 | |
CN107169426A (zh) | 一种基于深度神经网络的人群情绪异常检测和定位方法 | |
CN113391239B (zh) | 一种基于边缘计算的互感器异常监测方法与系统 | |
CN111583592B (zh) | 一种基于多维卷积神经网络的实验环境安全预警方法 | |
CN113128555B (zh) | 一种用于列车闸片部件异常检测的方法 | |
CN112613454A (zh) | 一种电力基建施工现场违章识别方法及系统 | |
CN117975372B (zh) | 一种基于YOLOv8和Transformer编码器相结合的工地安全检测系统及方法 | |
CN115060312A (zh) | 一种基于人工智能的建筑材料安全监测系统 | |
CN113361686A (zh) | 一种多层异构多模态卷积神经网络集成式机器人巡检方法 | |
CN117114420B (zh) | 一种基于图像识别的工贸安全事故风险管控系统和方法 | |
CN118569617A (zh) | 一种基于计算机视觉目标检测的智慧电厂管控系统及管控方法 | |
CN113593605A (zh) | 一种基于深度神经网络的工业音频故障监测系统和方法 | |
CN112235741A (zh) | 一种基于深度学习的巡检机器人车间状态检测系统 | |
CN111310723A (zh) | 基于深度学习技术的变电站人员穿戴规范分析方法 | |
CN113780224B (zh) | 一种变电站无人化巡视方法及系统 | |
CN115165362A (zh) | 一种基于巡检及振动信号的轴承故障智能检测系统和方法 | |
CN113902919A (zh) | 一种基于双流网络的目标检测方法及系统 | |
CN117828335B (zh) | 海上升压站远程作业人员轨迹管控系统及方法 | |
CN113419140B (zh) | 一种考虑人机物协同的配网线路故障诊断方法及装置 | |
CN118551289B (zh) | 一种轨道交通机电设备无监督诊断方法及系统 | |
LU505192B1 (en) | Method and Device for Controlling Wind Turbine Generator Operation and Maintenance Based on Image Recognition, and Equipment Executing the Method Thereof | |
CN118195582A (zh) | 一种应用于污染源运维平台的运维非正常状态预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |