赛题描述: 工业自动化质检成为了当下主流与趋势,在整个质检中视觉质检又是重中之重。使用AI的先进视觉技术应用在工业质检领域。

比赛任务: 根据提供的数据集,来预测测试集的数据是否为良品(颜色,缺损和是否成像均匀)。

本项目特点: 无需修改代码,及其容易上手,且能够一举获得高分

数据集示例:
正样本:在这里插入图片描述
负样本:在这里插入图片描述
分析
由上图可以看出,LED的质检,主要是判断LED光环的完整性和光滑性,并不存在特别复杂的特征,对于大型分类模型,在这样的数据集上表现可能并不佳,因此,我们选择 HRNet_W18_C 模型进行训练。

PaddleClas介绍
飞桨图像识别套件 PaddleClas 是飞桨为工业界和学术界所准备的一个图像识别和图像分类任务的工具集,助力使用者训练出更好的视觉模型和应用落地。

PaddleClas为使用者提供了大量的优质模型,详细模型信息可参考: 链接

本Baseline采用PaddleClas套件进行训练,在讯飞提交界面获得了0.90574的分数,暂列 4/17 .在这里插入图片描述
与第一名差距极小,文末将会介绍提分方法

解压数据集
由于数据集取材于原始比赛界面,故含有中文路径,在解压后会显示乱码,但不影响程序的读取。

In [ ]
!unzip -oq data/data153476/LED灯的色彩和均匀性检测挑战赛公开数据.zip -d data/
数据集增强(初步)
通过观察数据集,正样本数量达到了451张,负样本数据只有41张,两种数据相差十倍,故首先使用翻转等简单操作增强负样本数据。

增强后的数据集存储在intensify文件夹下

In [ ]
import os
import cv2

bad_path = ‘data/LED╡╞╡─╔л▓╩║═╛∙╘╚╨╘╝ь▓т╠Ї╒╜╚№╣л┐к╩¤╛▌/╤╡┴╖╝п/┤╬╞╖’
a = os.listdir(bad_path)

for i in a:
if i[-4:] != ‘.jpg’:
continue
print(bad_path+‘/’+i)
img = cv2.imread(bad_path+‘/’+i)
cv2.imwrite( ‘./intensify/’+i, img)
img_flip = cv2.flip(img, 1)
cv2.imwrite( ‘./intensify/’+i[:-4]+‘1.jpg’, img_flip)
img_transpose = cv2.transpose(img)
cv2.imwrite(‘./intensify/’+i[:-4]+‘2.jpg’, img_transpose)
img_flip = cv2.flip(img_transpose, 1)
cv2.imwrite(‘./intensify/’+i[:-4]+‘3.jpg’, img_flip)
img_flip = cv2.flip(img_transpose, -1)
cv2.imwrite(‘./intensify/’+i[:-4]+‘4.jpg’, img_flip)
创建数据集列表
读取原始正样本数据和增强后的负样本数据,由于正样本数据相互之间差异不大,故我们进读取其中一半图像,使得正负样本之间比例近似为1: 1

再通过随机分配的方式按1: 8的比例裁减为测试集和训练集

In [32]
import os
import random

bad_path = ‘intensify’
good_path = ‘data/LED╡╞╡─╔л▓╩║═╛∙╘╚╨╘╝ь▓т╠Ї╒╜╚№╣л┐к╩¤╛▌/╤╡┴╖╝п/┴╝╞╖’

bad_imgs = os.listdir(bad_path)
good_imgs = os.listdir(good_path)

with open(‘datasets.txt’, ‘w’) as f:
for i in bad_imgs:
if i[-4:] != ‘.jpg’:
continue
s = bad_path+‘/’+i+’ ‘+‘1\n’
f.writelines(s)
tot = 0
for i in good_imgs:
tot += 1
if tot >= 200:
break
if i[-4:] != ‘.jpg’:
continue
s = good_path+’/‘+i+’ '+‘0\n’
f.writelines(s)

with open(‘datasets.txt’,‘r’) as f:
a = f.readlines()
with open(‘train.list’,‘w’) as ff:
with open(‘valid.list’,‘w’) as fff:
for i in a:
n = random.randint(0, 9)
if n >= 8:
fff.write(i)
else:
ff.write(i)
克隆PaddleClas
最新版本为2.4版本,但本人习惯了2.3版本,新版本中包含了一些新加入的模型,可以进一步尝试

In [ ]
!git clone https://github.com/PaddlePaddle/PaddleClas.git --branch release/2.3
安装依赖
将修改后的配置文件放入PaddleClas

将修改后的预测文件放入engine,此文件可以直接生成submit所需的csv文件

In [ ]
!pip install -r PaddleClas/requirements.txt
!cp HRNet_W18_C.yaml PaddleClas/ppcls/configs/ImageNet/HRNet/
!cp engine.py PaddleClas/ppcls/engine/
训练
由于数据集少且模型较小,训练可以在几十分钟内完成

In [ ]
!python PaddleClas/tools/train.py
-c PaddleClas/ppcls/configs/ImageNet/HRNet/HRNet_W18_C.yaml
# -o Arch.pretrained=output/EfficientNetB4/best_model
-o Global.device=gpu
预测
预测完成后会在主目录下生成test.csv文件,下载后前往讯飞赛题界面上传即可

In [ ]
!python PaddleClas/tools/infer.py
-c PaddleClas/ppcls/configs/ImageNet/HRNet/HRNet_W18_C.yaml
-o Global.pretrained_model=output/HRNet_W18_C/best_model
改进方法:
PaddleClas套件提供了大量的模型,可以尝试更多相似大小的模型或者更好的方法,HRNet_W18_C是本人以直觉选取的方案,并不是最优
数据增强方面仅使用了图像翻转,且翻转的方向不全,可以进一步增强数据后重复训练

Logo

学大模型,用大模型上飞桨星河社区!每天8点V100G算力免费领!免费领取ERNIE 4.0 100w Token >>>

更多推荐