[人工智能] 深度学习之基于CNN识别验证码

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 深度学习之基于CNN识别验证码 -> 正文阅读

[人工智能]深度学习之基于CNN识别验证码

本博客是参考博主：K同学啊的博客。
CNN的部分与前面没有太大的区别，但是本博客对于博主来说，最大的收获就是数据处理那一部分的操作。

1.导入库

import tensorflow as tf
import matplotlib.pyplot as plt
import os,PIL,random,pathlib
import numpy as np
from tensorflow.keras import datasets, layers, models

2.数据导入

#导入数据
data_dir = "E:/tmp/.keras/datasets/yzm_photos/captcha"
data_dir = pathlib.Path(data_dir)
all_images_paths = list(data_dir.glob('*'))##”*”匹配0个或多个字符
all_images_paths = [str(path) for path in all_images_paths]
#打乱数据
random.shuffle(all_images_paths)
#获取数据标签
all_label_names = [path.split("\\")[6].split(".")[0] for path in all_images_paths]##6代表第6个//

查看数据：
在这里插入图片描述

3.数字化

#标签数字化
#本部分将所有用到的字符都用数字来表示，相当于C++中的map操作，将字符映射为数字
number = ['0','1','2','3','4','5','6','7','8','9']
alphabet = ['a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y','z']
char_set = number+alphabet
char_set_len = len(char_set)
label_name_len = len(all_label_names[0])
#
#将字符串数字化
#首先生成一个全为0的5*36的二维数组，将标签中出现的字符所在的位置标记为1，这样将一个标签字符串转换为了一个二维数组。
def text2vec(text):
    vector = np.zeros([label_name_len,char_set_len])
    for i,c in enumerate(text):
        idx = char_set.index(c)
        vector[i][idx]=1.0
    return vector
all_labels = [text2vec(i) for i in all_label_names]

4.构建一个tf.data.Dataset

#预处理函数
def preprocess_image(image):
    image = tf.image.decode_jpeg(image,channels=1)
    image = tf.image.resize(image,[50,200])
    return image/255.0
def load_and_preprocess_image(path):
    image = tf.io.read_file(path)
    return preprocess_image(image)

path_ds = tf.data.Dataset.from_tensor_slices(all_images_paths)
image_ds = path_ds.map(load_and_preprocess_image)
label_ds = tf.data.Dataset.from_tensor_slices(all_labels)
image_label_ds = tf.data.Dataset.zip((image_ds,label_ds))
train_ds = image_label_ds.take(1000)#前1000个作为训练
test_ds = image_label_ds.skip(1000)#1000后面的作为测试

5.搭建CNN网络

batch_size = 16
epochs = 20
train_ds = train_ds.batch(batch_size)
test_ds = test_ds.batch(batch_size)
#搭建网络
model = models.Sequential([
    tf.keras.layers.Conv2D(32,(3,3),activation='relu',input_shape=(50,200,1)),
    tf.keras.layers.MaxPooling2D((2,2)),
    tf.keras.layers.Conv2D(64,(3,3),activation='relu'),
    tf.keras.layers.MaxPooling2D((2,2)),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(1000),
    tf.keras.layers.Dense(label_name_len*char_set_len),
    tf.keras.layers.Reshape([label_name_len,char_set_len]),
    tf.keras.layers.Softmax()
])
model.compile(optimizer="adam",
              loss='categorical_crossentropy',
              metrics=['accuracy'])
history = model.fit(
    train_ds,
    validation_data=test_ds,
    epochs=epochs
)

运行结果如图所示：
在这里插入图片描述
要想进一步优化实验结果，可以去调整某些参数，这个过程是比较漫长的。

6.模型加载&&预测

模型保存

model.save('E:/tmp/.keras/datasets/yzm_photos/yzm_model.h5')

模型加载

new_model = tf.keras.models.load_model('E:/tmp/.keras/datasets/yzm_photos/yzm_model.h5')

预测

plt.figure(figsize=(10,8))
    for images, labels in test_ds.take(1):
        images=tf.squeeze(images,axis=3)#裁掉一维
        for i in range(1):
            ax = plt.subplot(5, 3, i + 1)
            plt.imshow(images[i])
            img_array = tf.expand_dims(images[i], 0)
            img_array = tf.expand_dims(img_array, -1)#增加两维
            # print(img_array.shape)
            pre = new_model.predict(img_array)
            # print(np.argmax(pre, axis=2))
            plt.title(vec2text(np.argmax(pre, axis=2)[0]))
            # plt.axis("off")
    plt.show()