# Data Analysis
import pandas as pd
import numpy as np

# Visualization
import matplotlib.pyplot as plt
import seaborn as sns
sns.set()

# Neural Network Model
from keras.preprocessing.image import ImageDataGenerator
from keras.models import Sequential, load_model
from keras.layers import *
from keras.callbacks import ModelCheckpoint

# Evaluation
from sklearn.metrics import confusion_matrix, classification_report


#Data Augmentation

train_generator = ImageDataGenerator(rotation_range = 360,
                                     width_shift_range = 0.05,
                                     height_shift_range = 0.05,
                                     shear_range = 0.05,
                                     zoom_range = 0.05,
                                     horizontal_flip = True,
                                     vertical_flip = True,
                                     brightness_range = [0.75, 1.25],
                                     rescale = 1./255,
                                     validation_split = 0.2)


IMAGE_DIR = "data_input/casting_data/"
IMAGE_SIZE = (300, 300)
BATCH_SIZE = 64
SEED_NUMBER = 123

gen_args = dict(target_size = IMAGE_SIZE,
                color_mode = "grayscale",
                batch_size = BATCH_SIZE,
                class_mode = "binary",
                classes = {"ok_front": 0, "def_front": 1},
                seed = SEED_NUMBER)

train_dataset = train_generator.flow_from_directory(
                                        directory = IMAGE_DIR + "train",
                                        subset = "training", shuffle = True, **gen_args)
validation_dataset = train_generator.flow_from_directory(
                                        directory = IMAGE_DIR + "train",
                                        subset = "validation", shuffle = True, **gen_args)

Found 5307 images belonging to 2 classes.
Found 1326 images belonging to 2 classes.


test_generator = ImageDataGenerator(rescale = 1./255)
test_dataset = test_generator.flow_from_directory(directory = IMAGE_DIR + "test",
                                                  shuffle = False,
                                                  **gen_args)

Found 715 images belonging to 2 classes.


mapping_class = {0: "ok", 1: "defect"}
mapping_class

{0: 'ok', 1: 'defect'}


def visualizeImageBatch(dataset, title):
    images, labels = next(iter(dataset))
    images = images.reshape(BATCH_SIZE, *IMAGE_SIZE)
    fig, axes = plt.subplots(8, 8, figsize=(16,16))

    for ax, img, label in zip(axes.flat, images, labels):
        ax.imshow(img, cmap = "gray")
        ax.axis("off")
        ax.set_title(mapping_class[label], size = 20)

    plt.tight_layout()
    fig.suptitle(title, size = 30, y = 1.05, fontweight = "bold")
    plt.show()
    
    return images


train_images = visualizeImageBatch(train_dataset,
                                   "FIRST BATCH OF THE TRAINING IMAGES\n(WITH DATA AUGMENTATION)")


test_images = visualizeImageBatch(test_dataset,
                                  "FIRST BATCH OF THE TEST IMAGES\n(WITHOUT DATA AUGMENTATION)")


img = np.squeeze(train_images[4])[75:100, 75:100]

fig = plt.figure(figsize = (15, 15))
ax = fig.add_subplot(111)
ax.imshow(img, cmap = "gray")
ax.axis("off")

w, h = img.shape
for x in range(w):
    for y in range(h):
        value = img[x][y]
        ax.annotate("{:.2f}".format(value), xy = (y,x),
                    horizontalalignment = "center",
                    verticalalignment = "center",
                    color = "white" if value < 0.4 else "black")


model_cnn = Sequential(
    [
        # First convolutional layer
        Conv2D(filters = 32,
               kernel_size = 3,
               strides = 2,
               activation = "relu",
               input_shape = IMAGE_SIZE + (1, )),
        
        # First pooling layer
        MaxPooling2D(pool_size = 2,
                     strides = 2),
        
        # Second convolutional layer
        Conv2D(filters = 16,
               kernel_size = 3,
               strides = 2,
               activation = "relu"),
        
        # Second pooling layer
        MaxPooling2D(pool_size = 2,
                     strides = 2),
        
        # Flattening
        Flatten(),
        
        # Fully-connected layer
        Dense(128, activation = "relu"),
        Dropout(rate = 0.2),
        
        Dense(64, activation = "relu"),
        Dropout(rate = 0.2),
        
        Dense(1, activation = "sigmoid")
    ]
)

model_cnn.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
=================================================================
 conv2d (Conv2D)             (None, 149, 149, 32)      320       
                                                                 
 max_pooling2d (MaxPooling2D  (None, 74, 74, 32)       0         
 )                                                               
                                                                 
 conv2d_1 (Conv2D)           (None, 36, 36, 16)        4624      
                                                                 
 max_pooling2d_1 (MaxPooling  (None, 18, 18, 16)       0         
 2D)                                                             
                                                                 
 flatten (Flatten)           (None, 5184)              0         
                                                                 
 dense (Dense)               (None, 128)               663680    
                                                                 
 dropout (Dropout)           (None, 128)               0         
                                                                 
 dense_1 (Dense)             (None, 64)                8256      
                                                                 
 dropout_1 (Dropout)         (None, 64)                0         
                                                                 
 dense_2 (Dense)             (None, 1)                 65        
                                                                 
=================================================================
Total params: 676,945
Trainable params: 676,945
Non-trainable params: 0
_________________________________________________________________


model_cnn.compile(optimizer = 'adam',
              loss = 'binary_crossentropy',
              metrics = ['accuracy'])


checkpoint = ModelCheckpoint('model/cnn_casting_inspection_model.hdf5',
                             verbose = 1,
                             save_best_only = True,
                             monitor='val_loss',
                             mode='min')

model_cnn.fit(train_dataset,
                    validation_data = validation_dataset,
                    batch_size = 16,
                    epochs = 15,
                    callbacks = [checkpoint],
                    verbose = 1)

Epoch 1/15
83/83 [==============================] - ETA: 0s - loss: 0.6804 - accuracy: 0.5610
Epoch 00001: val_loss improved from inf to 0.63409, saving model to model\cnn_casting_inspection_model.hdf5
83/83 [==============================] - 148s 2s/step - loss: 0.6804 - accuracy: 0.5610 - val_loss: 0.6341 - val_accuracy: 0.6094
Epoch 2/15
83/83 [==============================] - ETA: 0s - loss: 0.5973 - accuracy: 0.6424
Epoch 00002: val_loss improved from 0.63409 to 0.55821, saving model to model\cnn_casting_inspection_model.hdf5
83/83 [==============================] - 141s 2s/step - loss: 0.5973 - accuracy: 0.6424 - val_loss: 0.5582 - val_accuracy: 0.6923
Epoch 3/15
83/83 [==============================] - ETA: 0s - loss: 0.5542 - accuracy: 0.6800
Epoch 00003: val_loss improved from 0.55821 to 0.50233, saving model to model\cnn_casting_inspection_model.hdf5
83/83 [==============================] - 112s 1s/step - loss: 0.5542 - accuracy: 0.6800 - val_loss: 0.5023 - val_accuracy: 0.7315
Epoch 4/15
83/83 [==============================] - ETA: 0s - loss: 0.5255 - accuracy: 0.6989
Epoch 00004: val_loss improved from 0.50233 to 0.48971, saving model to model\cnn_casting_inspection_model.hdf5
83/83 [==============================] - 89s 1s/step - loss: 0.5255 - accuracy: 0.6989 - val_loss: 0.4897 - val_accuracy: 0.7300
Epoch 5/15
83/83 [==============================] - ETA: 0s - loss: 0.4771 - accuracy: 0.7428
Epoch 00005: val_loss improved from 0.48971 to 0.43967, saving model to model\cnn_casting_inspection_model.hdf5
83/83 [==============================] - 90s 1s/step - loss: 0.4771 - accuracy: 0.7428 - val_loss: 0.4397 - val_accuracy: 0.7655
Epoch 6/15
83/83 [==============================] - ETA: 0s - loss: 0.4493 - accuracy: 0.7588
Epoch 00006: val_loss improved from 0.43967 to 0.38947, saving model to model\cnn_casting_inspection_model.hdf5
83/83 [==============================] - 89s 1s/step - loss: 0.4493 - accuracy: 0.7588 - val_loss: 0.3895 - val_accuracy: 0.8130
Epoch 7/15
83/83 [==============================] - ETA: 0s - loss: 0.3725 - accuracy: 0.8159
Epoch 00007: val_loss improved from 0.38947 to 0.31833, saving model to model\cnn_casting_inspection_model.hdf5
83/83 [==============================] - 84s 1s/step - loss: 0.3725 - accuracy: 0.8159 - val_loss: 0.3183 - val_accuracy: 0.8620
Epoch 8/15
83/83 [==============================] - ETA: 0s - loss: 0.3384 - accuracy: 0.8487
Epoch 00008: val_loss improved from 0.31833 to 0.30089, saving model to model\cnn_casting_inspection_model.hdf5
83/83 [==============================] - 83s 994ms/step - loss: 0.3384 - accuracy: 0.8487 - val_loss: 0.3009 - val_accuracy: 0.8771
Epoch 9/15
83/83 [==============================] - ETA: 0s - loss: 0.2875 - accuracy: 0.8709
Epoch 00009: val_loss improved from 0.30089 to 0.24045, saving model to model\cnn_casting_inspection_model.hdf5
83/83 [==============================] - 83s 1s/step - loss: 0.2875 - accuracy: 0.8709 - val_loss: 0.2404 - val_accuracy: 0.9012
Epoch 10/15
83/83 [==============================] - ETA: 0s - loss: 0.2340 - accuracy: 0.9079
Epoch 00010: val_loss improved from 0.24045 to 0.19629, saving model to model\cnn_casting_inspection_model.hdf5
83/83 [==============================] - 127s 2s/step - loss: 0.2340 - accuracy: 0.9079 - val_loss: 0.1963 - val_accuracy: 0.9178
Epoch 11/15
83/83 [==============================] - ETA: 0s - loss: 0.2441 - accuracy: 0.8943
Epoch 00011: val_loss did not improve from 0.19629
83/83 [==============================] - 114s 1s/step - loss: 0.2441 - accuracy: 0.8943 - val_loss: 0.2079 - val_accuracy: 0.9201
Epoch 12/15
83/83 [==============================] - ETA: 0s - loss: 0.2150 - accuracy: 0.9120
Epoch 00012: val_loss did not improve from 0.19629
83/83 [==============================] - 97s 1s/step - loss: 0.2150 - accuracy: 0.9120 - val_loss: 0.2085 - val_accuracy: 0.9027
Epoch 13/15
83/83 [==============================] - ETA: 0s - loss: 0.1831 - accuracy: 0.9229
Epoch 00013: val_loss improved from 0.19629 to 0.16699, saving model to model\cnn_casting_inspection_model.hdf5
83/83 [==============================] - 104s 1s/step - loss: 0.1831 - accuracy: 0.9229 - val_loss: 0.1670 - val_accuracy: 0.9321
Epoch 14/15
83/83 [==============================] - ETA: 0s - loss: 0.1840 - accuracy: 0.9226
Epoch 00014: val_loss improved from 0.16699 to 0.12696, saving model to model\cnn_casting_inspection_model.hdf5
83/83 [==============================] - 95s 1s/step - loss: 0.1840 - accuracy: 0.9226 - val_loss: 0.1270 - val_accuracy: 0.9548
Epoch 15/15
83/83 [==============================] - ETA: 0s - loss: 0.1497 - accuracy: 0.9412
Epoch 00015: val_loss did not improve from 0.12696
83/83 [==============================] - 82s 983ms/step - loss: 0.1497 - accuracy: 0.9412 - val_loss: 0.1531 - val_accuracy: 0.9351

<keras.callbacks.History at 0x27b544cbd00>


plt.subplots(figsize = (8, 6))
sns.lineplot(data = pd.DataFrame(model_cnn.history.history,
                                 index = range(1, 1+len(model_cnn.history.epoch))))
plt.title("TRAINING EVALUATION", fontweight = "bold", fontsize = 20)
plt.xlabel("Epochs")
plt.ylabel("Metrics")

plt.legend(labels = ['val loss', 'val accuracy', 'train loss', 'train accuracy'])
plt.show()


best_model = load_model("model/cnn_casting_inspection_model.hdf5")


y_pred_prob = best_model.predict(test_dataset)


THRESHOLD = 0.5
y_pred_class = (y_pred_prob >= THRESHOLD).reshape(-1,)
y_true_class = test_dataset.classes[test_dataset.index_array]

pd.DataFrame(
    confusion_matrix(y_true_class, y_pred_class),
    index = [["Actual", "Actual"], ["ok", "defect"]],
    columns = [["Predicted", "Predicted"], ["ok", "defect"]],
)


print(classification_report(y_true_class, y_pred_class, digits = 4))

              precision    recall  f1-score   support

           0     0.9811    0.9924    0.9867       262
           1     0.9956    0.9890    0.9922       453

    accuracy                         0.9902       715
   macro avg     0.9883    0.9907    0.9895       715
weighted avg     0.9903    0.9902    0.9902       715

Convolutional Neural Network for Product Quality Inspection¶

Preface¶

Neural Network¶

Background¶

Convolutional Neural Network¶

Convolution Concepts¶

1. Convolution¶

2. Pooling¶

Data Augmentation¶

Main Course¶

Import Libraries¶

Load the Images¶

Visualize the Image¶

Visualize Image in Batch¶

Visualize Detailed Image¶

Training the Network¶

Define Architecture¶

Compile the Model¶

Model Fitting¶

Training Evaluation¶

Testing on Unseen Images¶

Conclusion¶

		Predicted
		ok	defect
Actual	ok	260	2
Actual	defect	5	448