import numpy as np
import os
from matplotlib import pyplot as plt
from PIL import Image
from torch.utils.data import Dataset, DataLoader
from sklearn.model_selection import train_test_split
import torch
from torchvision import transforms
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from sklearn.metrics import classification_report, confusion_matrix, roc_curve, auc
import seaborn as sns
import pandas as pd

# Répertoire des données
data_dir = "archive"

# Liste des classes (noms des sous-dossiers)
class_names = [class_name for class_name in os.listdir(data_dir) if os.path.isdir(os.path.join(data_dir, class_name))]
num_class = len(class_names)

# Création d'une liste des fichiers d'images et des labels associés
image_files = [
    [os.path.join(data_dir, class_name, x) 
     for x in os.listdir(os.path.join(data_dir, class_name)) if x != ".DS_Store"]  # Ignore .DS_Store
    for class_name in class_names
]

image_file_list = []
image_label_list = []
for i, class_name in enumerate(class_names):
    image_file_list.extend(image_files[i])
    image_label_list.extend([i] * len(image_files[i]))

num_total = len(image_label_list)

# Obtention des dimensions de l'image (en supposant que toutes les images ont les mêmes dimensions)
image_width, image_height = Image.open(image_file_list[0]).size

# Comptage du nombre d'images pour chaque classe
label_counts = [len(image_files[i]) for i in range(num_class)]

# Affichage des informations
print(f"Total image count: {num_total}")
print(f"Image dimensions: {image_width} x {image_height}")
print(f"Label names: {class_names}")
print(f"Label counts: {label_counts}")

Total image count: 40000
Image dimensions: 227 x 227
Label names: ['Positive', 'Negative']
Label counts: [20000, 20000]

# Nombre d'images à afficher
num_images_to_show = 15

# Affichage des images
plt.figure(figsize=(8, 8))
for i, idx in enumerate(np.random.randint(num_total, size=num_images_to_show)):
    # Chargement de l'image et sa taille
    img_path = image_file_list[idx]
    img = Image.open(img_path)
    arr = np.array(img)
    
    # Affichage de l'image dans une grille 3x3
    plt.subplot(5, 5, i + 1)
    plt.imshow(arr, cmap='gray')
    
    # Ajout de label sous l'image
    plt.xlabel(class_names[image_label_list[idx]])
    plt.xticks([])  
    plt.yticks([]) 

# Amélioration de la disposition et de l'affichage
plt.tight_layout()
plt.show()

# Conversion en tableaux NumPy
image_file_list = np.array(image_file_list)
image_label_list = np.array(image_label_list)

def train_val_test_split(image_files, image_labels, valid_frac, test_frac):
    """
    Divise les données en ensembles d'entraînement, de validation et de test.

    Parameters
    ----------
    image_files : np.ndarray
        Tableau des chemins des images.
    image_labels : np.ndarray
        Tableau des labels associés aux images.
    valid_frac : float
        Fraction des données à utiliser pour la validation.
    test_frac : float
        Fraction des données à utiliser pour le test.

    Returns
    -------
    trainX : np.ndarray
        Chemins des images d'entraînement.
    valX : np.ndarray
        Chemins des images de validation.
    testX : np.ndarray
        Chemins des images de test.
    trainY : np.ndarray
        Labels d'entraînement.
    valY : np.ndarray
        Labels de validation.
    testY : np.ndarray
        Labels de test.
    """
    # Division en entraînement et (validation+test)
    trainX, remainingX, trainY, remainingY = train_test_split(
        image_files,
        image_labels,
        test_size=valid_frac + test_frac,
        stratify=image_labels,
        random_state=42
    )

    # Division du 'remaining' en validation et test
    valX, testX, valY, testY = train_test_split(
        remainingX,
        remainingY,
        test_size=test_frac / (valid_frac + test_frac),
        stratify=remainingY,
        random_state=42
    )

    return trainX, valX, testX, trainY, valY, testY

# Paramètres pour la division
valid_frac, test_frac = 0.15, 0.25

# Application de la fonction de séparation
trainX, valX, testX, trainY, valY, testY = train_val_test_split(
    image_file_list,
    image_label_list,
    valid_frac,
    test_frac
)

# Affichage des tailles
print(f"Nombre d'images d'entraînement: {len(trainX)}")
print(f"Nombre d'images de validation: {len(valX)}")
print(f"Nombre d'images de test: {len(testX)}")

Nombre d'images d'entraînement: 24000
Nombre d'images de validation: 6000
Nombre d'images de test: 10000

class SurfaceCrackDataset(Dataset):
    """
    Dataset personnalisé pour charger les images de fissures et leurs étiquettes.

    Parameters
    ----------
    image_paths : array-like
        Liste ou tableau des chemins vers les images.
    labels : array-like
        Liste ou tableau des labels associés aux images (0 ou 1).
    transform : torchvision.transforms.Compose, optional
        Transformations à appliquer aux images.
    """
    def __init__(self, image_paths, labels, transform=None):
        self.image_paths = image_paths
        self.labels = labels
        self.transform = transform

    def __len__(self):
        """
        Retourne la taille du dataset.
        """
        return len(self.image_paths)

    def __getitem__(self, idx):
        """
        Récupère l'image et le label à l'indice idx.

        Parameters
        ----------
        idx : int
            Indice de l'exemple.

        Returns
        -------
        image : torch.Tensor
            L'image transformée en tenseur.
        label : int
            Le label associé à l'image.
        """
        img_path = self.image_paths[idx]
        label = self.labels[idx]
        image = Image.open(img_path).convert('RGB')

        if self.transform:
            image = self.transform(image)

        return image, label

# Définition des transformations
transformations = transforms.Compose([
    transforms.Resize((128, 128)),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5])
])

# Création des datasets
train_dataset = SurfaceCrackDataset(trainX, trainY, transform=transformations)
val_dataset = SurfaceCrackDataset(valX, valY, transform=transformations)
test_dataset = SurfaceCrackDataset(testX, testY, transform=transformations)

# Création des DataLoaders
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)
val_loader = DataLoader(val_dataset, batch_size=32, shuffle=False)
test_loader = DataLoader(test_dataset, batch_size=32, shuffle=False)

print("Les DataLoaders pour l'entraînement, la validation et le test sont prêts.")

Les DataLoaders pour l'entraînement, la validation et le test sont prêts.

class CNN_Model(nn.Module):
    """
    Modèle CNN simple pour la détection de fissures.

    Architecture :
    - 3 couches convolutionnelles suivies de ReLU et MaxPooling
    - 2 couches fully-connected pour la classification finale

    Input : (batch_size, 3, 128, 128)
    Output : logits de taille (batch_size, 2)
    """
    def __init__(self):
        super(CNN_Model, self).__init__()
        self.conv1 = nn.Conv2d(in_channels=3, out_channels=32, kernel_size=3, stride=1, padding=1)
        self.pool = nn.MaxPool2d(kernel_size=2, stride=2)
        self.conv2 = nn.Conv2d(in_channels=32, out_channels=64, kernel_size=3, stride=1, padding=1)
        self.conv3 = nn.Conv2d(in_channels=64, out_channels=128, kernel_size=3, stride=1, padding=1)

        # Après 3 max-poolings successifs, la taille diminue de 128 -> 64 -> 32 -> 16 (2^3 = 8x réduction)
        # Donc la dernière carte de caractéristiques est de taille (128, 16, 16)
        self.fc1 = nn.Linear(128 * 16 * 16, 128)
        self.fc2 = nn.Linear(128, 2)

    def forward(self, x):
        """
        Décrit le passage des données à travers le réseau.
        """
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = self.pool(F.relu(self.conv3(x)))

        # Aplatir avant la partie fully-connected
        x = x.view(-1, 128 * 16 * 16)
        x = F.relu(self.fc1(x))
        x = self.fc2(x)

        return x

# Initialisation du modèle
model = CNN_Model()
print(model)

CNN_Model(
  (conv1): Conv2d(3, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
  (pool): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
  (conv2): Conv2d(32, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
  (conv3): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
  (fc1): Linear(in_features=32768, out_features=128, bias=True)
  (fc2): Linear(in_features=128, out_features=2, bias=True)
)

def calculate_accuracy(predictions, labels):
    """
    Calcule l'accuracy entre les prédictions et les étiquettes réelles.

    Parameters
    ----------
    predictions : torch.Tensor
        Sorties du modèle de taille (batch_size, num_classes).
    labels : torch.Tensor
        Labels réels de taille (batch_size).

    Returns
    -------
    accuracy : float
        Pourcentage d'exemples correctement classés dans ce batch.
    """
    # Obtenir les prédictions avec la probabilité maximale
    _, predicted = torch.max(predictions, 1)
    correct = (predicted == labels).sum().item()
    # Calculer la précision
    accuracy = 100.0 * correct / labels.size(0)
    return accuracy

def train_one_epoch(model, train_loader, criterion, optimizer, device, epoch, total_epochs, print_freq=100):
    """
    Effectue une passe d'entraînement (une époque) sur l'ensemble des données d'entraînement.

    Parameters
    ----------
    model : nn.Module
        Le modèle à entraîner.
    train_loader : DataLoader
        DataLoader pour les données d'entraînement.
    criterion : nn.Module
        Fonction de perte (ex: nn.CrossEntropyLoss).
    optimizer : torch.optim.Optimizer
        Optimiseur pour mettre à jour les paramètres du modèle.
    device : torch.device
        Dispositif (CPU ou GPU) sur lequel exécuter le modèle.
    epoch : int
        Numéro de l'époque en cours.
    total_epochs : int
        Nombre total d'époques prévues.
    print_freq : int, optional
        Fréquence (en nombre de batchs) à laquelle afficher les informations pendant l'entraînement.

    Returns
    -------
    avg_loss : float
        Perte moyenne sur l'époque.
    avg_acc : float
        Accuracy moyenne sur l'époque.
    """
    # Mode d'entraînement
    model.train()

    # Variables pour suivre les métriques
    running_loss = 0.0
    running_correct = 0
    total_samples = 0

    for batch_idx, (images, labels) in enumerate(train_loader, start=1):
        # Chargement des données sur le device (CPU/GPU)
        images = images.to(device)
        labels = labels.to(device)

        # Étape forward
        outputs = model(images)
        loss = criterion(outputs, labels)

        # Étape backward
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        # Calcul de la précision pour ce batch
        _, predicted = torch.max(outputs, 1)
        correct = (predicted == labels).sum().item()
        batch_acc = 100.0 * correct / labels.size(0)

        # Mise à jour des métriques globales
        running_loss += loss.item() * labels.size(0)
        running_correct += correct
        total_samples += labels.size(0)

        # Affichage des informations périodiquement
        if batch_idx % print_freq == 0:
            avg_batch_loss = running_loss / total_samples
            avg_batch_acc = 100.0 * running_correct / total_samples
            print(f"Epoch [{epoch}/{total_epochs}], Step [{batch_idx}/{len(train_loader)}], "
                  f"Loss: {avg_batch_loss:.4f}, Accuracy: {avg_batch_acc:.2f}%")

    # Calcul des moyennes pour l'époque
    avg_loss = running_loss / total_samples
    avg_acc = 100.0 * running_correct / total_samples
    return avg_loss, avg_acc

def evaluate(model, val_loader, criterion, device):
    """
    Évalue le modèle sur l'ensemble de validation.

    Parameters
    ----------
    model : nn.Module
        Le modèle à évaluer.
    val_loader : DataLoader
        DataLoader pour les données de validation.
    criterion : nn.Module
        Fonction de perte.
    device : torch.device
        Dispositif (CPU ou GPU).

    Returns
    -------
    avg_loss : float
        Perte moyenne sur l'ensemble de validation.
    avg_acc : float
        Accuracy moyenne sur l'ensemble de validation.
    """
    # Mode évaluation (désactive le calcul des gradients)
    model.eval()

    # Variables pour suivre les métriques
    running_loss = 0.0
    running_correct = 0
    total_samples = 0

    with torch.no_grad():  # Pas de backpropagation
        for images, labels in val_loader:
            # Chargement des données sur le device (CPU/GPU)
            images = images.to(device)
            labels = labels.to(device)

            # Étape forward
            outputs = model(images)
            loss = criterion(outputs, labels)

            # Calcul de la précision pour ce batch
            _, predicted = torch.max(outputs, 1)
            correct = (predicted == labels).sum().item()

            # Mise à jour des métriques globales
            running_loss += loss.item() * labels.size(0)
            running_correct += correct
            total_samples += labels.size(0)

    # Calcul des moyennes pour l'ensemble de validation
    avg_loss = running_loss / total_samples
    avg_acc = 100.0 * running_correct / total_samples
    return avg_loss, avg_acc

# Paramètres d'entraînement
learning_rate = 0.001
num_epochs = 10

# Définition du device (GPU si disponible, sinon CPU)
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model.to(device)

# Définition de la fonction de perte et de l'optimiseur
criterion = torch.nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=learning_rate)

# Listes pour stocker les métriques pour les graphiques
train_losses = []
val_losses = []
train_accuracies = []
val_accuracies = []

print("Début de l'entraînement...")

# Boucle d'entraînement sur plusieurs époques
for epoch in range(1, num_epochs + 1):
    # Entraînement du modèle sur l'ensemble d'entraînement
    train_loss, train_acc = train_one_epoch(model, train_loader, criterion, optimizer, device, epoch, num_epochs, print_freq=500)
    train_losses.append(train_loss)
    train_accuracies.append(train_acc)

    # Évaluation du modèle sur l'ensemble de validation
    val_loss, val_acc = evaluate(model, val_loader, criterion, device)
    val_losses.append(val_loss)
    val_accuracies.append(val_acc)

    # Affichage des métriques globales pour chaque époque
    print(f"Epoch {epoch}/{num_epochs}, "
          f"Train Loss: {train_loss:.4f}, Train Accuracy: {train_acc:.2f}%, "
          f"Val Loss: {val_loss:.4f}, Val Accuracy: {val_acc:.2f}%\n")

Début de l'entraînement...
Epoch [1/10], Step [500/750], Loss: 0.0759, Accuracy: 97.72%
Epoch 1/10, Train Loss: 0.0591, Train Accuracy: 98.23%, Val Loss: 0.0257, Val Accuracy: 99.15%

Epoch [2/10], Step [500/750], Loss: 0.0222, Accuracy: 99.32%
Epoch 2/10, Train Loss: 0.0228, Train Accuracy: 99.30%, Val Loss: 0.0200, Val Accuracy: 99.38%

Epoch [3/10], Step [500/750], Loss: 0.0133, Accuracy: 99.58%
Epoch 3/10, Train Loss: 0.0132, Train Accuracy: 99.59%, Val Loss: 0.0141, Val Accuracy: 99.62%

Epoch [4/10], Step [500/750], Loss: 0.0112, Accuracy: 99.71%
Epoch 4/10, Train Loss: 0.0105, Train Accuracy: 99.72%, Val Loss: 0.0153, Val Accuracy: 99.45%

Epoch [5/10], Step [500/750], Loss: 0.0071, Accuracy: 99.81%
Epoch 5/10, Train Loss: 0.0088, Train Accuracy: 99.74%, Val Loss: 0.0120, Val Accuracy: 99.60%

Epoch [6/10], Step [500/750], Loss: 0.0086, Accuracy: 99.76%
Epoch 6/10, Train Loss: 0.0069, Train Accuracy: 99.80%, Val Loss: 0.0137, Val Accuracy: 99.70%

Epoch [7/10], Step [500/750], Loss: 0.0018, Accuracy: 99.94%
Epoch 7/10, Train Loss: 0.0036, Train Accuracy: 99.90%, Val Loss: 0.0147, Val Accuracy: 99.70%

Epoch [8/10], Step [500/750], Loss: 0.0056, Accuracy: 99.86%
Epoch 8/10, Train Loss: 0.0078, Train Accuracy: 99.81%, Val Loss: 0.0181, Val Accuracy: 99.65%

Epoch [9/10], Step [500/750], Loss: 0.0036, Accuracy: 99.91%
Epoch 9/10, Train Loss: 0.0030, Train Accuracy: 99.92%, Val Loss: 0.0248, Val Accuracy: 99.63%

Epoch [10/10], Step [500/750], Loss: 0.0018, Accuracy: 99.95%
Epoch 10/10, Train Loss: 0.0022, Train Accuracy: 99.95%, Val Loss: 0.0174, Val Accuracy: 99.75%

# Fonction pour afficher les courbes de pertes et de précisions
def plot_training_curves(epochs, train_losses, val_losses, train_accuracies, val_accuracies):
    """
    Génère les graphiques des courbes de perte et de précision pour l'entraînement et la validation.

    Parameters
    ----------
    epochs : int
        Nombre total d'époques.
    train_losses : list
        Liste des pertes moyennes par époque pour l'entraînement.
    val_losses : list
        Liste des pertes moyennes par époque pour la validation.
    train_accuracies : list
        Liste des précisions moyennes par époque pour l'entraînement.
    val_accuracies : list
        Liste des précisions moyennes par époque pour la validation.
    """
    plt.figure(figsize=(12, 6))

    # Courbe des pertes
    plt.subplot(1, 2, 1)
    plt.plot(range(1, epochs + 1), train_losses, label='Pertes Entraînement', marker='o')
    plt.plot(range(1, epochs + 1), val_losses, label='Pertes Validation', marker='o')
    plt.title("Courbe des Pertes")
    plt.xlabel("Époques")
    plt.ylabel("Perte")
    plt.legend()
    plt.grid()

    # Courbe des précisions
    plt.subplot(1, 2, 2)
    plt.plot(range(1, epochs + 1), train_accuracies, label='Précision Entraînement', marker='o')
    plt.plot(range(1, epochs + 1), val_accuracies, label='Précision Validation', marker='o')
    plt.title("Courbe des Précisions")
    plt.xlabel("Époques")
    plt.ylabel("Précision (%)")
    plt.legend()
    plt.grid()

    plt.tight_layout()
    plt.show()
# Appel des fonctions pour afficher les graphiques
print("Affichage des courbes d'entraînement...")
plot_training_curves(num_epochs, train_losses, val_losses, train_accuracies, val_accuracies)

Affichage des courbes d'entraînement...

def generate_report(model, test_loader, device):
    """
    Génère un rapport complet des performances du modèle avec :
    - Matrice de confusion
    - Courbe ROC et AUC
    - Rapport de classification (heatmap)
    - Distribution des probabilités prédites

    Parameters
    ----------
    model : nn.Module
        Le modèle à tester.
    test_loader : DataLoader
        DataLoader pour les données de test.
    device : torch.device
        Dispositif sur lequel exécuter l'évaluation.
    """
    model.eval()
    all_labels = []
    all_predictions = []
    all_probs = []

    with torch.no_grad():
        for images, labels in test_loader:
            images, labels = images.to(device), labels.to(device)

            # Prédictions
            outputs = model(images)
            probabilities = F.softmax(outputs, dim=1)  # Convertir en probabilités
            _, predicted = torch.max(outputs, 1)

            # Sauvegarde des étiquettes et les prédictions
            all_labels.extend(labels.cpu().numpy())
            all_predictions.extend(predicted.cpu().numpy())
            all_probs.extend(probabilities.cpu().numpy())

    # Convertsion des résultats en numpy array
    all_labels = np.array(all_labels)
    all_predictions = np.array(all_predictions)
    all_probs = np.array(all_probs)

    # Initialisation des graphiques
    fig, axs = plt.subplots(2, 2, figsize=(15, 12))

    # Matrice de confusion
    conf_matrix = confusion_matrix(all_labels, all_predictions)
    sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues', xticklabels=['Negative', 'Positive'], yticklabels=['Negative', 'Positive'], ax=axs[0, 1])
    axs[0, 1].set_title("Matrice de Confusion")
    axs[0, 1].set_xlabel("Prédictions")
    axs[0, 1].set_ylabel("Vérités")

    # Courbe ROC et AUC
    fpr, tpr, _ = roc_curve(all_labels, all_probs[:, 1])  # Utiliser les probabilités de la classe Positive
    roc_auc = auc(fpr, tpr)
    axs[0, 0].plot(fpr, tpr, color='blue', label=f'ROC Curve (AUC = {roc_auc:.2f})')
    axs[0, 0].plot([0, 1], [0, 1], color='gray', linestyle='--')  # Diagonale
    axs[0, 0].set_title("Courbe ROC")
    axs[0, 0].set_xlabel("False Positive Rate")
    axs[0, 0].set_ylabel("True Positive Rate")
    axs[0, 0].legend(loc="lower right")

    # Distribution des probabilités prédites
    sns.histplot(all_probs[:, 1], kde=True, color='blue', bins=30, ax=axs[1, 0])
    axs[1, 0].set_title("Distribution des probabilités prédites")
    axs[1, 0].set_xlabel("Probabilité prédite pour la classe 1")
    axs[1, 0].set_ylabel("Fréquence")

    # Rapport de classification
    report = classification_report(all_labels, all_predictions, target_names=['Negative', 'Positive'], output_dict=True)
    report_df = pd.DataFrame(report).iloc[:-1, :].T  # Exclure l'accuracy globale
    sns.heatmap(report_df, annot=True, cmap='coolwarm', cbar=False, ax=axs[1, 1])
    axs[1, 1].set_title("Rapport de Classification")
    axs[1, 1].set_xlabel("Métriques")
    axs[1, 1].set_ylabel("Classes")

    # Ajustement et affichage
    plt.tight_layout()
    plt.show()

# Appel de la fonction pour générer le rapport
print("Génération du rapport complet...")
generate_report(model, test_loader, device)

Génération du rapport complet...

Notebook pour le projet : Détection de fissures dans les matériaux bétonnés

Introduction¶

Présentation du problème¶

Objectif du projet¶

Importantion des packages nécessaires¶

Description du Jeu de Données¶

Structure du dataset¶

Visualisation de quelques images¶

Prétraitement des données¶

Méthodes de prétraitement envisagées¶

Division des données¶

Conversion des données¶

Étapes futures¶

Création des datasets et DataLoaders¶

Définition des transformations¶

Création des datasets¶

Initialisation des DataLoaders¶

Modélisation¶

Modèle CNN (Convolutional Neural Network)¶

Architecture prévue¶

Flux prévu des données¶

Objectifs et avantages¶

Entraînement du modèle¶

Paramètres d'entraînement¶

Méthode d'entraînement¶

Évaluation sur l'ensemble de validation¶

Affichage des métriques¶

Objectifs de l'entraînement¶

Évaluation du modèle¶

Évaluation sur les données de validation¶

Courbes d'entraînement¶

Courbe de Pertes¶

Courbe de Précisions¶

Interprétation¶

Conclusion¶

Évaluation sur les données de test¶

Conclusion¶