Skip to content

moussahassana/datascince-groupe6

Repository files navigation

TPE DATA SCIENCE GROUPE 6

Groupe 6 (k-means) - Tâches et Répartition :

COMPTE RENDU DE REPARTITION DES TACHES POUR LE DE L'ALGORITHME DE K-MEANS

Introduction

Dans le cadre de la réalisation de l'algorithme K-Means, nous avons organisé la répartition des tâches entre huit étudiants. Chaque étudiant a été assigné à une tâche spécifique pour assurer une progression logique du développement de l'algorithme. L'objectif était de couvrir toutes les étapes, de l'initialisation de la classe à l'implémentation de la méthode du coude pour déterminer le nombre optimal de clusters.

Collecte des Données sur Kaggle

Membres responsables : Tache commune

Effectuer des recherches sur Kaggle pour trouver un ensemble de données pertinent dans le domaine de la santé. Les membres responsables doivent ensuite collaborer pour sélectionner un ensemble de données adéquat, le collecter, et le télécharger. Cette étape est cruciale pour garantir que l'algorithme K-Means sera appliqué sur des données significatives.

Prétraitement des Données

Membres responsables : Tache commune

Nettoyer les données, gérer les valeurs manquantes et effectuer des transformations nécessaires pour préparer les données en vue du clustering. Cela comprend le traitement des outliers, la normalisation des données, et toute autre étape nécessaire pour assurer la qualité des données utilisées dans l'algorithme K-Means.

Répartition des Tâches pour le Développement de l'Algorithme K-Means

  1. Moussa Hassana (Méthode __init__) :

    • Tâche : Implémenter la méthode __init__ pour initialiser la classe avec le nombre spécifié de clusters.
    • Résultat Attendu : La classe KMeans est correctement initialisée.
  2. Oumarou Koulagna (Méthode initialize_centers) :

    • Tâche : Implémenter la méthode initialize_centers qui sélectionne aléatoirement K points du jeu de données pour initialiser les centroïdes.
    • Résultat Attendu : Les centroïdes sont initialisés correctement.
  3. Esdras Touka (Méthode assign_points_centers) :

    • Tâche : Implémenter la méthode assign_points_centers qui affecte chaque point du jeu de données au centroïde le plus proche.
    • Résultat Attendu : Les points sont correctement affectés aux centroïdes.
  4. El bachir (Méthode compute_mean) :

    • Tâche : Implémenter la méthode compute_mean qui calcule la moyenne des points attribués à chaque centroïde.
    • Résultat Attendu : Les moyennes des points attribués à chaque centroïde sont correctement calculées.
  5. Toukap Nono et Moussa Hassana (Méthode fit) :

    • Tâche : Implémenter la méthode fit qui effectue le clustering sur le jeu de données en utilisant l'algorithme K-Means.
    • Résultat Attendu : La méthode fit s'exécute correctement, et les centroïdes ainsi que l'affectation des points sont mis à jour de manière appropriée.
  6. Akawi Tsoutekin (Méthode inertia) :

    • Tâche : Implémenter la méthode inertia qui calcule l'inertie (somme des carrés des distances intra-cluster).
    • Résultat Attendu : L'inertie est correctement calculée.
  7. Julien (Méthode plot_clusters) :

    • Tâche : Implémenter la méthode plot_clusters qui trace le jeu de données clusterisé.
    • Résultat Attendu : Le tracé des clusters et des centroïdes est correct.
  8. Steven (Méthode elbow_method) :

    • Tâche : Implémenter la méthode elbow_method qui trace la courbe du coude et retourne le nombre optimal de clusters.
    • Résultat Attendu : La courbe du coude est correctement tracée, et le nombre optimal de clusters est retourné.

L'evalution de la performance

Membres responsables : Tache commune

Coordination (Chef de groupe) :

Le chef de groupe sera responsable de coordonner le travail, de s'assurer que chaque membre respecte les délais et de faciliter la communication entre les sous-groupes. Gardez une trace des progrès individuels et organisez des réunions régulières pour discuter des avancées et résoudre les problèmes éventuels.

Conclusion

La répartition des tâches a été conçue de manière à assurer une progression logique du développement de l'algorithme K-Means. La collecte des données sur Kaggle et le prétraitement des données ont été inclus pour garantir l'utilisation d'un ensemble de données pertinent et de qualité. Chaque étudiant est responsable d'une partie spécifique du code, et l'intégration du travail sera effectuée une fois que toutes les tâches auront été complétées avec succès. Cette approche collaborative, supervisée par le chef de groupe, permettra de garantir la qualité et la cohérence de l'implémentation finale de l'algorithme K-Means.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published