Dans le cadre de la réalisation de l'algorithme K-Means, nous avons organisé la répartition des tâches entre huit étudiants. Chaque étudiant a été assigné à une tâche spécifique pour assurer une progression logique du développement de l'algorithme. L'objectif était de couvrir toutes les étapes, de l'initialisation de la classe à l'implémentation de la méthode du coude pour déterminer le nombre optimal de clusters.
Membres responsables : Tache commune
Effectuer des recherches sur Kaggle pour trouver un ensemble de données pertinent dans le domaine de la santé. Les membres responsables doivent ensuite collaborer pour sélectionner un ensemble de données adéquat, le collecter, et le télécharger. Cette étape est cruciale pour garantir que l'algorithme K-Means sera appliqué sur des données significatives.
Membres responsables : Tache commune
Nettoyer les données, gérer les valeurs manquantes et effectuer des transformations nécessaires pour préparer les données en vue du clustering. Cela comprend le traitement des outliers, la normalisation des données, et toute autre étape nécessaire pour assurer la qualité des données utilisées dans l'algorithme K-Means.
-
Moussa Hassana (Méthode
__init__
) :- Tâche : Implémenter la méthode
__init__
pour initialiser la classe avec le nombre spécifié de clusters. - Résultat Attendu : La classe KMeans est correctement initialisée.
- Tâche : Implémenter la méthode
-
Oumarou Koulagna (Méthode
initialize_centers
) :- Tâche : Implémenter la méthode
initialize_centers
qui sélectionne aléatoirement K points du jeu de données pour initialiser les centroïdes. - Résultat Attendu : Les centroïdes sont initialisés correctement.
- Tâche : Implémenter la méthode
-
Esdras Touka (Méthode
assign_points_centers
) :- Tâche : Implémenter la méthode
assign_points_centers
qui affecte chaque point du jeu de données au centroïde le plus proche. - Résultat Attendu : Les points sont correctement affectés aux centroïdes.
- Tâche : Implémenter la méthode
-
El bachir (Méthode
compute_mean
) :- Tâche : Implémenter la méthode
compute_mean
qui calcule la moyenne des points attribués à chaque centroïde. - Résultat Attendu : Les moyennes des points attribués à chaque centroïde sont correctement calculées.
- Tâche : Implémenter la méthode
-
Toukap Nono et Moussa Hassana (Méthode
fit
) :- Tâche : Implémenter la méthode
fit
qui effectue le clustering sur le jeu de données en utilisant l'algorithme K-Means. - Résultat Attendu : La méthode
fit
s'exécute correctement, et les centroïdes ainsi que l'affectation des points sont mis à jour de manière appropriée.
- Tâche : Implémenter la méthode
-
Akawi Tsoutekin (Méthode
inertia
) :- Tâche : Implémenter la méthode
inertia
qui calcule l'inertie (somme des carrés des distances intra-cluster). - Résultat Attendu : L'inertie est correctement calculée.
- Tâche : Implémenter la méthode
-
Julien (Méthode
plot_clusters
) :- Tâche : Implémenter la méthode
plot_clusters
qui trace le jeu de données clusterisé. - Résultat Attendu : Le tracé des clusters et des centroïdes est correct.
- Tâche : Implémenter la méthode
-
Steven (Méthode
elbow_method
) :- Tâche : Implémenter la méthode
elbow_method
qui trace la courbe du coude et retourne le nombre optimal de clusters. - Résultat Attendu : La courbe du coude est correctement tracée, et le nombre optimal de clusters est retourné.
- Tâche : Implémenter la méthode
Membres responsables : Tache commune
Le chef de groupe sera responsable de coordonner le travail, de s'assurer que chaque membre respecte les délais et de faciliter la communication entre les sous-groupes. Gardez une trace des progrès individuels et organisez des réunions régulières pour discuter des avancées et résoudre les problèmes éventuels.
La répartition des tâches a été conçue de manière à assurer une progression logique du développement de l'algorithme K-Means. La collecte des données sur Kaggle et le prétraitement des données ont été inclus pour garantir l'utilisation d'un ensemble de données pertinent et de qualité. Chaque étudiant est responsable d'une partie spécifique du code, et l'intégration du travail sera effectuée une fois que toutes les tâches auront été complétées avec succès. Cette approche collaborative, supervisée par le chef de groupe, permettra de garantir la qualité et la cohérence de l'implémentation finale de l'algorithme K-Means.