
Mekki MOURADI
Data Analyst
Rabat, Maroc
À Propos
Data Analyst Junior avec une solide expérience en marketing numérique et des compétences approfondies dans l’utilisation de Microsoft Excel, SQL, Tableau Software et Python.
Data Cleaning in Excel: Techniques to Clean Messy Data


Liens
Compétences & Outils
Description du projet
- Explorer le concept de données non structurées
- Trouvez et supprimez les cases vides, les doublons et les valeurs aberrantes
- Manipuler du texte au sein de données non structurées
Objectifs de l'analyse
Nettoyer et manipuler les données d’un établissement scolaire
- Explore the concept of untidy data
- Exploration des données.
- Doublons dans la colonne “Name” alors qu’ils doivent être distincts
- Différentes mises en forme des caractères (maj – min)
- Cellules vides
- Cellules avec erreurs #DIV/0!
- Pour les différentes Notes, valeurs négatives ou valeurs supérieures à 100
- Mise en forme irrégulière

- Find and Remove Blanks, Duplicates, and Outliers
- Identifier les cellules vides.
- Conditional Formatting -> Blanks -> Red background


- Suppression de la ligne vide
- Ajout des données manquantes après vérification

- Gérer les doublons.
- Data -> Remove duplicates


- Gérer les valeurs aberrantes.
- Sélection des colonnes D, E et F -> Conditional Formatting -> Greater than 100 -> Yellow background
- Sélection des colonnes D, E et F -> Conditional Formatting -> Less than 0 -> Orange background

- Modification des données erronées après vérification

- Remove Formatting, change Text Case, and Trim
- Effacer et modifier les formats.
- Clear -> Clear Formats

- Noms de colonnes en gras
- Colonne “Average” en 0 décimales

- Utiliser la fonction TRIM pour supprimer les espaces à droite et à gauche des noms dans la colonne "Name".

- Utiliser la fonction PROPER pour formater les noms.

- Utiliser la fonction UPPER pour formater les notes.

- Remplacer les valeurs et supprimer les colonnes créées pour la mise en forme finale.

- Split text to columns
- Scinder la colonne "Name" en "Last Name" et "First Name".
- Méthode 1 :
- Insérer une colonne à droit de “Name” avec le nom “Last Name”
- Remplacer le nom de la colonne “Name” par “First Name”
- Data -> Text to Column
- Définir le séparateur comme “espace”

- Méthode 2 :
- Insérer 2 colonnes à la droite de “Name” nommées “First Name” et “Last Name”
- Dans la colonne “First Name”, insérer la première fonction
- Dans la colonne “Last Name”, insérer la seconde fonction

- Split text to columns
- Scinder la colonne "Name" en "Last Name" et "First Name".
- Méthode 1 :
- Insérer une colonne à droit de “Name” avec le nom “Last Name”
- Remplacer le nom de la colonne “Name” par “First Name”
- Data -> Text to Column
- Définir le séparateur comme “espace”

- Méthode 2 :
- Insérer 2 colonnes à la droite de “Name” nommées “First Name” et “Last Name”
- Dans la colonne “First Name”, insérer la première fonction
- Dans la colonne “Last Name”, insérer la seconde fonction

- Scinder la colonne "Address" en "City" et "Country".
- Insérer une colonne à droit de “Address” avec le nom “Country”
- Remplacer le nom de la colonne “Address” par “City”
- Data -> Text to Column
- Définir le séparateur comme “-“

- Find and Replace
- Remplacer toutes les valeurs "Coursera" dans la colonne "City" par "San Francisco".
- Find and Select -> Replace
- Find “Coursera” -> Replace with “San Francisco” -> Replace all

- Remplacer les notes "9" par "15".
- Find and Select -> Replace
- Search Options -> Within Selection
- Tick Match entire cell contents
- Find “9” -> Replace with “15” -> Replace all
