Mekki MOURADI

Data Analyst

Rabat, Maroc

À Propos

Data Analyst Junior avec une solide expérience en marketing numérique et des compétences approfondies dans l’utilisation de Microsoft Excel, SQL, Tableau Software et Python.

Data Cleaning in Excel: Techniques to Clean Messy Data

Liens

Compétences & Outils

Description du projet

  • Explorer le concept de données non structurées
  • Trouvez et supprimez les cases vides, les doublons et les valeurs aberrantes
  • Manipuler du texte au sein de données non structurées

Objectifs de l'analyse

Nettoyer et manipuler les données d’un établissement scolaire
  1. Explore the concept of untidy data
  1. Exploration des données.
  • Doublons dans la colonne “Name” alors qu’ils doivent être distincts
  • Différentes mises en forme des caractères (maj – min)
  • Cellules vides
  • Cellules avec erreurs #DIV/0!
  • Pour les différentes Notes, valeurs négatives ou valeurs supérieures à 100
  • Mise en forme irrégulière
  1. Find and Remove Blanks, Duplicates, and Outliers
  1. Identifier les cellules vides.
  • Conditional Formatting -> Blanks -> Red background
  • Suppression de la ligne vide
  • Ajout des données manquantes après vérification
  1. Gérer les doublons.
  • Data -> Remove duplicates
  1. Gérer les valeurs aberrantes.
  • Sélection des colonnes D, E et F -> Conditional Formatting -> Greater than 100 -> Yellow background
  • Sélection des colonnes D, E et F -> Conditional Formatting -> Less than 0 -> Orange background
  • Modification des données erronées après vérification
  1. Remove Formatting, change Text Case, and Trim
  1. Effacer et modifier les formats.
  • Clear -> Clear Formats
  • Noms de colonnes en gras
  • Colonne “Average” en 0 décimales
  1. Utiliser la fonction TRIM pour supprimer les espaces à droite et à gauche des noms dans la colonne "Name".
  1. Utiliser la fonction PROPER pour formater les noms.
  1. Utiliser la fonction UPPER pour formater les notes.
  1. Remplacer les valeurs et supprimer les colonnes créées pour la mise en forme finale.
  1. Split text to columns
  1. Scinder la colonne "Name" en "Last Name" et "First Name".
  • Méthode 1 :
    • Insérer une colonne à droit de “Name” avec le nom “Last Name”
    • Remplacer le nom de la colonne “Name” par “First Name”
    • Data -> Text to Column
    • Définir le séparateur comme “espace”
  • Méthode 2 :
    • Insérer 2 colonnes à la droite de “Name” nommées “First Name” et “Last Name”
    • Dans la colonne “First Name”, insérer la première fonction
    • Dans la colonne “Last Name”, insérer la seconde fonction
  1. Split text to columns
  1. Scinder la colonne "Name" en "Last Name" et "First Name".
  • Méthode 1 :
    • Insérer une colonne à droit de “Name” avec le nom “Last Name”
    • Remplacer le nom de la colonne “Name” par “First Name”
    • Data -> Text to Column
    • Définir le séparateur comme “espace”
  • Méthode 2 :
    • Insérer 2 colonnes à la droite de “Name” nommées “First Name” et “Last Name”
    • Dans la colonne “First Name”, insérer la première fonction
    • Dans la colonne “Last Name”, insérer la seconde fonction
  1. Scinder la colonne "Address" en "City" et "Country".
  • Insérer une colonne à droit de “Address” avec le nom “Country”
  • Remplacer le nom de la colonne “Address” par “City”
  • Data -> Text to Column
  • Définir le séparateur comme “-“
  1. Find and Replace
  1. Remplacer toutes les valeurs "Coursera" dans la colonne "City" par "San Francisco".
  • Find and Select -> Replace
  • Find “Coursera” -> Replace with “San Francisco” -> Replace all
  1. Remplacer les notes "9" par "15".
  • Find and Select -> Replace
  • Search Options -> Within Selection
  • Tick Match entire cell contents
  • Find “9” -> Replace with “15” -> Replace all