Pandas
Votre Publicité sur le Réseau |
Traduction
Traductions
Définition
Domaine, Discipline, Thématique
Justification
Définition écrite
Définition L’objectif de ce tutoriel est d’introduire Python pour la préparation de données massives, lorsqu’elles sont trop volumineuses pour la mémoire (RAM) d’un ordinateur. Cette étape est abordée par l’initiation aux fonctionnalités de la librairie pandas et à la classe DataFrame ; lire et écrire des fichiers, gérer une table de données et les types des variables, échantillonner, discrétiser, regrouper des modalités, description élémentaires uni et bi-variées ; concaténation et jointure de tables
- Pandas est une bibliothèque écrite pour le langage de programmation Python permettant la manipulation et l'analyse des données. Elle propose en particulier des structures de données et des opérations de manipulation de tableaux numériques et de séries temporelles.
- Un objet de type data frame, permet de réaliser de nombreuses opérations de filtrage, prétraitements, etc., préalables à la modélisation statistique.
Fonctionnalités de pandas
La richesse des fonctionnalités de la librairie pandas est une des raisons, si ce n’est la principale, d’utiliser Python pour extraire, préparer, éventuellement analyser, des données. En voici un bref aperçu.
- Objets :les classes Series et DataFrame ou table de données.
- Lire, écrire création et exportation de tables de données à partir de fichiers textes (séparateurs, .csv, format fixe, compressés), binaires (HDF5 avec Pytable), HTML, XML, JSON, MongoDB, SQL...
- Gestion d’une table : sélection des lignes, colonnes, transformations, réorganisation par niveau d’un facteur, discrétisation de variables quantitatives, exclusion ou imputation élémentaire de données manquantes, permutation et échantillonnage aléatoire, variables indicatrices, chaînede caractères Statistiques élémentaires uni et bivariées, tri à plat (nombre de modalités, de valeurs nulles, de valeurs manquantes...), graphiques associés, statistiques par groupe, détection élémentaire de valeurs atypiques...
- Manipulation de tables : concaténations, fusions, jointures, tri, gestion des types et formats
Informations Créateur: Wes McKinney Dernière version: 1.2.4 (12 avril 2021)1 Écrit en: Python Système d'exploitation: Multiplateforme Type: Bibliothèque logicielle Python (d) ,Numerical software (d) Licence: Licence BSD Documentation: pandas.pydata.org/docs/user_guide/index.html#user-guide Site web: pandas.pydata.org |
Pandas - Historique (+)
Définition graphique
Concepts ou notions associés
Pandas - Glossaire / (+)
Exemples, applications, utilisations
Manipulation des données avec Pandas |
Erreurs ou confusions éventuelles
- Confusion entre la commande tail- commande head qui permet la première d'afficher les 5 premières lignes de dataframe et l'autre d'afficher les 5 dernières lignes du dataframe
- Confusion entre fichier Excel- fichier csv
- Erreur fréquente: Les élèves trouve toujours le problème de charger le fichier que ce soit de type Excel, txt ou csv.
Questions possibles
Liaisons enseignements et programmes
Idées ou Réflexions liées à son enseignement
Aides et astuces
Education: Autres liens, sites ou portails
Bibliographie
Pour citer cette page: ([1])
ABROUGUI, M & al, 2021. Pandas. In Didaquest [en ligne]. <http:www.didaquest.org/wiki/Pandas>, consulté le 25, novembre, 2024
- ..................
- ..................
- ..................
- ..................