Différences entre versions de « Pandas »

De Didaquest
Aller à la navigationAller à la recherche
 
(92 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 13 : Ligne 13 :
 
[[{{FULLPAGENAME}}]] (Français)  
 
[[{{FULLPAGENAME}}]] (Français)  
 
/ [[Pandas]]  (Anglais)  
 
/ [[Pandas]]  (Anglais)  
/ [[PAndas]] (Arabe)
+
/ [[Pandas]] (Arabe)
  
 
}}<!-- ************** Fin Fiche Didactique Traduction ********************* -->
 
}}<!-- ************** Fin Fiche Didactique Traduction ********************* -->
Ligne 26 : Ligne 26 :
 
<!--****************** Commercez les modifications: Fiche-Disciplines-Thématiques *********************-->
 
<!--****************** Commercez les modifications: Fiche-Disciplines-Thématiques *********************-->
  
|Domaine-Discipline-Thématique-1= Analyse de données                         
+
|Domaine-Discipline-Thématique-1= Informatique                       
|Domaine-Discipline-Thématique-2= Programmation
+
|Domaine-Discipline-Thématique-2= Analyse de données
|Domaine-Discipline-Thématique-3= bibliothèque python
+
|Domaine-Discipline-Thématique-3= Programmation
|Domaine-Discipline-Thématique-4=
+
|Domaine-Discipline-Thématique-4= bibliothèque python
 
|Domaine-Discipline-Thématique-5=
 
|Domaine-Discipline-Thématique-5=
 
|Domaine-Discipline-Thématique-6=
 
|Domaine-Discipline-Thématique-6=
Ligne 48 : Ligne 48 :
 
|Définition= <!-- Ne pas Modifier  -->
 
|Définition= <!-- Ne pas Modifier  -->
 
<!-- *************** Commercez les modifications *******************-->
 
<!-- *************** Commercez les modifications *******************-->
'''Informations'''
 
'''Créateur:''' Wes McKinney
 
  
'''Dernière version''': 1.2.4 (12 avril 2021)1
+
<span style="color:purple"><big><U> <p><FONT size="4">'''1. Définition'''</p></FONT></U></big></span>
  
'''Écrit en:''' Python
+
*'''Pandas''' est une bibliothèque écrite pour le langage de programmation '''Python''' permettant la manipulation et l'analyse des données. Elle propose en particulier des structures de données et des opérations de manipulation de tableaux numériques et de séries temporelles.
 +
 
 +
*Un objet de type '''''data frame''''',  permet de réaliser de nombreuses opérations de filtrage, prétraitements, etc., préalables à la modélisation statistique.
 +
 
 +
 
 +
 
 +
<span style="color:purple"><big><U> <p><FONT size="4">'''2. Utilité de pandas'''</p></FONT></U></big></span>
 +
 
 +
L'utilité de ce tutoriel est d’introduire Python pour la préparation de données massives, lorsqu’elles sont trop volumineuses pour la mémoire (RAM) d’un ordinateur. Cette étape est abordée par l’initiation aux fonctionnalités de la librairie '''pandas''' et à la classe '''DataFrame''' ; lire et écrire des fichiers, gérer une table de données et les types des variables, échantillonner, discrétiser, regrouper des modalités, description élémentaires uni et bi-variées ; concaténation et jointure de tables.
 +
 
 +
 
 +
 
 +
<span style="color:purple"><big><U> <p><FONT size="4">'''3. Fonctionnalités de pandas'''</p></FONT></U></big></span>
 +
 
 +
La richesse des fonctionnalités de la librairie pandas est une des raisons, si ce n’est la principale, d’utiliser Python pour extraire, préparer, éventuellement analyser, des données. En voici un bref aperçu.
 +
* '''Objets :'''les classes Series et DataFrame ou table de données.
  
'''Système d'exploitation:''' Multiplateforme
+
* '''Lire, écrire''' création et exportation de tables de données à partir de fichiers textes (séparateurs, .csv, format fixe, compressés), binaires (HDF5 avec Pytable), HTML, XML, JSON, MongoDB, SQL...
  
'''Type:''' Bibliothèque logicielle Python (d) ,Numerical software (d)
+
* '''Gestion d’une table :''' sélection des lignes, colonnes, transformations, réorganisation par niveau d’un facteur, discrétisation de variables quantitatives, exclusion ou imputation élémentaire de données manquantes, permutation et échantillonnage aléatoire, variables indicatrices, chaînede caractères Statistiques élémentaires uni et bivariées, tri à plat (nombre de modalités, de valeurs nulles, de valeurs manquantes...), graphiques associés, statistiques par groupe, détection élémentaire de valeurs atypiques...
  
'''Licence:''' Licence BSD
+
* '''Manipulation de tables :''' concaténations, fusions, jointures, tri, gestion des types et formats
  
'''Documentation:''' pandas.pydata.org/docs/user_guide/index.html#user-guide
+
<span style="color:purple"><big><U> <p><FONT size="4">'''4. IDE pandas en python '''</p></FONT></U></big></span>
  
'''Site web:''' pandas.pydata.org
+
:* '''Thonny''' est un IDE (environnement de développement) minimaliste qui permet d'apprendre le Python. Conçu pour les débutants, cet outil intègre son propre interpréteur Python 3.6 (mais vous pouvez aussi utiliser le vôtre), et offre des fonctionnalités plutôt sympas quand on est dans un processus d'apprentissage.
 +
 
 +
:* On dois installer la bibliothéque pandas dans Thonny.
 +
 
 +
[[Fichier:Tt.jpg|centré]]  [[Fichier:Capture17-3.jpg|centré]]
  
  
Ligne 71 : Ligne 88 :
 
|Typologie= <!------------------------------------ Ne pas Modifier  -->
 
|Typologie= <!------------------------------------ Ne pas Modifier  -->
 
<!-- ****************** Commercez les modifications ****************-->
 
<!-- ****************** Commercez les modifications ****************-->
*'''Pandas''' est une bibliothèque écrite pour le langage de programmation '''Python''' permettant la manipulation et l'analyse des données. Elle propose en particulier des structures de données et des opérations de manipulation de tableaux numériques et de séries temporelles.
+
<span style="color:pink"><big><U> <p><FONT size="4">'''''Informations'''''</p></FONT></U></big></span>
 +
 
 +
 
 +
<span style="color:green">'''* Créateur:'''</span>          Wes McKinney
 +
 
 +
<span style="color:green">'''* Dernière version''':</span>  1.2.4 (12 avril 2021)1
 +
 
 +
<span style="color:green">'''* Écrit en:''' </span>  Python
 +
 
 +
<span style="color:green">'''* Système d'exploitation:''' </span> Multiplateforme
 +
 
 +
<span style="color:green">'''* Type:''' </span> Bibliothèque logicielle Python (d) ,Numerical software (d)
 +
 
 +
<span style="color:green">'''* Licence:'''</span> Licence BSD
 +
 
 +
<span style="color:green">'''* Documentation:'''</span> pandas.pydata.org/docs/user_guide/index.html#user-guide
  
*Un objet de type '''''data frame''''', bien connu sous R, permet de réaliser de nombreuses opérations de filtrage, prétraitements, etc., préalables à la modélisation statistique.
+
<span style="color:green">'''* Site web:'''</span> pandas.pydata.org
 +
 
}}<!-- ******** Fin Fiche Didactique Définition ******************* -->
 
}}<!-- ******** Fin Fiche Didactique Définition ******************* -->
  
Ligne 102 : Ligne 135 :
 
<!-- ****************** Commercez les modifications pour les Vidéos *******************************************************-->
 
<!-- ****************** Commercez les modifications pour les Vidéos *******************************************************-->
  
<youtube width="220" height="220">k0O8-0kPQmM</youtube>
+
<youtube width="220" height="220">ZyhVh-qRZPA</youtube>
<youtube width="220" height="220">iIlCg439eHQ</youtube>
+
<youtube width="220" height="220">IKEm-WQ7gx8&t</youtube>
<youtube width="220" height="220">k0O8-0kPQmM</youtube>
+
<youtube width="220" height="220">3FAy66Sifk0&t</youtube>
 +
<youtube width="220" height="220">IebtoQTKhfU</youtube>
 +
<youtube width="220" height="220">bqVRGUiHg9M&t</youtube>
 +
 
  
 
}}<!-- ************************* Fin modifications pour les Médias *******************************************************-->
 
}}<!-- ************************* Fin modifications pour les Médias *******************************************************-->
Ligne 117 : Ligne 153 :
 
<!----------------- Commencez les modifications des Mots Clés --------------------->
 
<!----------------- Commencez les modifications des Mots Clés --------------------->
  
|Mot-Clé-1=
+
|Mot-Clé-1= Analyse de données
|Mot-Clé-2=
+
|Mot-Clé-2= Langage de programmation
|Mot-Clé-3=
+
|Mot-Clé-3= Python
|Mot-Clé-4=
+
|Mot-Clé-4= Matplotlib
|Mot-Clé-5=
+
|Mot-Clé-5=Nympy
 
|Mot-Clé-6=
 
|Mot-Clé-6=
 
|Mot-Clé-7=
 
|Mot-Clé-7=
Ligne 129 : Ligne 165 :
  
 
}}<!-- ********************* FIN Fiche Didactique Mots-clés *******************-->
 
}}<!-- ********************* FIN Fiche Didactique Mots-clés *******************-->
 
  
 
= {{Widget:Exemples-applications-utilisations-Fiche}} =
 
= {{Widget:Exemples-applications-utilisations-Fiche}} =
Ligne 141 : Ligne 176 :
 
<!-- ****************** Commercez les modifications ***********************  -->
 
<!-- ****************** Commercez les modifications ***********************  -->
  
*...............................................................................
+
 
................................................................................
+
<span style="color:red"><big><U> <p><FONT size="4">'''Manipulation des données avec Pandas'''</p></FONT></U></big></span>
................................................................................
+
 
................................................................................
+
<span style="color:green"><big><FONT size="3">'''Exercice d'application 1:'''</FONT></big></span>
*...............................................................................
+
 
................................................................................
+
[[Fichier:Iim4.png|cadre]]
................................................................................
+
[[Fichier:Im5.png|cadre]]
................................................................................
+
[[Fichier:Im6.png|cadre]]
 +
[[Fichier:Im7.png|cadre]]
 +
[[Fichier:Im8.png|cadre]]
 +
[[Fichier:Im9.png|cadre]]
 +
 
 +
 
 +
 
 +
<span style="color:green"><big><FONT size="3">'''Exercice d'application 2:'''</FONT></big></span>
 +
 
 +
L'exercice consiste à charger un fichier csv à '''Thonny''' et essayer d'ajouter des lignes et des colonnes et de les manipuler.
 +
 
 +
 
 +
[[Fichier:Montantcsv.png|700px|vignette|centré]]
 +
 +
 
 +
 
 +
[[Fichier:Pand.png|700px|vignette|centré]]
 +
 
 +
 
 
}}<!--************** Fin Fiche Didactique Explicitations ******************* -->
 
}}<!--************** Fin Fiche Didactique Explicitations ******************* -->
 
  
 
= {{Widget:Erreurs-confusions-Fiche}} =
 
= {{Widget:Erreurs-confusions-Fiche}} =
Ligne 162 : Ligne 214 :
 
<!-- ****************** Commercez les modifications *************************-->
 
<!-- ****************** Commercez les modifications *************************-->
  
* Confusion entre [[....... - ........]]
+
* '''Confusion entre''' [[la commande tail- commande head]] ''qui permet la première d'afficher les 5 premières lignes de dataframe et l'autre d'afficher les 5 dernières lignes du dataframe''
* Confusion entre [[....... - ........]]
+
* '''Confusion entre''' [[fichier Excel- fichier csv]]
* Erreur fréquente: ....................
+
* '''Erreur fréquente:''' Les élèves trouve toujours le problème de charger le fichier que ce soit de type Excel, txt ou csv.
  
 
}}<!-- ************** Fin Fiche Didactique Conceptions ********************* -->
 
}}<!-- ************** Fin Fiche Didactique Conceptions ********************* -->
Ligne 176 : Ligne 228 :
 
<!-- Compléter les pointillés et Supprimer les lignes non utilisées-->
 
<!-- Compléter les pointillés et Supprimer les lignes non utilisées-->
 
<!-- ************ Commercez les modifications *********************-->
 
<!-- ************ Commercez les modifications *********************-->
 +
{{@}} '''[[{{FULLPAGENAME}} : Questions - Réponses|<span style="color:blue"> {{FULLPAGENAME}} :Regroupement de questions</span>]]'''
 +
* [[Qu’est-ce que Pandas? Quels sont les avantages d’utiliser Pandas?]]
 +
* [[ Définir les pandas / pandas Python?]]
 +
* [[Quelles sont les caractéristiques importantes de la bibliothèque pandas? ]]
 +
* [[Quelles sont les principales fonctionnalités de la bibliothèque pandas? ]]
 +
* [[Mentionner les différents types de structures de données dans Pandas?]]
 +
* [[Définir DataFrame dans Pandas?]]
 +
* [[Comment ajouter un index, une ligne ou une colonne à un Pandas DataFrame?]]
 +
 +
 +
  
* [[..................]]?
 
* [[..................]]?
 
* [[..................]]?
 
  
 
}}<!-- ******** Fin Fiche Didactique Questions ******************* -->
 
}}<!-- ******** Fin Fiche Didactique Questions ******************* -->
Ligne 195 : Ligne 255 :
 
<!-- ****************** Commercez les modifications **************************  -->
 
<!-- ****************** Commercez les modifications **************************  -->
  
* ..................                                               
+
* '''Projet d’analyse des données concernant l’impact de l’utilisation de la technologie sur la vie des élèves '''
:* .................
+
* Collecte des données                                             
* ..................                                               
+
* Analyse des données collectées en utilisant un logiciel de tableur et python plus spécifiquement bibliothéque pandas pour :
:* .................                                               
+
:*lire des données collectées. 
 +
:*supprimer des lignes et des colonnes indésirables. 
 +
:*éliminer des doublons. 
 +
:*analysez les données collectées afin d’obtenir les résultats attendus. 
 +
:*regrouper les données collectées des différents utilisateurs dans un même fichier.
 +
                                           
 +
 
  
 
}}<!-- ************************* Fin Idées-Enseignement ********************** -->
 
}}<!-- ************************* Fin Idées-Enseignement ********************** -->
 
  
 
== {{Widget:Aides et astuces-Fiche}} ==
 
== {{Widget:Aides et astuces-Fiche}} ==
Ligne 211 : Ligne 276 :
 
<!-- Complétez les pointillés et Supprimez les lignes non utilisées          ----->
 
<!-- Complétez les pointillés et Supprimez les lignes non utilisées          ----->
 
<!-- ****************** Commercez les modifications **************************  -->
 
<!-- ****************** Commercez les modifications **************************  -->
 +
<span style="color:blue"><big><U> <p><FONT size="3">'''Voici quelques annexes qui permet d'aides pour l 'enseignement de pandas:'''</FONT></p></U></big></span>
  
* ..................                                                 
+
[[Fichier:Annexe 1.pdf|vignette|centré]]'''</p></FONT></U></big></span>
:* .................
+
 
* ..................                                               
+
[[Fichier:Annexe 2.pdf|vignette|centré]]
:* .................                                               
+
                                                  
 +
[[Fichier:Annexe 3.pdf|vignette|centré]]
 +
 
 +
[[Fichier:Annexe 4.pdf|vignette|centré]]
 +
                                             
  
 
}}<!-- ************************* Fin Astuces-Enseignement ********************** -->
 
}}<!-- ************************* Fin Astuces-Enseignement ********************** -->
Ligne 227 : Ligne 297 :
 
<!-- ****************** Commercez les modifications ************-->
 
<!-- ****************** Commercez les modifications ************-->
  
:* ..................
+
 
:* ..................
+
:* http://www.python-simple.com/python-pandas/panda-intro.php
:* ..................
+
:* https://pandas.pydata.org/pandas-docs
 +
:* https://www.javatpoint.com/python-pandas-interview-questions
 +
:* https://egallic.fr/Enseignement/Python/pandas.html
 +
https://cmapscloud.ihmc.us:443/rid=1WVFZSBFP-JQ4TW2-WHV6LR
 +
 
  
 
}}<!-- ************ Fin Liens Education ********************** -->
 
}}<!-- ************ Fin Liens Education ********************** -->
Ligne 243 : Ligne 317 :
 
<!-- ****************** Commercez les modifications *********************-->
 
<!-- ****************** Commercez les modifications *********************-->
  
* ..................                                               
+
:* https://riptutorial.com/Download/pandas-fr.pdf
* ..................
+
:* https://eric.univ-lyon2.fr/~ricco/tanagra/fichiers/fr_Tanagra_Data_Manipulation_Pandas.pdf
* ..................                                               
+
:* https://www.math.univ-toulouse.fr/~besse/Wikistat/pdf/st-tutor2-python-pandas.pdf                                           
* ..................                                               
 
  
 
}}<!-- ************* Fin Fiche Didactique Bibliographie *************** -->
 
}}<!-- ************* Fin Fiche Didactique Bibliographie *************** -->
  
 
{{Widget:Fiche-Conceptuelle-Bas}}
 
{{Widget:Fiche-Conceptuelle-Bas}}

Version actuelle datée du 12 juin 2021 à 12:24


Autres Fiches Conceptuelles
Posez une Question


(+)

Target Icon.pngVotre Publicité sur le Réseau Target Icon.png

Puce-didaquest.png Traduction


More-didaquest.png Traductions


Puce-didaquest.png Définition

Domaine, Discipline, Thématique


More-didaquest.png Justification


Définition écrite


Informations


* Créateur: Wes McKinney

* Dernière version: 1.2.4 (12 avril 2021)1

* Écrit en: Python

* Système d'exploitation: Multiplateforme

* Type: Bibliothèque logicielle Python (d) ,Numerical software (d)

* Licence: Licence BSD

* Documentation: pandas.pydata.org/docs/user_guide/index.html#user-guide

* Site web: pandas.pydata.org


More-didaquest.png Pandas - Historique (+)


Définition graphique




Puce-didaquest.png Concepts ou notions associés


More-didaquest.png Pandas - Glossaire / (+)



Puce-didaquest.png Exemples, applications, utilisations

Manipulation des données avec Pandas

Exercice d'application 1:

Iim4.png
Im5.png
Im6.png
Im7.png
Im8.png
Im9.png


Exercice d'application 2:

L'exercice consiste à charger un fichier csv à Thonny et essayer d'ajouter des lignes et des colonnes et de les manipuler.


Montantcsv.png


Pand.png

(+)


Puce-didaquest.png Erreurs ou confusions éventuelles



Puce-didaquest.png Questions possibles



Puce-didaquest.png Liaisons enseignements et programmes

Idées ou Réflexions liées à son enseignement



Aides et astuces



Education: Autres liens, sites ou portails




Puce-didaquest.png Bibliographie