Quelques astuces simples mais indispensables que vous ne connaissiez probablement gui?re
Correctement que le possible le plus aise de coder une table de frequences pour 1 objet Series dans la bibliotheque Python pandas consiste a appliquer la value_counts() technique, le resultat de une telle operation parai®t plutot basique. Nous pouvons le rendre plus informatif en ajustant des parametres booleens en technique normalize , sort , ascending , et dropna , ou en regroupant des valeurs (si elles seront numeriques) dans des bacs. Cependant, les options ici seront assez limitees, donc pour ameliorer visuellement la table de frequences resultante, nous pouvons envisager certains astuces simples mais indispensables, telles que le chainage de methodes, la personnalisation du propos, l’ajout du % symbole a chaque valeur de frequence et l’utilisation https://www.besthookupwebsites.org/fr/localmilfselfies-review en puissance de jolie- impression.
Dans Ce texte, nous allons experimenter un ensemble de donnees Kaggle contenant des informations sur l’age, le sexe, l’emplacement, l’education, etc., Afin de 60 000 utilisateurs de l’ application de rencontres OkCupid ??. Pour nos besoins, cependant, nous n’utiliserons que des donnees i propos des statuts des utilisateurs.
1. Enchainement des methodes
Pour commencer, creons un tableau de frequence de base Afin de les statuts des utilisateurs :
( Note : ci-apres, nous allons laisser l’ensemble des autres parametres une value_counts() methode par defaut, cela signifie que nous ne considererons que les tableaux de frequences tries par ordre decroissant et en excluant les valeurs manquantes. Pour les besoins, se servir de ou non ces parametres ne quel que soit.)
Sans connaitre le contexte, a partir du tableau ci-dessus, il est en mesure de ne pas etre net que nos nombres constituent des pourcentages et non des frequences absolues. Ajoutons votre titre au tableau avec le formatage f-string :
Dans l’exemple ci-dessus, nous avons ajoute le % symbole au titre du tableau. Et si nous voulions plutot l’ajouter a chaque valeur de frequence ? Une option de contournement consiste a creer une liste de valeurs de frequence avec le % symbole ajoute a chacune d’entre elles, et a creer une serie a partir de cette liste. Pour faire la liste, nous pouvons utiliser la boucle for suivante :
Enfin, nous pouvons joliment imprimer le tableau des frequences. Pour cela, nous allons utiliser la to_markdown() technique pandas qui necessite l’installation (pas forcement l’import) du module tabulate ( pip install tabulate ).
Important : Afin de afficher convenablement les resultats, la to_markdown() technique doit etre utilisee uniquement a l’interieur en print() commande.
Montrons a nouveau la table de frequence d’etat de l’utilisateur appelee s_with_pct_symb , cette fois comme une vraie table, avec la syntaxe de base de to_markdown() . Comme precedemment, nous allons ajouter votre titre en fourchus et appliquer le formatage f-string. Par souci de coherence, nous affecterons ci-apres J’ai table de frequence a afficher a une variable appelee S ” :
Jouons au milieu des parametres tablefmt et stralign . Le premier d’entre eux definit le format du tableau et pourra avoir l’une des valeurs suivantes : plain , simple , github , grid , fancy_grid , pipe , orgtbl , jira , presto , pretty , psql , rst , etc. Prenons un exemple, le format de tableau que nous avons surpris plus haut s’appelle pipe , celui avec defaut pour les to_markdown() pandas methode. Curieux que pour le package tabulate lui-meme, le format de tableau avec defaut reste simple . Quant au deuxieme parametre, stralign , il sert a remplacer l’alignement des precisions de chaine via defaut (qui est left ). Les laternatives possibles ici sont right et center .
Attention : le floatfmt parametre ne fonctionne nullement en combinaison avec le format du tableau pretty .
Plats a emporter pratiques
Bien que tous J’ai procedure gui?re a jamais ci-dessus ait necessite de nombreuses iterations et descriptions, nous trouverons ci-dessous les solutions de code finales pour 4 versions differentes de notre tableau des frequences Afin de profiles[‘status’] , l’article en % :
- 2 tableaux simples avec/sans le % symbole,
- 2 jolis tableaux imprimes avec/sans le % symbole et avec/sans en-tete de tableau.
Dans cet article, nous avons discute de divers approches simples mais puissantes pour ameliorer la disposition du tableau des frequences et la lisibilite globale. Ils ont l’ensemble de ma value_counts() methode des pandas comme accessoire central, mais tous vont au-dela et aboutissent a des representations plus percutantes. De surcroi®t, chacune des solutions presentees, dans sa forme definitive, necessite au maximum 3 lignes de code.
J’espere que vous avez apprecie la lecture du article et que vous l’avez trouve utile. Merci d’avoir lu a tout un chacun, ainsi, bonne chance a ceux qui utilisent l’application de rencontres OkCupid ????
Vous pourrez tomber sur attractif aussi ces articles :