diff --git a/notebooks/data-vizualisation/seaborn.ipynb b/notebooks/data-vizualisation/seaborn.ipynb index f4408eb6de2599c6a35f5f8b1c8bb7f28954ed15..c292a1283a09ed3f4c5d78d3461d3f892d7bad05 100644 --- a/notebooks/data-vizualisation/seaborn.ipynb +++ b/notebooks/data-vizualisation/seaborn.ipynb @@ -84,13 +84,15 @@ "outputs": [], "source": [ "# figure size, title and axe labels thanks to matplolib\n", - "plt.figure(figsize=(16,4))\n", + "plt.figure(figsize=(10,5))\n", "plt.title(\"Relation between culmen length and depth\")\n", "plt.xlabel(\"Culmen length (mm)\")\n", "plt.ylabel(\"Culmen depth (mm)\")\n", "\n", "# draw the plot with seaborn\n", - "sns.scatterplot(data=df, x=\"bill_length_mm\", y=\"bill_depth_mm\", color=\"orange\")\n", + "sns.scatterplot(data=df, x=\"bill_length_mm\", y=\"bill_depth_mm\",\n", + " palette=\"deep\", hue=\"species\", style=\"sex\")\n", + "\n", "# remove the spines (top and right by default)\n", "sns.despine()\n", "\n", @@ -105,7 +107,16 @@ "source": [ "Les méthodes de *Seaborn* pour tracer des diagrammes suivent le même souci de cohérence. Elles acceptent un paramètre essentiel `data` dans lequel il faut passer les données puis, éventuellement, des paramètres `x` et `y` pour pointer quelles variables placer sur quel axe. Un quatrième paramètre `hue` détermine quelle colonne utiliser pour mettre en évidence les points de la représentation.\n", "\n", - "Il est également possible de sélectionner une couleur précise avec le parmètre `color` ou encore indiquer à *Seaborn* une palette sur laquelle se fonder avec `palette`." + "Il est également possible de sélectionner une couleur précise avec le parmètre `color` ou encore indiquer à *Seaborn* une palette sur laquelle se fonder avec `palette`.\n", + "\n", + "Syntaxe générique d’une méthode pour afficher un diagramme :\n", + "\n", + "```python\n", + "_ = sns.method(data=data_frame, x=\"column_x-axe\", y=\"column_y-axe\",\n", + " hue=\"column_to_distinguish_data\")\n", + "```\n", + "\n", + "**Rappel :** la variable `_` est dite jetable (*throw away variable*)." ] }, { @@ -185,14 +196,8 @@ "id": "c42e4953-0d7f-4a83-ba8a-e999187761a6", "metadata": {}, "source": [ - "Sans doute les plus utilisés pour représenter la répartition des effectifs d’une variable. Ils s’emploient sur des variables qualitatives ou sur des quantitatives discrètes." - ] - }, - { - "cell_type": "markdown", - "id": "f0ced657-8e00-4f48-9d03-28c4fce4af98", - "metadata": {}, - "source": [ + "Sans doute les plus utilisés pour représenter la répartition des effectifs d’une variable. Ils s’emploient sur des variables qualitatives ou sur des quantitatives discrètes.\n", + "\n", "La méthode `.countplot()` permet d’afficher le dénombrement des effectifs d’une variable :" ] }, @@ -313,7 +318,7 @@ "metadata": {}, "outputs": [], "source": [ - "_ = sns.lineplot(data=df, x=\"bill_length_mm\", y=\"flipper_length_mm\", hue=\"species\")" + "_ = sns.lineplot(data=df, x=\"bill_length_mm\", y=\"flipper_length_mm\")" ] }, {