Skip to content
Snippets Groups Projects
2.dealing-with-numerical-data.ipynb 38.5 KiB
Newer Older
  • Learn to ignore specific revisions
  •    ]
      },
      {
       "cell_type": "markdown",
       "id": "131aa45d-c4d4-4450-b502-65a2ee52a14e",
       "metadata": {},
       "source": [
        "Dans un modèle, on retrouve une succession de programmes, appelés **estimateurs**, où chaque couche reçoit les données transformées par la précédente. Ainsi, tous les estimateurs à l’exception du dernier sont des **transformateurs**. À la dernière couche se tient le **prédicteur**, l’algorithme avec lequel les données seront entraînées afin d’effectuer des prédictions sur de nouvelles informations :"
       ]
      },
      {
       "cell_type": "code",
       "execution_count": null,
       "id": "1c324391-b172-4054-9bd5-99cfa6c01d91",
       "metadata": {},
       "outputs": [],
       "source": [
        "model = make_pipeline(\n",
        "    # fill the NA values\n",
        "    SimpleImputer(strategy=\"median\"),\n",
        "    # scale data\n",
        "    StandardScaler(),\n",
        "    # a linear regression\n",
        "    LinearRegression()\n",
        ")"
       ]
      },
      {
       "cell_type": "markdown",
       "id": "dc6efe95-dfba-487a-adbf-d0e4c1cc9368",
       "metadata": {},
       "source": [
        "### 4e étape : entraîner le modèle et l’évaluer"
       ]
      },
      {
       "cell_type": "markdown",
       "id": "04d9925c-7e3f-4fe4-b47f-2c3123834e1f",
       "metadata": {},
       "source": [
        "Les méthodes `.fit()` et `.score()` du modèle servent à réaliser les deux actions. Il convient de transmettre à la première les jeux d’entraînement constitués à partir des caractéristiques (`X_train`) et à partir de la variable cible (`y_train`) ; et à la seconde les jeux de test correspondants (`X_test` et `y_test`) :"
       ]
      },
      {
       "cell_type": "code",
       "execution_count": null,
       "id": "143c07e4-ba51-44f9-ab83-d70987d991e6",
       "metadata": {},
       "outputs": [],
       "source": [
        "# train…\n",
        "model.fit(X_train, y_train)\n",
        "\n",
        "# … then evaluate!\n",
        "model.score(X_test, y_test)"
       ]
      }
     ],
     "metadata": {
      "kernelspec": {
       "display_name": "Python 3 (ipykernel)",
       "language": "python",
       "name": "python3"
      },
      "language_info": {
       "codemirror_mode": {
        "name": "ipython",
        "version": 3
       },
       "file_extension": ".py",
       "mimetype": "text/x-python",
       "name": "python",
       "nbconvert_exporter": "python",
       "pygments_lexer": "ipython3",
       "version": "3.10.6"
      }
     },
     "nbformat": 4,
     "nbformat_minor": 5
    }