Newer
Older
1001
1002
1003
1004
1005
1006
1007
1008
1009
1010
1011
1012
1013
1014
1015
1016
1017
1018
1019
1020
1021
1022
1023
1024
1025
1026
1027
1028
1029
1030
1031
1032
1033
1034
1035
1036
1037
1038
1039
1040
1041
1042
1043
1044
1045
1046
1047
1048
1049
1050
1051
1052
1053
1054
1055
1056
1057
1058
1059
1060
1061
1062
1063
1064
1065
1066
1067
1068
1069
1070
1071
1072
1073
1074
1075
1076
1077
1078
1079
1080
]
},
{
"cell_type": "markdown",
"id": "131aa45d-c4d4-4450-b502-65a2ee52a14e",
"metadata": {},
"source": [
"Dans un modèle, on retrouve une succession de programmes, appelés **estimateurs**, où chaque couche reçoit les données transformées par la précédente. Ainsi, tous les estimateurs à l’exception du dernier sont des **transformateurs**. À la dernière couche se tient le **prédicteur**, l’algorithme avec lequel les données seront entraînées afin d’effectuer des prédictions sur de nouvelles informations :"
]
},
{
"cell_type": "code",
"execution_count": null,
"id": "1c324391-b172-4054-9bd5-99cfa6c01d91",
"metadata": {},
"outputs": [],
"source": [
"model = make_pipeline(\n",
" # fill the NA values\n",
" SimpleImputer(strategy=\"median\"),\n",
" # scale data\n",
" StandardScaler(),\n",
" # a linear regression\n",
" LinearRegression()\n",
")"
]
},
{
"cell_type": "markdown",
"id": "dc6efe95-dfba-487a-adbf-d0e4c1cc9368",
"metadata": {},
"source": [
"### 4e étape : entraîner le modèle et l’évaluer"
]
},
{
"cell_type": "markdown",
"id": "04d9925c-7e3f-4fe4-b47f-2c3123834e1f",
"metadata": {},
"source": [
"Les méthodes `.fit()` et `.score()` du modèle servent à réaliser les deux actions. Il convient de transmettre à la première les jeux d’entraînement constitués à partir des caractéristiques (`X_train`) et à partir de la variable cible (`y_train`) ; et à la seconde les jeux de test correspondants (`X_test` et `y_test`) :"
]
},
{
"cell_type": "code",
"execution_count": null,
"id": "143c07e4-ba51-44f9-ab83-d70987d991e6",
"metadata": {},
"outputs": [],
"source": [
"# train…\n",
"model.fit(X_train, y_train)\n",
"\n",
"# … then evaluate!\n",
"model.score(X_test, y_test)"
]
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3 (ipykernel)",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.10.6"
}
},
"nbformat": 4,
"nbformat_minor": 5
}