ACT6100 A2020 Sup 12
ACT6100 A2020 Sup 12
ACT6100 A2020 Sup 12
Arthur Charpentier
automne 2020
https://github.com/freakonometrics/ACT6100/
m
X
P[Y = 1|X = x] = P[Y = 1|X = x, T = t] P[T = t|X = x]
| {z }| {z }
t=1 ωt
yb(t)
idea of slacking
or
ybi = median ybitree , ybiglm , ybisvm
1 − r (x) 2
Var fbag (x) = r (x)σ 2 (x) +
σ (x)
B
La variable sera d’autant plus faible que l’on aggrège des modèles
différents.
L’instabilité des arbres en fait de bons candidats pour de
l’aggrégation
I erreur out-of-bag
/ Dnb ,
Soit Bi ⊂ {1, 2, · · · , B} l’ensemble des arbres tels que i ∈
1 Xb
ybi = fb (x i )
|Bi |
b∈Bi
et on définie
B
1 X boob
Rb (j) − Rbboob
importancej =
B
b=1
or with m = 10, or m = 2
here, AUC is
1 > pROC :: auc ( roc_test )
2 Area under the curve : 0.7783