1 Notions de base de la mortalité

Cette première note vise à introduire les notions élémentaires intervenant dans la modélisation du risque mortalité. Elle s’adresse à un public maîtrisant certains concepts en statistiques et théorie des probabilités (fonction de répartition, densité de probabilité) mais ne demande pas de connaissances spécifiques sur le risque mortalité.

La mortalité sera d’abord introduite sous l’angle des processus multi-états. Les concepts de durée de vie résiduelle, de fonction de survie conditionnelle, de densité conditionnelle associée et de force de mortalité seront ensuite présentés. Enfin, le lien avec les notations communément utilisées dans le monde de l’Actuariat sera établi.

1.1 Vision processus du risque mortalité

Pour caractériser la mortalité, il est possible de s’appuyer sur un modèle contenant 2 états : vivant et décédé, notés respectivement \(V\) et \(D\) et représentés sur la Figure 1.1.

Figure 1.1 : Le processus de Vie et de Mort

Pour décrire les caractéristiques d’un individu sont introduits deux processus :

\(Z = (Z_u)_{u\geq 0}\) représente l’état de l’individu à l’instant \(u\) : \(Z_u \in \{V,D\}\). \(Z\) est également désigné sous le nom de processus de vie et de mort.
\(X = (X_u)_{u\geq 0}\) représente ses autres caractéristiques à l’instant \(u\). Celles-ci sont supposées appartenir à l’une des deux catégories suivantes :
- Les échelles de temps. Il s’agit par exemple de l’âge (temps écoulé depuis la naissance), du temps au sens calendaire, ou de l’ancienneté dans le portefeuille (temps écoulé depuis la souscription) pour les portefeuilles d’assurance. Ces variables mesurent toutes le temps et diffèrent uniquement par l’origine du référentiel adopté. Elles évolueront donc parallèlement. Ainsi si l’on note \(T\) le vecteur de caractéristiques correspondant à ces variables à l’instant \(s\), alors à l’instant \(s + t\) les nouvelles caractéristiques vaudront \(T + t\).
- Les variables discrètes, dont la valeur est constante dans le temps. Il s’agit par exemple du sexe, du pays de résidence pour des données internationales ou encore du statut fumeur / non fumeur. Le vecteur de ces caractéristiques est noté \(C\).

Si un individu possède les caractéristiques \(\chi = (T,C)\) à l’instant \(s\), à l’instant \(s + t\) celles-ci seront donc \((T + t,C)\) qui sera très abusivement noté \(\chi + t\) par la suite.

Ce cadre théorique exclut les variables dont l’état peut changer de manière aléatoire au cours du temps comme par exemple l’apparition d’états de santé dégradés (incapacité, dépendance). Celles-ci pourront néanmoins être modélisées en tant qu’états d’un modèle multi-états plus complexe que celui de de la Figure 1.1.

Dans le cadre introduit, modéliser la mortalité revient à caractériser le comportement futur du processus aléatoire \(Z\) connaissant les caractéristiques \((Z_s, X_s)\) à un instant \(s\) donné. Plusieurs notions vont maintenant être introduites dans ce but.

Durée de vie résiduelle

Dans le modèle multi-états, on souhaite caractériser, conditionnellement aux caractéristiques initiales de l’individu, le temps de séjour dans l’état vivant. Celui-ci est désignée sous le nom de durée de vie résiduelle. L’adjectif résiduelle indique que l’instant de départ ne correspond pas forcément à l’instant de naissance de l’individu. Formellement, on définit la durée de vie résiduelle par \(T_\chi(s) = \min\{u \ge 0, Z_{s + u} = D | Z_s = V, X_s = \chi\}\).

Dans le cadre introduit, les caractéristiques de l’individu dépendant du temps et ayant un impact sur la mortalité sont prises en compte à travers \(\chi\). On suppose alors sans perte de généralité que le processus \((Z_s,X_s)_{s \ge 0}\) est homogène. Si l’état \((Z_s,X_s)\) du processus à un instant \(s\) donné est connu, l’état futur du processus ne dépend pas de \(s\). Sous ces conditions, la durée de vie résiduelle non plus et on la notera plus simplement \(T_\chi\).

Les notations des processus multi-états sont très générales mais parfois assez lourdes. La durée de vie résiduelle \(T_\chi\) permettra d’introduire plus simplement les autres quantités caractérisant le risque de mortalité.

1.2 Fonction de survie conditionnelle

La durée de vie résiduelle, en tant que variable aléatoire, est caractérisée par sa fonction de répartition \(F_\chi(t) = \mathbb{P}(T_\chi < t)\) pour \(t \ge 0\). La fonction de survie conditionnelle est définie comme le complémentaire de cette quantité : \(S_\chi(t) = \mathbb{P}(T_\chi \ge t) = 1 - F_\chi(t)\). On a \(S_\chi(0) = 1\) et \(S_\chi(t) \overset{t \rightarrow \infty}{\longrightarrow} 0\).

La fonction de survie conditionnelle \(S_\chi(t)\) représente pour \(t \ge 0\) la probabilité pour un individu vivant et ayant les caractéristiques \(\chi\) à un instant donné d’être toujours en vie après une durée \(t\).

Illustration

Pour illustrer le concept de fonction de survie conditionnelle, on se base sur les données nationales de mortalité françaises pour l’année 2019. La mortalité est ici considérée comme une fonction de l’âge, noté \(x\), et du sexe, noté \(g\). Le vecteur de caractéristiques associé est ainsi noté \(\chi = (x,g)\). La fonction de survie conditionnelle à la naissance par sexe \(S_{x = 0,\ g}\) est représentée sur la Figure 1.2. L’intersection de la courbe de survie avec les lignes horizontales de niveau 75 %, 50 % et 25 % permet de déterminer graphiquement les quartiles de la distribution de l’âge au décès au sein de la population. On observe ainsi que :

L’âge médian au décès est de 81,9 ans pour les hommes et 87,4 ans pour les femmes, soit un écart légèrement supérieur à 5 ans en faveur des femmes.
Les trois quarts des décès surviennent après 71,5 ans pour les hommes et 79,8 ans pour les femmes. La dispersion des décès dans le premier quartile est donc plus importante chez les hommes, pour lesquels les décès aux âges jeunes sont plus fréquents. Cela est lié à différents facteurs et notamment au tabagisme, plus répandu chez les hommes dans les générations étudiées dans cet exemple.

Figure 1.2 : Fonction de survie à la naissance avec quartiles associés, sur la base des données de mortalité française pour l’année 2019

1.3 Densité de probabilité de la durée de vie résiduelle

Il est également possible d’introduire la densité associée à la durée de vie résiduelle :

\[f_\chi(t) = \frac{1}{h} \underset{h \rightarrow 0}{\lim} \mathbb{P}(t \le T_\chi < t + h) = \frac{\text{d}}{\text{d}t}F_\chi(t) = - \frac{\text{d}}{\text{d}t}S_\chi(t).\]

Par définition \(\int_{u = 0}^{\infty} f_\chi(u)\text{d}u = 1\). La fonction de survie conditionnelle peut aussi être exprimée directement à partir de la densité de probabilité : \(S_\chi(t) = 1 - \int_{u = 0}^{t} f_\chi(u)\text{d}u = \int_{u = t}^{\infty} f_\chi(u)\text{d}u\).

La densité de probabilité \(f_\chi(t)\) associée à la durée de vie résiduelle représente ainsi le poids associé à chaque instant \(t\) dans la distribution des décès pour une population constituée d’individus présentant les caractéristiques initiales \(\chi\).

Illustration

La Figure 1.3 représente sur la base des données précédentes la densité \(f_{x = 0,\ g}\) associée à la durée de vie \(T_{x = 0,\ g}\) à la naissance. Sont également ajoutés à cette figure les quartiles calculés précédemment ainsi que l’âge modal au décès qui correspond à l’âge pour lequel la densité de probabilité est maximale. Il s’agit donc de l’âge de décès le plus probable. En plus de disposer d’une interprétation très naturelle, cet indicateur est pour de nombreux démographes plus représentatif de la distribution des âges aux décès que l’âge médian au décès. Les observations suivantes peuvent être formulées :

L’âge modal au décès, qui est de 88 ans pour les hommes et 91 ans pour les femmes, est supérieur à l’âge médian de décès pour les deux sexes. Les décès sont ainsi plus concentrés aux âges élevés qu’aux âges jeunes.
La densité associée à l’âge modal est de 3,6 % pour les hommes et un peu plus de 4,5 % pour les femmes soit des décès plus concentrés chez les femmes.

Figure 1.3 : Densité de la durée de vie à la naissance sur la base des données de mortalité française en 2019, avec âge modal

1.4 Force de mortalité

La densité de probabilité \(f_\chi(t)\) introduite précédemment peut s’interpréter comme l’équivalent en temps continu d’une probabilité de décès au point \(\chi + t\). Cependant, elle s’exprime en proportion d’un effectif initial à l’instant de départ \(\chi\) et dépend donc de la probabilité de décès entre \(\chi\) et \(\chi + t\). Il ne s’agit donc pas réellement d’une notion locale.

La force de mortalité est définie par :

\[\mu_\chi = \frac{1}{h} \underset{h \rightarrow 0}{\lim} \mathbb{P}(T_\chi < h) = f_\chi(0)\] Celle-ci traduit l’intensité du phénomène de mortalité au voisinage de \(\chi\). Il s’agit de la probabilité de décès dans un petit intervalle de temps rapportée à la longueur de cet intervalle. C’est pourquoi cette dernière est également désignée sous le nom d’intensité de décès ou de probabilité instantanée de décès.

Il est possible d’écrire

\[\begin{aligned} f_\chi(t) & = \frac{1}{h} \underset{h \rightarrow 0}{\lim} \mathbb{P}(t \le T_\chi < t + h) \\ & = \frac{1}{h} \underset{h \rightarrow 0}{\lim} \mathbb{P}(T_\chi \ge t) \mathbb{P}(t \le T_\chi < t + h | T_\chi \ge t) \\ & = \mathbb{P}(T_\chi \ge t) \frac{1}{h} \underset{h \rightarrow 0}{\lim} \mathbb{P}(T_{\chi + t} < h) \\ & = S_\chi(t) \mu_{\chi + t}. \end{aligned}\]

Un remaniement de cette formule donne :

\[\mu_{\chi + t} = \frac{f_\chi(t)}{S_\chi(t)} = - \frac{1}{S_\chi(t)} \frac{\text{d}}{\text{d}t}S_\chi(t) = - \frac{\text{d}}{\text{d}t}\ln S_\chi(t).\]

Intégrer cette relation permet d’obtenir une nouvelle expression de la fonction de survie conditionnelle \(S_\chi(t)\), exprimée à partir de la force de mortalité intégrée entre \(\chi\) et \(\chi + t\) :

\[S_\chi(t) = \exp\left(- \int_{u = 0}^{t} \mu_{\chi + u}\ \text{d}u\right).\]

La force de mortalité \(\mu_\chi\) permet de décrire localement l’intensité de mortalité pour un vecteur de caractéristiques \(\chi\) donné. Il s’agit ainsi de l’indicateur par excellence pour étudier l’impact des variables explicatives comme l’âge, l’année calendaire ou le sexe sur la mortalité.

Illustration

Toujours sur la base des données de mortalité française pour l’année 2019, la Figure 1.4 représente la force de mortalité \(\mu_{(x,g)}\) en fonction de l’âge et du sexe. Un lissage à été appliqué pour atténuer les fluctuations d’échantillonnage présentes notamment au cours de l’enfance ou aux âges centenaires, où le nombre de décès observé est très faible. Cette courbe présente une forme caractéristique, commune à de nombreux pays occidentaux. Différents phénomènes peuvent être observés :

La mortalité au cours de la première année de vie présente un niveau de l’ordre de 0,4 %, très élevé comparé au reste de l’enfance pour lequel il est globalement inférieur à 0,01 %, soit 40 fois plus faible.
A partir de l’adolescence et tout au long de la vie, la mortalité croît de manière exponentielle avec l’âge, ce qui se traduit par une tendance linéaire sur l’échelle logarithmique de la Figure 1.4.
Autour de 20 ans, la mortalité présente une déviation du comportement exponentiel, et une surmortalité appelée bosse des accidents qui est liée aux comportements à risques.

Figure 1.4 : Mortalité française observée et lissée pour l’année 2019; les points correspondent aux observations brutes et les lignes aux valeurs lissées

La Figure 1.5 représente le ratio entre la force de mortalité des femmes et celle des hommes en fonction de l’âge. Celui-ci oscille autour de 50 % entre 20 et 80 ans avec un niveau inférieur à 40 % pour la tranche d’âge 20-30 ans, ce qui montre que les comportements à risques sont plus marqués chez les hommes. Aux âges les plus jeunes ou les plus élevés, ce ratio se rapproche de la parité et dépasse ainsi les 80 % à 0 et 100 ans.

Figure 1.5 : Ratio entre les forces de mortalité des femmes et des hommes sur la base des données de mortalité française pour l’année 2019

Bien que la courbe de mortalité ait été longuement étudiée par les démographes, certaines questions demeurent ouvertes :

Comment expliquer la différence de mortalité entre les deux sexes ? Celle-ci n’a pas toujours existé, en témoignent les données de mortalité pour la France au début du 19ème siècle qui montrent un niveau de mortalité quasi-identique pour les deux sexes. Les démographes et biologistes avancent des raisons comportementales et génétiques.
La mortalité admet-elle une valeur limite aux grands âges ? La question fait l’objet de débats féroces au sein de la communauté des démographes. Certains postulent l’existence d’une telle limite pour la force de mortalité aux grands âges quand d’autres penchent en faveur d’une augmentation ininterrompue de cette quantité.

1.5 Lien avec les notations Actuarielles

Les quantités introduites précédemment représentent des fonctions en temps continu définies pour tout couple \((\chi,t)\) tel que \(t \ge 0\). Les actuaires leur préféreront généralement l’utilisation de quantités à pas de temps discret annuel, plus tangibles.

Nombre de survivants d’une cohorte

Plutôt que d’utiliser la fonction de survie conditionnelle \(S_\chi(t)\) les actuaires se réfèrent au nombre de survivants \(L_{\chi_0 + t}\) d’une cohorte fictive après \(t\) années pour \(t \in \mathbb{N}\). Cette cohorte est supposée initialement constituée d’un effectif \(L_{\chi_0}\). La valeur \(100\ 000\) est souvent retenue pour \(L_{\chi_0}\). Le lien avec la fonction de survie est immédiat. En effet, pour tout \(t \in \mathbb{N}\), \(L_{\chi_0 + t} = S_{\chi_0}(t) L_{\chi_0}\). La probabilité de survie \(S_{\chi_0}(t)\) et le nombre de survivants \(L_{\chi_0 + t}\) sont ainsi égaux pour tout \(t \in \mathbb{N}\) à un coefficient multiplicatif \(L_{\chi_0}\) près.

Les tables de mortalité sont traditionnellement exprimées à partir des effectifs \(L_{\chi_0 + t}\) pour \(t \in \mathbb{N}\). Cela revient à utiliser la fonction de survie \(S_{\chi_0}(t)\) et suffit à caractériser entièrement l’évolution du processus de mortalité entre des instants \(\chi_0 + t\) discrets.

Probabilité de décès conditionnelle à un an

Les actuaires notent \(_tq_\chi = \mathbb{P}(0 \le T_\chi < t) = F_\chi(t)\) la probabilité conditionnelle de décès à \(t\) années, qui n’est autre que la fonction de répartition de la durée de vie résiduelle. Lorsque \(t = 1\), cet indice est omis et l’on note \(q_\chi = F_\chi(1)\) la probabilité conditionnelle de décès à un an.

Les probabilités conditionnelles de décès à un an \(q_\chi\) sont parfois substituées aux effectifs \(L_{\chi_0 + t}\) pour définir une table de mortalité. En effet, en notant \(\chi = \chi_0 + t\), on a \(q_\chi = \frac{L_\chi - L_{\chi + 1}}{L_\chi}\) et réciproquement \(L_{\chi + 1} = (1 - q_\chi) L_\chi\). On peut donc passer des \(L_\chi\) aux \(q_\chi\) et la réciproque est vraie si l’on connaît l’effectif \(L_{\chi_0}\) initial.

La probabilité conditionnelle de décès à un an est liée à la force de mortalité par la relation :

\[q_\chi = F_\chi(1) = 1 - S_\chi(1) = 1 - \exp\left(\int_{u = 0}^1 \mu_{\chi + u}\ \text{d}u\right).\] On sera généralement amené à faire l’hypothèse que la force de mortalité est constante par morceaux sur des intervalles d’un an entre deux âges entiers. Plus formellement, si l’on note \(\chi = (T, C)\) tel que \(T \in \mathbb{N}^{\ n_T}\) où \(n_T\) correspond au nombre d’échelles de temps utilisées, alors on suppose que \(\mu_{\chi + \xi} = \mu_\chi\) pour tout \(0\le \xi < 1\). Sous cette hypothèse la relation précédente se simplifie en \(q_\chi = 1 - \exp(- \mu_\chi)\).

Un développement limité de cette expression au voisinage de 0 donne \(q_\chi \simeq \mu_\chi + o(\mu_\chi)\). Ainsi pour des petites valeurs de \(\mu_\chi\) (et donc de \(q_\chi\)), la force de mortalité et la probabilité conditionnelle de décès à un an sont équivalentes.

Ce développement limité n’est cependant plus du tout valable pour les grandes valeurs de \(\mu_x\). En effet \(\mu_x\) peut prendre des valeurs arbitrairement grandes tandis que \(q_\chi\) en tant que probabilité demeure inférieure à 1. Il est donc important de ne pas confondre ces deux quantités notamment aux grands âges.

1.6 Place des différentes quantités dans les modèles

La fonction de survie conditionnelle, la densité de probabilité associée à la durée de vie résiduelle et la force de mortalité sont trois quantités en temps continu dont chacune suffit à décrire entièrement le processus de mortalité. Il est donc possible de spécifier un modèle de mortalité en décrivant le comportement de l’une d’entre elles puis de retrouver toutes les autres par le calcul, sous une forme explicite ou non. La Table 1.1 récapitule les principales formules pour passer d’une quantité à une autre, les éléments diagonaux correspondant à la définition de chaque quantité à partir de la durée de vie résiduelle \(T_\chi\).

Table 1.1 : Lien entre les différentes notions de mortalité
	\(S_\chi(t)\)	\(f_\chi(t)\)	\(\mu_\chi\)
\(S_\chi(t)\)	\(S_\chi(t) = \mathbb{P}(T_\chi \ge t)\)	\(S_\chi(t) = \int_{u = t}^{\infty} f_\chi(u)\text{d}u\)	\(S_\chi(t) = \exp\left(- \int_{u = 0}^{t} \mu_{\chi + u}\ \text{d}u\right)\)
\(f_\chi(t)\)	\(f_\chi(t) = - \frac{\text{d}}{\text{d}t}S_\chi(t)\)	\(f_\chi(t) = \frac{1}{h} \underset{h \rightarrow 0}{\lim} \mathbb{P}(t \le T_\chi \lt t + h)\)	\(f_\chi(t) = \mu_{\chi + t}\ S_\chi(t)\)
\(\mu_\chi\)	\(\mu_{\chi + t} = - \frac{\text{d}}{\text{d}t}\ln S_\chi(0)\)	\(\mu_\chi = f_\chi(0)\)	\(\mu_\chi = \frac{1}{h} \underset{h \rightarrow 0}{\lim} \mathbb{P}(T_\chi \lt h)\)

Le nombre de survivants d’une cohorte ainsi que la probabilité conditionnelle de décès à 1 an, notations actuarielles, décrivent également l’évolution du processus entre des instants discrets et annuels. La Table 1.2 rappelle à travers ses éléments diagonaux la définition de ces quantités et reprend les formules permettant de passer de l’une à l’autre.

Table 1.2 : Lien entre les différentes notations actuarielles
	\(L_\chi\)	\(q_\chi\)
\(L_\chi\)	\(L_{\chi} = \mathbb{P}(T_{\chi_0} \geq \chi - \chi_0) L_{\chi_0}\)	\(L_{\chi} = \left[\prod_{k = 0}^{\chi - \chi_0 - 1} (1 - q_{\chi + k})\right] L_{\chi_0}\)
\(q_\chi\)	\(q_{\chi} = \frac{L_{\chi} - L_{\chi + 1}}{L_{\chi}}\)	\(q_\chi = \mathbb{P}(T_\chi \lt 1)\)

L’utilisation des différentes quantités introduites dans les modèles peut être illustrée par les exemples suivants :

L’estimateur de Kaplan-Meier propose une estimation non-paramétrique (\(i.e.\) sans hypothèse a priori sur la forme) de la fonction de survie conditionnelle.
Le modèle de Gompertz, l’un des plus anciens et des plus simples modèles de mortalité, postule une croissance exponentielle de la force de mortalité avec l’âge.
Le modèle de Cairns-Blake-Dowd, proposé pour projeter l’évolution de la mortalité dans le futur, considère un modèle linéaire généralisé basé sur une transformation logit de la probabilité conditionnelle de décès à un an.

La notion d’espérance de vie n’a pas été traitée ici en raison de sa complexité, bien qu’il s’agisse d’un indicateur de référence pour la mortalité. Que le lecteur se rassure, une future publication #LinkMath lui sera intégralement consacrée.

La force de mortalité, la fonction de survie conditionnelle et la densité de probabilité associée à la durée de vie résiduelle permettent de représenter le phénomène de mortalité sous plusieurs angles différents et complémentaires. Quel que soit le modèle utilisé, il sera toujours intéressant d’illustrer les résultats en représentant graphiquement chacune de ces trois quantités.

A partir de ces trois notions, les quantités utilisées dans le monde de l’Actuariat, à savoir le nombre de survivants d’une cohorte et la probabilité conditionnelle de décès à 1 an peuvent s’exprimer très simplement.