4  Evolution de la mortalité

Cette note propose une description statistique des grandes tendances d’évolution de la mortalité en France au cours des dernières décennies. Dédiée à un large public, elle se concentre sur la mise en évidence des différents phénomènes et laisse de côté certains aspects de modélisation.

Dans un premier temps, différentes manières de représenter l’évolution de la mortalité dans le temps seront introduites. La notion d’améliorations de mortalité sera ensuite définie et la difficulté de mesurer celles-ci à partir des données disponibles sans recourir à une modélisation statistique sera montrée. Enfin, les différents effets permettant d’expliquer l’évolution de la mortalité seront ensuite expliqués, du plus évident au plus subtil, en s’attachant à chaque fois à justifier la nécessité de leur prise en compte dans le modèle.

4.1 Représenter l’évolution

Afin de mieux comprendre la mortalité de populations d’assurés spécifiques, il est souhaitable d’étudier la mortalité associée à la population française dans son ensemble. Les données permettant de le faire, présentées dans la dernière partie de la note LinkMath #3, sont disponibles sur le site de la Human Mortality Database.

Rappelons que ces données contiennent, pour chaque combinaison des caractéristiques \(\chi = (x,y,s)\) correspondant respectivement à l’âge, à l’année calendaire, et au sexe le nombre de décès observés \(d_{x,y,s}\) ainsi que l’exposition centrale au risque \(e^c_{x,y,s}\) associée. Cette dernière quantité s’interprète comme la somme sur l’ensemble du portefeuille des durées d’observations, exprimées en années, associées aux individus de sexe \(s\) possédant un âge compris entre \(x\) et \(x + 1\), et ce au cours de l’année \(y\).

4.1.1 Nombre de décès

Le nombre total de décès observé chaque année, tous âges et sexes confondus, constitue l’indicateur le plus simple pour visualiser l’évolution de la mortalité. Représenté sur la Figure 4.1, il est globalement décroissant, de même que sa volatilité d’une année sur l’autre. Trois pics de décès se détachent, correspondant aux évènements suivants :

  • La guerre franco-prussienne de 1870 suivie de l’épisode de la commune de Paris en 1871. Cette dernière année est ainsi la plus meurtrière de toute l’histoire moderne, en raison d’une part des affrontements mais surtout de la famine et des maladies infectieuses qui ont suivi ce conflit.

  • La première guerre mondiale de 1914 à 1918, cette dernière année étant également marquée par l’arrivée de la pandémie de grippe espagnole.

  • La seconde guerre mondiale de 1939 à 1945, les années 1940 et 1944 ayant été les plus meurtrières pour le peuple français.

Figure 4.1 : Nombre de décès observés par année depuis 1816

La seconde guerre mondiale introduit une rupture importante dans l’évolution du nombre de décès. Pour étudier l’évolution récente de la mortalité et afin de travailler sur des données plus homogènes on se concentrera par la suite sur la période comprise entre 1946 et 2018. Le nombre de décès y est relativement stable et en augmentation depuis 2004. Néanmoins, la population française a vu sa taille augmenter sur cette période et l’étude de l’évolution de la mortalité doit tenir compte de cet effet.

L’évolution de la mortalité ne peut être interprétée à partir du seul nombre total de décès observés chaque année. Il faut également prendre en compte la taille de la population étudiée.

4.1.2 Taux brut de mortalité

Le taux brut de mortalité par année s’obtient en divisant le nombre total de décès observés chaque année par l’exposition centrale, qui représente la taille moyenne de la population sur l’année.

Formellement on a ainsi :

\[\mu^\text{brut}_y = \frac{\underset{x,s}{\sum}d_{x,y,s}}{\underset{x,s}{\sum}e^c_{x,y,s}}.\]

Cela revient, au sein du cadre théorique introduit dans la note LinkMath #2 à utiliser l’estimateur du maximum de vraisemblance de la force de mortalité dans un modèle où tous les individus auraient le même risque de décéder dans l’année indépendamment de leur âge ou de leur sexe. Cette quantité est représentée sur la Figure 4.2. Longtemps décroissante, elle augmente de nouveau depuis 2004. Cela s’explique par une évolution dans la structure de la population dont l’âge moyen augmente régulièrement depuis 1965 comme le montre la Figure 4.3. Comme la mortalité à l’âge adulte croît rapidement avec l’âge, ce phénomène aura tendance à augmenter le taux brut de mortalité au sein de la population. La proportion de femmes dans la population a elle aussi évolué mais dans des proportions limitées et avec un impact associé modeste sur le taux brut de mortalité.

Figure 4.2 : Taux brut de mortalité par année depuis 1946

Figure 4.3 : Evolution de la structure de la population depuis 1946

Pour ne pas laisser cet effet structurel interférer avec nos observations, il est nécessaire de s’intéresser aux données par âge. On peut comme précédemment définir un taux brut de mortalité par année pour chaque âge :

\[\mu^\text{brut}_{x,y} = \frac{\underset{s}{\sum}d_{x,y,s}}{\underset{s}{\sum}e^c_{x,y,s}}.\]

La Figure 4.4 représente pour divers âges l’évolution de ce taux. Celui-ci s’avère bel et bien décroissant quel que soit l’âge considéré. Il est également possible de représenter ce taux pour tous les âges à l’aide d’une carte de chaleur par âge, année calendaire et sexe. Le résultat présenté sur la Figure 4.5 n’est pas particulièrement lisible à cause de l’effet dominant de l’âge sur la mortalité.

Figure 4.4 : Taux brut de mortalité observé par année depuis 1974 pour différents âges

Figure 4.5 : Taux brut de mortalité observé par année depuis 1974 pour tous les âges

Notons que ce graphique serait encore moins lisible sans la segmentation utilisée qui reprend le principe d’une échelle logarithmique et donne ainsi plus de visibilité aux petites valeurs du taux brut de mortalité.

Le taux brut de mortalité tous âges confondus ne prend pas en compte la structure de la population et notamment son vieillissement. Pour expliquer l’évolution de la mortalité il est par conséquent nécessaire de tenir compte de l’âge des individus. Pour chaque âge, le taux brut de mortalité est ainsi globalement décroissant.

4.1.3 Les améliorations de mortalité

Il est possible de visualiser l’évolution de la mortalité en utilisant non plus le taux brut de mortalité mais sa variation relative d’une année sur l’autre. On définit ainsi les améliorations de mortalité par :

\[i_{x,y,s} = 1 - \frac{\mu_{x,y,s}}{\mu_{x,y - 1,s}} \tag{4.1}\]

L’amélioration brute de mortalité \(i^\text{brut}_{x,y,s}\) s’obtient quant à elle en remplaçant dans l’Equation Équation 4.1 la force de mortalité par le taux brut de mortalité :

\[i^\text{brut}_{x,y,s} = 1 - \frac{\mu^\text{brut}_{x,y,s}}{\mu^\text{brut}_{x,y - 1,s}}\]

La Figure 4.6 représente les améliorations brutes de mortalité pour les âges 20, 40, 60 et 80 ans. Bien que de moyenne positive, celles-ci présentent une très forte volatilité d’une année à l’autre. La Figure 4.7 qui représente la surface complète des améliorations de mortalité est tout aussi difficile à interpréter tant le bruit d’échantillonnage est important. Cela entérine la nécessite de recourir à un modèle statistique afin de mesurer et d’expliquer les différents effets en présence.

Figure 4.6 : Améliorations brutes de mortalité pour différents âges, avec en pointillés la moyenne sur la période considérée

Figure 4.7 : Améliorations brutes de mortalité par âge, année calendaire et sexe

L’un des défauts de la représentation à travers les améliorations de mortalité est qu’une augmentation ponctuelle de la mortalité entraîne l’année suivante un retour à la moyenne.

En d’autres termes si la mortalité en 2003 est 5 % plus importante qu’en 2002 et la mortalité en 2004 a exactement le même niveau qu’en 2002 alors l’amélioration de mortalité pour l’année 2004 puisqu’elle est calculée sur la base du niveau de l’année de 2003 sera de \(1 - 100 / (100 + 5) \simeq 5 \%\).

Ainsi l’effet d’un choc de mortalité est visible sur deux ans. Sur la Figure 4.7, une bande verticale bleue est ainsi toujours suivie d’une bande jaune.

L’amélioration de mortalité \(i_{x,y,s}\) correspond au pourcentage de diminution du taux de mortalité \(\mu_{x,\bullet,s}\) à l’âge \(x\) et pour le sexe \(g\) entre les années \(y - 1\) et \(y\). Il s’agit d’un indicateur d’intérêt permettant de s’affranchir de l’effet dominant de l’âge sur la mortalité. Les améliorations de mortalité calculées à partir des taux bruts sont trop volatiles pour être directement interprétables, d’où la nécessité de recourir à un modèle statistique pour les expliquer.

4.2 Expliquer l’évolution

L’objectif de cette partie est d’introduire les différents effets qui concourent à créer la surface de mortalité observée sur la Figure 4.5 et à la surface d’améliorations de mortalité de la Figure 4.7 associée. L’étude se limitera aux années 1974 à 2018 et aux âges 0 à 99 ans, les âges 100 ans et plus représentant moins de 0,7 % des décès observés.

Reprenons le cadre de modélisation introduit dans la note LinkMath #3. Rappelons que celui-ci suppose une relation linéaire entre le logarithme de la force de mortalité et les effets du modèle qui sont ici des fonctions de l’âge, l’année calendaire et du sexe. On écrira ainsi \(\log\boldsymbol{\mu} = X\boldsymbol{\beta}\). Dans cette expression \(\boldsymbol{\beta}\) est un vecteur de paramètres qui sera estimé en maximisant une fonction de vraisemblance dont on a montré l’équivalence avec celle d’un GLM Poisson.

Les résultats présentés ici s’appuient en fait sur des modèles encore plus généraux appelés modèles mixtes additifs généralisés (GAMM) qui permettent l’intégration d’effets aléatoires, de lissages et de séries temporelles et opèrent une réduction automatique des paramètres redondants à l’aide de multiples pénalisations. Les détails de cette approche seront pour l’instant épargnés au lecteur mais figureront probablement dans une prochaine publication consacrée à ce sujet.

4.3 Décomposition âge-période

La mortalité peut très simplement être considérée comme la combinaison d’un effet de l’âge et d’un effet de l’année calendaire (appelé également effet période). Ce modèle peut alors être décrit par l’équation linéaire \(\log \mu_{x,y,s} = \overline{\alpha}^s_x + \kappa^s_y\) ou en passant à l’exponentielle \(\mu_{x,y,s} = \exp(\overline{\alpha}^s_x) \times \exp(\kappa^s_y)\).

L’exposant \(s\) indique que le modèle est ajusté séparément aux données pour les hommes et les femmes. L’approche utilisée est légèrement plus complexe et ne sera pas détaillée ici.

La force de mortalité s’écrit donc ici comme le produit d’un coefficient de mortalité lié à l’âge et d’un coefficient lié à l’année calendaire (ou indice annuel de mortalité). Dans ce modèle, seul le niveau global de la mortalité évolue avec l’année calendaire, ainsi la courbe de mortalité par âge ne se déforme t-elle pas dans le temps.

Le modèle spécifié ci-dessus n’est identifiable que si l’on rajoute une contrainte sur un des deux jeux de paramètres \(\overline{\alpha}^s_x\) et \(\kappa^s_y\). On choisira ici la contrainte \(\sum_y e^c_{y,s}\kappa^s_y = 0\)\(e^c_{y,s} = \sum_x e^c_{x,y,s}\). Le niveau 100 % de l’indice correspond donc à une moyenne géométrique des indices annuels \(\kappa^s_y\) estimés, pondérés par l’exposition associée. D’autres combinaisons linéaires des coefficients \(\overline{\alpha}^s_x\) ou \(\kappa^s_y\) auraient également pu être utilisées comme contrainte.

Une fois cette spécification choisie, des contraintes supplémentaires sur la forme des coefficients \(\overline{\alpha}^s_x\) et \(\kappa^s_y\) peuvent être prises en compte :

  • Le coefficient \(\overline{\alpha}^s_x\) traduit l’effet de l’âge sur la mortalité. Il est raisonnable de supposer que \(\overline{\alpha}^s_x\) est une fonction régulière et on va donc imposer une contrainte aux coefficients afin d’obtenir une courbe lisse. En pratique, cela se fait via l’ajout d’un terme de pénalisation des irrégularités au modèle, contrôlé par un paramètre supplémentaire estimé à partir des données.

  • Le coefficient \(\kappa^s_y\) demande quant à lui une réflexion plus poussée. En effet, les variations du niveau annuel de mortalité s’expliquent par deux types d’effets :

  • Des fluctuations annuelles liées en France à la survenance d’évènements de nature météorologiques (hiver rude, canicule) ou épidémiologiques (épidémie de grippe saisonnière, pandémie),

  • Une tendance de fond résultant des changements graduels dans les conditions et habitudes de vie des populations, de l’accès au soin et des progrès de la médecine.

Pour prendre en compte ces deux types d’effets, il est alors naturel de considérer deux composantes dans notre modèle :

  • Pour les fluctuations annuelles, un bruit blanc fait l’affaire.

  • Pour la tendance de fond plusieurs choix sont possibles :

    • Le plus simple consiste en une tendance linéaire simple, avec un unique paramètre de pente, qui suppose une évolution annuelle constante du niveau de mortalité.

    • En complément de cette tendance linéaire peut être ajoutée une marche aléatoire pour prendre en compte des déviations aléatoires mais de moyenne nulle du comportement linéaire.

    • Enfin, un troisième modèle repose sur un lissage et n’impose à l’évolution long-terme aucune autre contrainte que d’être régulière. Cette troisième approche est la plus flexible et permet de rendre compte d’accélérations ou de ralentissements durables dans l’évolution de la mortalité.

La présence de chocs de mortalité aura pour conséquence de précipiter le décès des personnes fragiles et réduira le niveau de mortalité de la population dans les mois qui vont suivre du fait de l’absence de ces personnes. Ce phénomène, connu sous le nom d’effet moisson, justifierait de considérer des chocs de mortalité (négativement) corrélés plutôt qu’un bruit blanc. Néanmoins, des contraintes numériques rendent cette approche difficile à implémenter.

Sur la période considérée, ces trois modélisations produisent un ajustement aux données très similaire. La différence se situera au niveau des prédictions réalisées, et sera présentée dans la prochaine note #LinkMath. Ainsi, seuls les résultats donnés par le troisième modèle, le plus flexible, sont représentés sur la Figure 4.8 :

  • L’effet de l’âge, déjà décrit dans la note LinkMath #1, est représenté sur le graphique de gauche, en échelle logarithmique.

  • L’effet de l’année calendaire (appelé également effet période) est représenté sur le graphique de droite.

Figure 4.8 : Modélisation de la mortalité à l’aide d’une décomposition âge-période. Les courbes en trait plein correspondent aux coefficients \(\exp(\overline{\alpha}^s_x)\) et \(\exp(\kappa^s_y)\) du modèle pour les hommes en bleu et les femmes en rouge. Des bandes de même couleur correspondent aux intervalles de confiance associés. Les points s’interprètent comme des valeurs brutes des coefficients sus-cités. Il s’agit des coefficients que l’on obtiendrait dans un modèle où l’on aurait retiré les contraintes de régularité sur ces coefficients

La Figure 4.9 présente de manière plus détaillée l’effet période. Sur celle-ci, on observe que le niveau annuel diminue tout au long de la période considérée mais que cette diminution ne se fait pas à un rythme constant. Les variations associées à l’évolution long-terme sont ainsi principalement comprises entre 1,5 % et 3 % avec deux phases d’accélération à la fin années 1980 et au milieu des années 2000. Les progrès réalisés dans le traitement des maladies cardiovasculaires sont l’un des principaux facteurs de cette évolution. La réduction de la mortalité est plus marquée chez les femmes sur chez les hommes jusqu’au milieu des années 1990 après quoi ce phénomène s’inverse. Cela peut s’expliquer par les effets délétères du tabac. D’abord consommé majoritairement par les hommes, il devient ensuite populaire auprès des femmes. Ces interprétations pourront être affinées après l’étude des causes de décès dans une prochaine note #LinkMath.

Figure 4.9 : Détails de l’effet période. De gauche à droite et de haut en bas : décomposition de l’effet calendaire en une tendance long-terme et des fluctuations annuelles ; série différenciée de cette évolution long-terme dont chaque point représente donc la variation d’une année sur l’autre du niveau de mortalité ; moyenne de ces variations sur la période considéré

Les résultats du modèle âge-période peuvent ensuite être analysés de différentes manières. La Figure 4.10 représente ainsi côte à côté la force de mortalité \(\mu^\text{AP}_{x,y,s}\) prédite par le modèle et le taux brut de mortalité \(\mu^\text{brut}_{x,y,s}\) pour différentes âges.

Le taux brut de mortalité observé sur la Figure 4.10 est entaché de fluctuations d’échantillonnage. Il ne s’agit donc pas d’une référence absolue qu’un modèle de mortalité devrait essayer de reproduire coûte que coûte.

Il n’est ainsi pas possible de conclure sur la qualité d’ajustement du modèle uniquement à partir de l’amplitude des écarts observés entre le taux brut et la force de mortalité modélisée. Cependant, lorsque ces écarts sont systématiquement de même signe pour plusieurs points consécutifs, ce qui est le cas ici, on doit y voir un signe que le modèle présente un biais et ne convient pas tout à fait aux données.

Figure 4.10 : Force de mortalité observée et obtenue par ajustement du modèle âge-période

Une manière plus adéquate d’évaluer graphiquement la qualité d’un modèle consiste à étudier ses résidus,qui sont représentés sur la Figure 4.11. Il s’agit ici des résidus de déviance du modèle. Comme leur nom l’indique, les résidus permettent de quantifier ce qui reste lorsqu’on retranche aux données les valeurs prédites par le modèle. Si le modèle est adapté, ces résidus doivent présenter une structure aléatoire en apparence et une alternance fréquente de signe. Les grandes bandes diagonales de même couleur visibles indiquent que ce n’est pas le cas ici. Notons qu’une diagonale correspond dans un plan âge-période à une cohorte, définie comme l’ensemble des individus d’une population nées au cours de la même année calendaire. Le modèle semble ainsi commettre des erreurs systématiques dans l’estimation du niveau de mortalité associé à certaines cohortes.

Les résidus de déviance du modèle sont donnés par la formule :

\[r^d_{x,y,s}(\hat{\mu}_{x,y,s}) = \text{sign}(d_{x,y,s} - \hat{d}_{x,y,s})\sqrt{2 \left[d_{x,y,s}(\log d_{x,y,s} - \log \hat{d}_{x,y,s})- (d_{x,y,s} - \hat{d}_{x,y,s})\right]}\]\(d_{x,y,s}\) correspond au nombre de décès observés et \(\hat{d}_{x,y,s} = \hat{\mu}_{x,y,s} e^c_{x,y,s}\) est homogène à un nombre de décès prédit par le modèle. Ils sont d’autant plus importants que l’écart entre ces deux quantités l’est.

Figure 4.11 : Résidus de déviance du modèle âge-période. Les zones rouges (resp. bleues) indiquent un nombre de décès observés supérieur (resp. inférieur) à celui prédit par le modèle

Enfin, la Figure 4.12 représente les améliorations de mortalité observées et prédites par le modèle. Celui-ci semble avoir réussi à capturer de manière convenable les chocs de mortalité observés chaque année. Les bandes diagonales présentes sur le graphique des améliorations brutes n’ont cependant pas été reproduites, ce qui rejoint les conclusions de l’analyse des résidus.

Figure 4.12 : Améliorations de mortalité observées et obtenues par ajustement du modèle âge-période

La mortalité peut en première analyse être décomposée en un effet régulier de l’âge et un effet de l’année calendaire (appelé effet période) composé lui-même :

  • d’une composante long-terme traduisant les changement graduels dans les habitudes de vie et les progrès de la médecine

  • d’une composante annuelle volatile liée à la survenance d’évènements météorologiques (canicules, hivers froids) ou épidémiologiques (grippes, covid19).

Cette modélisation simple et interprétable ne permet pas cependant d’expliquer tous les effets en présence et présente un biais systématique dans l’estimation du nombre de décès observés pour certaines cohortes.

4.4 L’effet cohorte

On appelle cohorte l’ensemble des individus d’une population nées au cours de la même année calendaire. Comme ces individus vont vieillir d’un an chaque année, une cohorte correspond dans la représentation âge-période à une diagonale. Au vu des résidus du modèle âge-période, il est naturel de s’intéresser à ces sous-populations. A partir de de l’observation de ces effets diagonaux, les démographes ont conjecturé l’existence d’un effet cohorte dont l’interprétation est cependant loin d’être immédiate. Il pourrait correspondre à un effet de sélection pour les survivants de chocs démographiques importants (pandémies, privations liées à la guerre). Une autre interprétation suppute que certaines cohortes présentent des caractéristiques différentes du reste de la population. Les enfants nés au cours des deux guerres mondiales auraient de plus grandes chances d’appartenir à des familles aisées, le contexte économique et la probabilité de présence au front des hommes provenant de familles plus modestes n’étant pas favorables à la natalité. Quelle que soit l’interprétation donnée à ces effets, ils sont bel et bien présents dans les données et semblent persister dans le temps.

Il est possible de prendre en compte l’effet cohorte en rajoutant un terme au modèle précédent, qui sera alors désigné sous le nom de modèle âge-période-cohorte :

\[\log \mu_{x,y,s} = \overline{\alpha}^s_x + \kappa^s_y + \overline{\gamma}^s_{y - x}.\]

où le coefficient \(y - x\) correspondant à l’année de naissance.

Une contrainte d’identifiabilité est encore ici nécessaire. On utilise ici \(\sum_{k} e^c_{k,s}\overline{\gamma}^s_{k} = 0\)\(e^c_{y - x,s} = \underset{k}{\sum} e^c_{k,y - x + k,s}\). Le niveau 100 % de l’indice correspond donc encore ici à une moyenne des indices annuels \(\overline{\gamma}^s_{y - x}\) estimés pondérés par l’exposition associée. Par ailleurs, l’effet cohorte ne doit pas inclure de tendance car celle-ci serait redondante avec celle de l’effet période et rendrait le modèle non identifiable.

Lorsque l’on rajoute un effet cohorte au modèle âge-période, les effets âge et période présentés précédemment ne sont que très peu affectés et ne seront pas représentés de nouveau. La Figure 4.13 représente le coefficient \(\exp(\overline{\gamma}^s_{y - x})\) multiplicatif correspondant à l’effet cohorte dans deux référentiels différents : d’abord en fonction de l’année de naissance \(y - x\), puis dans un repaire âge-période \((x,y)\).

Remarquons tout d’abord la forte amplitude de l’effet cohorte ainsi que son caractère remarquablement lisse, les évolutions se faisant ainsi de manière graduelle. Les cohortes correspondant aux années de naissance comprises entre 1950 et 1970 présentent un niveau de mortalité très élevé. Comme piste d’interprétation, on peut mentionner ici une conjecture économique très favorable pendant les 30 glorieuses et le phénomène du baby-boom qui par contraste avec la grande dépression et la seconde guerre mondiale favorise la natalité au sein des classes populaires. Une autre piste est l’exposition précoce au tabac qui a pu avoir des conséquences désastreuses pour la santé des enfants ayant grandi dans l’après-guerre, période où le tabac est très répandu et pas encore perçu comme nocif par l’opinion publique. Il faut malgré tout rester prudent dans ces interprétations en raison de la forte colinéarité de la variable cohorte avec les variables âge et période. Celle-ci se traduit sur la Figure 4.13 par des intervalles de confiance très larges.

Figure 4.13 : Deux représentations de l’effet cohorte

L’analyse des résidus du modèle âge-période-cohorte, présentée sur la Figure 4.14, nous révèle une forte amélioration par rapport au modèle âge-période précédent mais des amas de résidus de même signes persistent.

Figure 4.14 : Résidus de déviance du modèle âge-période-cohorte

Au sein d’une population, une cohorte désigne l’ensemble des individus partageant une même année de naissance. L’ajout au modèle âge-période précédent d’un coefficient de mortalité différent pour chaque cohorte permet d’améliorer significativement l’ajustement aux données.

4.5 Améliorations de mortalité par âge

Les modèles précédents font l’hypothèse, que les améliorations de mortalité sont indépendantes de l’âge. Cette hypothèse n’est pourtant pas vérifiée empiriquement, des améliorations de mortalité plus faibles étant notamment observées aux très grands âges. Les modèles âge-période et âge-période-cohorte peuvent être adaptés pour prendre en compte ce phénomène en rajoutant un nouveau coefficient \(\overline{\beta}^s_x \times y\) à ces modèles. Ce nouveau modèle s’écrit ainsi :

\[\log \mu_{x,y,s} = \overline{\alpha}^s_x + \kappa^s_y + \overline{\beta}^s_x \times y\]

pour un modèle sans effet cohorte et

\[\log \mu_{x,y,s} = \overline{\alpha}^s_x + \kappa^s_y + \overline{\gamma}^s_{y - x} + \overline{\beta}^s_x \times y.\]

pour un modèle avec effet cohorte.

Le coefficient \(\overline{\beta}_x\) joue un rôle très similaire à celui du célèbre modèle de Lee-Carter qui s’écrit, dans sa version adaptée à la loi de Poisson et en reprenant les notations précédentes, \(\log \mu_{x,y,s} = \alpha^s_x + \beta^s_x \kappa^s_y\).

Le coefficient \(\overline{\beta}^s_x\) introduit dans cette note vient uniquement moduler l’amélioration de mortalité moyenne, à la différence du coefficient \(\beta^s_x\) du modèle de Lee-Carter qui s’applique à l’intégralité de l’effet période.

L’approche proposée par Lee et Carter n’a ainsi pas été exactement reproduite ici, et ce pour deux raisons :

  • La présence du produit de coefficients \(\beta^s_x \kappa^s_y\) fait du modèle de Lee-Carter un modèle non-linéaire ce qui rend son estimation plus complexe.

  • Le terme \(\kappa^s_y\) du modèle de Lee-Carter a été introduit pour modéliser uniquement l’évolution long-terme. En effet, les fluctuations annuelles de mortalité sont très limitées dans les données américaines pour lesquelles ce modèle a initialement été construit. Si nous utilisions la même approche, le même coefficient \(\beta^s_x\) serait donc appliqué d’une part aux améliorations long-terme, a priori plus faibles aux âges élevés, et d’autre part aux chocs annuels de mortalité, a priori plus importants aux grands âges. Deux coefficients \(\beta^s_x\) différents seraient alors nécessaires pour prendre en compte ces deux effets opposés.

Les améliorations annuelles moyennes de mortalité par âge obtenues pour les modèle âge-période et âge-période-cohorte avec améliorations de mortalité dépendant de l’âge (abrégés en AP+ et APC+) s’obtiennent en ajoutant à la pente de la tendance linéaire présente dans le terme \(\kappa^s_y\) le coefficient \(\overline{\beta}^s_x\) ajouté au modèle. Représentées sur la Figure 4.15, elles sont sensiblement différentes selon qu’on prend en compte ou non l’effet cohorte dans le modèle. En effet, lorsqu’il n’est pas explicitement modélisé, l’effet cohorte vient bruiter l’amélioration moyenne de mortalité car les observations disponibles pour un âge donné proviennent d’un nombre limité de cohortes (ici 2018 - 1970 + 1 = 49). Il faudra donc mieux se fier aux améliorations de mortalité prédite par le modèle APC+, représenté sur la droite de la Figure 4.15.

Celui-ci montre des améliorations maximales entre les âges 40 et 80 et une nette décroissance après 80 ans à la fois pour les hommes et les femmes. Aux âges jeunes, inférieurs à 20 ans, la situation est moins claire ce qui s’explique par le nombre plus limité de décès (seuls 5,4 % des décès sont survenus avant 40 ans pour la période considérée). Les améliorations de mortalité semblent néanmoins minimales entre 20 et 30 ans. L’interprétation de ce phénomène est ici encore à chercher du côté des causes de décès, principalement accidentels pour cette tranche d’âge, dont l’évolution serait ainsi plus lente que pour les autres causes de décès. La note #LinkMath sur les causes de décès permettra d’affiner ces conclusions. Enfin, les effets âge, période et cohorte présentés précédemment ne sont que peu affectés et ne seront donc pas représentés de nouveau.

Figure 4.15 : Améliorations de mortalité moyenne par âge estimée par ajustement des modèles AP+ (gauche) et APC+ (droite)

L’analyse des résidus des deux modèles, représentés sur la Figure 4.16, montre une nette amélioration de l’ajustement aux données lorsque les améliorations de mortalité dépendent de l’âge. Les résidus du modèle APC+ ne contiennent ainsi que très peu de structure résiduelle.

Figure 4.16 : Résidus de déviance des modèles AP+ (haut) et APC+ (bas)

On représente sur la Figure 4.17, uniquement pour le modèle APC+, le taux brut de mortalité observé et la force de mortalité estimée. Le modèle capture de manière satisfaisante l’évolution de la mortalité pour les âges représentés. Par ailleurs, les améliorations de mortalité estimées par le modèle, représentées sur la Figure 4.18, semblent répliquer fidèlement les grandes tendances des améliorations de mortalité observées, tout en supprimant le bruit lié aux fluctuations d’échantillonnage.

Figure 4.17 : Force de mortalité observée et obtenue par ajustement du modèle APC+

Figure 4.18 : Améliorations de mortalité observées et obtenues par ajustement du modèle APC+

La prise en compte d’améliorations de mortalité dont la valeur moyenne peut dépendre de l’âge dans un modèle âge-période-cohorte permet de rendre compte assez fidèlement de la structure de la mortalité observée.

4.6 Validation de l’approche

La présentation des différents modèles a permis de juger graphiquement de la qualité de leur ajustement aux données en représentant les valeurs brutes et estimées de la force de mortalité, les améliorations de mortalité brutes et estimées ainsi que la structure des résidus obtenus. Il est possible d’adopter une approche plus quantitative s’appuyant sur différents indicateurs :

  • La déviance qui à un facteur \(- 2\) près correspond à la vraisemblance du modèle. Il s’agit également de la somme des carrés des résidus de déviance. Cette indicateur traduit ainsi l’erreur d’ajustement du modèle et devra être minimisé.

  • La dimension effective ou nombre de degrés de liberté s’interprète comme un nombre minimal de paramètres nécessaires pour répliquer les résultats du modèle. C’est donc un indicateur de la complexité du modèle, qu’on recherchera également à minimiser.

  • Les critères AIC (Akaike Information Criterion) et BIC (Bayesian Information Criterion) sont deux combinaisons linéaires de la déviance du modèle et de sa dimension effective. Ils permettent de classer les modèles en proposant un compromis entre précision et complexité. Entre ces deux modèles, seul le poids relatif de ces deux facteurs change : le BIC pénalise plus sévèrement la complexité du modèle et cette pénalisation dépend de plus du nombre d’observations. Enfin le critère GCV (Global Cross Validation) représente quant à lui un quotient entre la déviance du modèle et le nombre de degrés de libertés résiduels et son interprétation est donc tout à fait similaire. Ces trois critères doivent être minimisés.

Derrière l’idée de pénaliser la complexité d’un modèle se cache la volonté de limiter le sur-ajustement (ou sur-apprentissage) du modèle aux données. Un modèle avec trop de paramètres sera meilleur sur les données sur lesquelles il a été ajusté car ses paramètres ont capturé une partie du bruit présent dans ces données, mais précisément pour cette raison il réalisera des prédictions médiocres sur de nouvelles données.

Ces différents indicateurs ont été calculés pour tous les modèles introduits jusqu’ici. Les résultats sont présentés dans la Table 4.1. Les modèles précédents y ont été abrégés à l’aide de la nomenclature suivante :

  • Les lettres A, P et C désignent la présence des effets âge période et cohorte. Le caractère + indique que les améliorations moyennes de mortalité dépendent de l’âge.

  • La lettre entre parenthèse indique le type de modèle choisi pour la tendance long-terme de l’effet période (parmi les trois propositions formulées dans la partie la modélisation de l’effet période) : L pour une simple droite (linear), RW pour l’ajout d’une marche aléatoire (random walk) et S pour une composante lisse (smooth).

Table 4.1 : Principaux indicateur statistiques pour les différents modèles introduits dans cette note
Modèle Déviance Dimension effective observations AIC BIC GCV
AP(L) 134 578,7 136,2 9 200 134 851,1 135 822,0 15,1
AP(RW) 134 580,4 133,7 9 200 134 847,9 135 800,9 15,1
AP(S) 134 581,9 132,6 9 200 134 847,2 135 792,5 15,1
AP(L)C 47 705,7 186,6 9 200 48 078,9 49 408,8 5,4
AP(RW)C 47 675,2 184,3 9 200 48 043,9 49 357,5 5,4
AP(S)C 47 955,0 182,8 9 200 48 320,5 49 623,0 5,4
AP(L)+ 38 802,6 173,2 9 200 39 149,1 40 383,8 4,4
AP(RW)+ 38 805,3 170,1 9 200 39 145,5 40 357,8 4,4
AP(S)+ 38 805,9 169,7 9 200 39 145,2 40 354,4 4,4
AP(L)C+ 18 565,1 220,0 9 200 19 005,0 20 572,8 2,1
AP(RW)C+ 18 543,9 214,6 9 200 18 973,1 20 502,6 2,1
AP(S)C+ 18 645,6 216,4 9 200 19 078,3 20 620,2 2,1

Les remarques suivantes peuvent être formulées :

  • Les résultats obtenus pour les trois variantes L, R et S sont très proches et celles-ci devront être départagés sur la base de leurs capacités de prédiction de la mortalité future.

  • La déviance des modèles diminue avec leur complexité. Par ailleurs, le modèle APC est plus précis que le modèle AP+. Ces résultats se recoupent heureusement avec ceux de l’analyse des résidus puisque la déviance n’est autre que la somme des carrés des résidus de déviance.

  • La complexité des modèles proposés, caractérisée par leur dimension effective, reprend l’ordre dans lequel ces modèles ont été introduits, le plus complet étant également le plus complexe.

  • Le classement des modèles est le même quel que soit le critère retenu (AIC, BIC ou GCV). Le modèle le plus complet est ici le plus performant en terme d’ajustement aux données.

La comparaison des modèles est possible à l’aide de critères statistiques qui réalisent un compromis entre la précision du modèle et sa complexité, cette dernière devant être minimisée pour éviter de retenir un modèle sur-ajusté aux données.

Le modèle âge-période-cohorte avec améliorations de mortalité par âge introduit dans cette note est selon les différents critères meilleur que ses sous-modèles obtenus aux étapes précédentes, ce qui justifie l’adoption des différents effets introduits.

Néanmoins, l’objectif des modèles de mortalité doit être non seulement d’expliquer les phénomènes observés mais également de prédire l’évolution future de la mortalité. Dans la prochaine note #LinkMath, les capacités de prédiction des modèles introduits seront étudiées et comparées aux modèles prospectifs classiques.

Votre interlocuteur R&D :

Guillaume Biessy

Actuaire certifié IA

Docteur en Mathématiques Appliquées de l’Université Paris-Saclay

Professeur associé à temps partiel à Sorbonne Université

guillaume.biessy@linkpact.fr