L'analyse d'Edith Ginglinger

Empreintes numériques et credit scoring

Option Finance - 5 novembre 2018 - Edith Ginglinger, Université Paris-Dauphine

Chaque utilisateur d’Internet laisse de nombreuses empreintes. Celles-ci permettent-elles de fournir des informations sur la qualité de crédit d’un client ou d’un emprunteur ? Traditionnellement, les scores utilisés pour les crédits à la consommation prennent en compte des informations telles que les revenus, la profession, le lieu de résidence, les caractéristiques des crédits en cours. Les intermédiaires financiers, en raison de leur capacité d’analyse de l’information, sont supposés être bien placés pour apprécier la probabilité qu’a un emprunteur de rembourser les sommes prêtées. L’analyse de plateformes de prêts désintermédiés telles que Lendingclub ou Prosper montre que des informations non financières permettent d’améliorer l’appréciation de la solvabilité, en particulier pour les emprunteurs les plus fragiles. Par exemple, le fait de fournir une photo, la longueur des phrases dans la description des projets et le nombre d’amis soutenant le projet sont des caractéristiques indiquant un risque de crédit moindre, d’après une étude de plusieurs chercheurs internationaux («Screening Peers Softly : Inferring the Quality of Small Borrowers»).

Les réseaux sociaux sont également une source d’informations très utile. Une étude de chercheurs de la Singapore Management University menée sur le site Weibo en Chine (réseau semblable à Twitter) souligne que l’utilisation de données non structurées permet d’améliorer l’appréciation de la solvabilité fournie par des scores classiques, en utilisant notamment le contenu des textes, l’heure de diffusion, la fréquence des émoticons ou la composition du réseau des followers. Par exemple, les tweets diffusés entre 0 h et 7 h sont plus fréquemment émis par des personnes de moindre qualité de crédit.

Récemment, une autre étude («On the Rise of FinTechs – Credit Scoring Using Digital Footprints») a mis en lumière que même des empreintes numériques simples sont utiles pour mesurer le risque de crédit : par quel outil le site est consulté (ordinateur ou téléphone), quel type de système d’exploitation (IOS ou Android), l’heure de consultation, le fournisseur d’adresse e-mail et la structure de l’adresse, l’arrivée sur le site via un moteur de recherche ou en cliquant sur une publicité. Cette analyse a été menée en examinant plus de 200 000 achats d’une plateforme d’e-commerce vendant des meubles en Allemagne. Dans 80 % des cas, les meubles sont payés à réception. La vente comporte donc un crédit courant de la commande à la réception. Pour accepter ce crédit, l’entreprise se fie à deux agences de notation de crédit, la première vérifiant que le client existe bien et qu’il n’est pas en faillite, et la seconde procurant une appréciation plus complète à partir de l’historique financier du client dans plusieurs banques (encours de crédit, nombre de comptes, comportements passés de paiement). Le taux de défaut moyen constaté est de 1 %, à comparer au taux de défaut sur les crédits à la consommation de Deutsche Bank par exemple, de 1,5 %. Cette étude montre que les taux de défaut sont trois fois supérieurs pour les commandes passées depuis un téléphone (2,14 %) par rapport à un ordinateur fixe (0,74 %). Les commandes passées depuis un système d’exploitation Android connaissent un taux de défaut presque deux fois supérieur à celui des possesseurs d’iPhone. Les taux de défaut dépendent également de l’adresse e-mail utilisée : ils sont plus élevés pour les accès gratuits de type Hotmail (1,45 %), Yahoo (1,96 %), Gmail (1,25 %) que pour T-online (0,51 %), un fournisseur payant. Les utilisateurs commandant la nuit (0 h-6 h) ont des taux de défaut deux fois plus élevés que ceux commandant en journée ou le soir. Les personnes dont les adresses e-mail comportent des chiffres ont des taux de défaut de 1,41 %, tandis que celles dont l’adresse contient leur nom ont des taux de défaut plus faibles (0,82 %). Enfin, le fait d’entrer une adresse e-mail erronée lors du premier essai, ce qui se produit pour 1 % des clients, est associé à un taux de défaut de 5 %. Les différentes caractéristiques se combinent : un utilisateur d’un ordinateur Mac avec une adresse T-online a un taux de défaut de 0,36 %, à comparer à 4,30 % pour un utilisateur d’un portable doté d’Android et d’une adresse e-mail Yahoo.

Ces informations glanées permettent un classement des clients similaire, voire légèrement meilleur que celui des agences de notation de crédit. Lorsque les deux catégories d’information (notation classique et empreintes digitales) sont utilisées simultanément, elles conduisent à une amélioration des prédictions de défaut par rapport à l’utilisation de l’une seule de ces sources d’information.