Méthodologie

Cette page explique comment NoCall transforme des milliers de signalements d'utilisateurs en une évaluation fiable pour chaque numéro de téléphone. Nous expliquons la formule exacte du score de risque, les niveaux de danger, comment nous classons les catégories, comment fonctionne notre analyse par intelligence artificielle et d'où proviennent les données. Nous publions cette méthodologie pour que chacun puisse comprendre — et remettre en question — les décisions du système.

Comment le score de risque est calculé

Chaque numéro de notre base de données reçoit un score de risque compris entre 0 et 100. Ce n'est pas un jugement subjectif : il découle d'une formule déterministe recalculée chaque fois qu'un nouveau signalement approuvé arrive.

risque = min(100, signalements × 5 + (vérifié ? 30 : 0))

Chaque signalement approuvé ajoute 5 points. Si notre équipe a vérifié le numéro comme spam confirmé, 30 points supplémentaires sont ajoutés. Le résultat ne dépasse jamais 100.

Le facteur de vérification existe pour distinguer un numéro avec de nombreux signalements récents (qui pourrait être un faux positif ponctuel) d'un numéro qu'un examinateur humain a activement confirmé comme abusif. C'est pourquoi 20 signalements non vérifiés (100 points de signalements, plafonnés) et 14 signalements vérifiés (70 + 30) peuvent atteindre des scores similaires par des voies différentes.

Lorsqu'un numéro a été analysé par notre IA et présente des signaux communautaires approuvés, le niveau de danger détecté agit aussi comme un plancher pour le score : un numéro signalé comme critique ne s'affichera jamais en dessous de 90, un numéro élevé en dessous de 70, un moyen en dessous de 45 et un faible en dessous de 20, même avec peu de signalements. Ainsi, un schéma clairement frauduleux n'est pas sous-évalué simplement parce qu'il est récent.

Niveaux de danger

À partir du score numérique, nous classons chaque numéro dans l'un des quatre niveaux de danger. Ce sont les mêmes identifiants que notre base de données utilise en interne :

Faible (bajo)0–39

Peu ou pas de signalements. Le numéro ne présente aucun signe clair d'activité de spam. Il peut s'agir d'une ligne légitime ou d'un signalement isolé et non confirmé.

Moyen (medio)40–59

Plusieurs signalements reçus. La prudence est conseillée avant de répondre ou de rappeler. La valeur par défaut lorsque le signal est ambigu.

Élevé (alto)60–79

Nombreux signalements confirmés. Forte probabilité de démarchage agressif ou d'appels indésirables répétés.

Critique (critico)80–100

Numéro vérifié comme spam ou arnaque, ou identifié par l'IA comme fraude ou usurpation. Nous recommandons de le bloquer immédiatement.

Catégories de spam

Chaque signalement et chaque numéro sont classés dans l'une des sept catégories. La catégorie détermine la manière dont le numéro est présenté dans le répertoire et découle à la fois du signalement de l'utilisateur et de l'analyse automatisée ultérieure :

  • SPAMAppels commerciaux génériques et indésirables qui ne correspondent pas à une catégorie plus précise.
  • DÉMARCHAGECampagnes de vente par téléphone, généralement télécoms ou énergie, qui persistent malgré le refus.
  • ARNAQUEArnaques et fraudes, y compris l'usurpation d'identité (banques, organismes publics, faux support technique). La catégorie la plus grave.
  • RECOUVREMENTAppels de recouvrement et de recouvrement de créances, souvent agressifs ou adressés à la mauvaise personne.
  • HARCÈLEMENTAppels répétés destinés à harceler, intimider ou déranger délibérément.
  • SONDAGESondages téléphoniques, enquêtes et études de marché non sollicités.
  • AUTRETout autre type d'appel indésirable qui ne correspond pas à ce qui précède.

Analyse par intelligence artificielle

Au-delà du score numérique, un agent IA analyse les numéros à partir du contenu approuvé par la communauté : les commentaires et signalements qui ont passé la modération. L'IA ne travaille jamais avec du contenu non approuvé, de sorte qu'aucune contribution non examinée ne peut influencer l'analyse publique.

Pour chaque numéro analysé, l'IA génère un ensemble structuré d'informations affichées sur la page du numéro :

Les champs produits par l'analyse sont les suivants :

  • DescriptionUn résumé en langage naturel de qui semble se cacher derrière le numéro et de ce qu'ils veulent.
  • Schémas de plaintesLes motifs de plainte les plus répétés dans les signalements (par exemple, des appels à des heures indues ou une insistance après refus).
  • Tactiques utiliséesLes techniques spécifiques détectées, telles que la pression, la fausse urgence ou les demandes de données personnelles.
  • SecteurLe domaine auquel appartient l'activité (télécoms, énergie, recouvrement, sondages, etc.).
  • Entreprise détectéeL'entreprise ou l'organisation que le numéro semble représenter ou usurper, lorsqu'elle peut être identifiée.
  • UsurpationUn indicateur de savoir si le numéro prétend être une entité légitime (banque, administration publique, marque connue).
  • Action recommandéeLa recommandation finale pour l'utilisateur : bloquer, prudence, ignorer ou sûr.

Cette analyse est indicative et générée automatiquement à partir des contributions de la communauté ; elle ne remplace pas le propre jugement de l'utilisateur ni ne constitue une accusation contre une entreprise spécifique.

Modération : rien n'est publié sans révision

Le contrôle de la qualité est la pièce maîtresse de la méthodologie. Les signalements et commentaires n'apparaissent pas dans le répertoire public dès leur soumission : ils restent en attente jusqu'à ce qu'un administrateur les approuve. Ce n'est qu'alors qu'ils comptent dans le score de risque, alimentent l'analyse par IA et deviennent visibles pour les autres utilisateurs.

Ce filtre de modération sert deux objectifs : il écarte les signalements faux ou malveillants avant qu'ils n'affectent la réputation d'un numéro, et il garantit que l'IA ne raisonne que sur des informations vérifiées. L'auteur d'un signalement en attente peut voir sa propre contribution, mais personne d'autre, jusqu'à ce qu'elle soit approuvée.

Sources de données

L'évaluation de chaque numéro combine trois sources indépendantes :

  • Signalements de la communautéLe fondement de tout. Les utilisateurs signalent les numéros depuis l'application et le web, de manière anonyme, avec une catégorie et un commentaire. Après modération, ils constituent le principal signal pour le score.
  • Données d'opérateurs et de préfixes de la CNMCNous utilisons les données publiques de la Commission nationale des marchés et de la concurrence (CNMC) pour identifier l'opérateur attribué à chaque bloc de numérotation et le type de ligne (mobile, fixe, surtaxé).
  • Communiqués de presse des entreprises (RSS)Nous suivons les salles de presse des entreprises via des flux RSS pour détecter les campagnes légitimes et réduire les faux positifs lorsqu'une vraie entreprise mène des communications de masse.
Méthodologie — Comment nous analysons les numéros de spam | NoCall