Methodologie

Deze pagina documenteert hoe NoCall duizenden gebruikersmeldingen omzet in een betrouwbare beoordeling voor elk telefoonnummer. We leggen de exacte risicoscoreformule uit, de gevarenniveaus, hoe we categorieën classificeren, hoe onze kunstmatige-intelligentie-analyse werkt en waar de gegevens vandaan komen. We publiceren deze methodologie zodat iedereen de beslissingen van het systeem kan begrijpen — en in twijfel kan trekken.

Hoe de risicoscore wordt berekend

Elk nummer in onze database krijgt een risicoscore tussen 0 en 100. Het is geen subjectief oordeel: het komt voort uit een deterministische formule die opnieuw wordt berekend telkens wanneer er een nieuwe goedgekeurde melding binnenkomt.

risico = min(100, meldingen × 5 + (geverifieerd ? 30 : 0))

Elke goedgekeurde melding voegt 5 punten toe. Als ons team het nummer als bevestigde spam heeft geverifieerd, worden er 30 extra punten toegevoegd. Het resultaat overschrijdt nooit 100.

De verificatiefactor bestaat om onderscheid te maken tussen een nummer met veel recente meldingen (wat een eenmalige fout-positieve kan zijn) en een nummer dat een menselijke beoordelaar actief als misbruik heeft bevestigd. Daarom kunnen 20 niet-geverifieerde meldingen (100 punten uit meldingen, afgetopt) en 14 geverifieerde meldingen (70 + 30) langs verschillende wegen vergelijkbare scores bereiken.

Wanneer een nummer is geanalyseerd door onze AI en goedgekeurde communitysignalen heeft, fungeert het gedetecteerde gevarenniveau ook als ondergrens voor de score: een nummer dat als kritiek is gemarkeerd, zal nooit onder 90 worden getoond, een hoog onder 70, gemiddeld onder 45 en laag onder 20, zelfs met weinig meldingen. Op deze manier wordt een duidelijk frauduleus patroon niet ondergewaardeerd omdat het recent is.

Gevarenniveaus

Op basis van de numerieke score classificeren we elk nummer in een van de vier gevarenniveaus. Dit zijn dezelfde identificatoren die onze database intern gebruikt:

Laag (bajo)0–39

Weinig of geen meldingen. Het nummer vertoont geen duidelijke tekenen van spamactiviteit. Het kan een legitieme lijn zijn of een geïsoleerde, onbevestigde melding.

Gemiddeld (medio)40–59

Meerdere meldingen ontvangen. Voorzichtigheid is geboden voordat je opneemt of terugbelt. De standaardwaarde wanneer het signaal dubbelzinnig is.

Hoog (alto)60–79

Talrijke bevestigde meldingen. Grote kans op agressieve telemarketing of herhaalde ongewenste oproepen.

Kritiek (critico)80–100

Nummer geverifieerd als spam of oplichting, of door de AI geïdentificeerd als fraude of imitatie. We raden aan het onmiddellijk te blokkeren.

Spamcategorieën

Elke melding en elk nummer wordt geclassificeerd in een van de zeven categorieën. De categorie bepaalt hoe het nummer in de map wordt gepresenteerd en wordt afgeleid uit zowel de melding van de gebruiker als de latere geautomatiseerde analyse:

  • SPAMGenerieke, ongewenste commerciële oproepen die niet in een specifiekere categorie passen.
  • TELEMARKETINGTelefonische verkoopcampagnes, meestal telecom of energie, die ondanks afwijzing aanhouden.
  • SCAMOplichting en fraude, inclusief identiteitsimitatie (banken, openbare instanties, neptechnische ondersteuning). De meest ernstige categorie.
  • DEBTIncasso- en invorderingsoproepen, vaak agressief of gericht op de verkeerde persoon.
  • HARASSMENTHerhaalde oproepen bedoeld om te intimideren, bang te maken of opzettelijk te verstoren.
  • SURVEYOngevraagde telefonische enquêtes, peilingen en marktonderzoek.
  • OTHERElk ander type ongewenste oproep dat niet in het bovenstaande past.

Kunstmatige-intelligentie-analyse

Naast de numerieke score analyseert een AI-worker nummers op basis van door de community goedgekeurde content: de reacties en meldingen die de moderatie hebben doorstaan. De AI werkt nooit met niet-goedgekeurde content, dus geen enkele ongecontroleerde bijdrage kan de openbare analyse beïnvloeden.

Voor elk geanalyseerd nummer genereert de AI een gestructureerde set informatie die op de pagina van het nummer wordt getoond:

De velden die de analyse oplevert, zijn als volgt:

  • BeschrijvingEen samenvatting in natuurlijke taal van wie er achter het nummer lijkt te zitten en wat ze willen.
  • KlachtpatronenDe meest herhaalde klachtredenen in alle meldingen (bijvoorbeeld oproepen op ongelegen tijdstippen of volharding na weigering).
  • Gebruikte tactiekenDe specifieke gedetecteerde technieken, zoals druk, valse urgentie of verzoeken om persoonsgegevens.
  • SectorHet gebied waartoe de activiteit behoort (telecom, energie, incasso, enquêtes, enz.).
  • Gedetecteerd bedrijfHet bedrijf of de organisatie die het nummer lijkt te vertegenwoordigen of te imiteren, wanneer dit kan worden geïdentificeerd.
  • ImitatieEen indicator of het nummer zich voordoet als een legitieme entiteit (bank, openbaar bestuur, bekend merk).
  • Aanbevolen actieDe uiteindelijke aanbeveling voor de gebruiker: blokkeren, voorzichtigheid, negeren of veilig.

Deze analyse is indicatief en wordt automatisch gegenereerd uit bijdragen van de community; ze vervangt niet het eigen oordeel van de gebruiker en vormt geen beschuldiging tegen een specifiek bedrijf.

Moderatie: niets wordt gepubliceerd zonder controle

Kwaliteitscontrole is het middelpunt van de methodologie. Meldingen en reacties verschijnen niet in de openbare map op het moment dat ze worden ingediend: ze blijven in behandeling totdat een beheerder ze goedkeurt. Pas dan tellen ze mee voor de risicoscore, voeden ze de AI-analyse en worden ze zichtbaar voor andere gebruikers.

Deze moderatiepoort dient twee doelen: ze verwerpt valse of kwaadwillige meldingen voordat ze de reputatie van een nummer beïnvloeden, en ze zorgt ervoor dat de AI alleen redeneert over gecontroleerde informatie. De auteur van een melding in behandeling kan zijn eigen bijdrage zien, maar niemand anders, totdat deze is goedgekeurd.

Gegevensbronnen

De beoordeling van elk nummer combineert drie onafhankelijke bronnen:

  • CommunitymeldingenDe basis van alles. Gebruikers melden nummers vanuit de app en het web, anoniem, met een categorie en een reactie. Na moderatie zijn ze het belangrijkste signaal voor de score.
  • CNMC-operator- en voorvoegselgegevensWe gebruiken openbare gegevens van de Nationale Commissie voor Markten en Mededinging (CNMC) om de operator te identificeren die aan elk nummerblok is toegewezen en het lijntype (mobiel, vast, betaalnummer).
  • Persberichten van bedrijven (RSS)We volgen de persruimtes van bedrijven via RSS-feeds om legitieme campagnes te detecteren en fout-positieven te verminderen wanneer een echt bedrijf massacommunicatie verstuurt.
Methodologie — Hoe we spamnummers analyseren | NoCall