Metodikk

Denne siden dokumenterer hvordan NoCall gjør tusenvis av brukerrapporter om til en pålitelig vurdering for hvert telefonnummer. Vi forklarer den nøyaktige formelen for risikoscore, farenivåene, hvordan vi klassifiserer kategorier, hvordan vår kunstig-intelligens-analyse fungerer, og hvor dataene kommer fra. Vi publiserer denne metodikken slik at hvem som helst kan forstå — og stille spørsmål ved — beslutningene systemet tar.

Hvordan risikoscoren beregnes

Hvert nummer i databasen vår får en risikoscore mellom 0 og 100. Det er ikke en subjektiv vurdering: den utledes fra en deterministisk formel som beregnes på nytt hver gang en ny godkjent rapport kommer inn.

risiko = min(100, rapporter × 5 + (verifisert ? 30 : 0))

Hver godkjent rapport legger til 5 poeng. Hvis teamet vårt har verifisert nummeret som bekreftet spam, legges 30 ekstra poeng til. Resultatet overstiger aldri 100.

Verifiseringsfaktoren finnes for å skille et nummer med mange nylige rapporter (som kan være en enkeltstående falsk positiv) fra et nummer en menneskelig moderator aktivt har bekreftet som misbruk. Det er derfor 20 uverifiserte rapporter (100 poeng fra rapporter, begrenset) og 14 verifiserte rapporter (70 + 30) kan nå lignende score via ulike veier.

Når et nummer er analysert av KI-en vår og har godkjente fellesskapssignaler, fungerer det oppdagede farenivået også som et gulv for scoren: et nummer flagget som kritisk vil aldri vise under 90, et høyt under 70, middels under 45 og lavt under 20, selv med få rapporter. På denne måten blir et tydelig svindelmønster ikke undervurdert bare fordi det er nytt.

Farenivåer

Ut fra den numeriske scoren klassifiserer vi hvert nummer i ett av fire farenivåer. Dette er de samme identifikatorene databasen vår bruker internt:

Spamkategorier

Hver rapport og hvert nummer klassifiseres i én av syv kategorier. Kategorien bestemmer hvordan nummeret presenteres i katalogen og utledes både fra brukerens rapport og fra den senere automatiserte analysen:

SPAM — Generiske, uønskede kommersielle anrop som ikke passer i en mer spesifikk kategori.
TELEMARKETING — Telefonsalgskampanjer, vanligvis telekom eller energi, som fortsetter til tross for avvisning.
SCAM — Svindel og bedrageri, inkludert identitetsetterligning (banker, offentlige organer, falsk teknisk støtte). Den alvorligste kategorien.
DEBT — Inkasso- og innkrevingsanrop, ofte aggressive eller rettet mot feil person.
HARASSMENT — Gjentatte anrop ment for å trakassere, skremme eller bevisst forstyrre.
SURVEY — Uoppfordrede telefonundersøkelser, meningsmålinger og markedsundersøkelser.
OTHER — Enhver annen type uønsket anrop som ikke passer i det ovennevnte.

Kunstig intelligens-analyse

Utover den numeriske scoren analyserer en KI-arbeider numre basert på fellesskapsgodkjent innhold: kommentarene og rapportene som har bestått moderering. KI-en jobber aldri med ugodkjent innhold, så ingen ugjennomgått bidrag kan påvirke den offentlige analysen.

For hvert analyserte nummer genererer KI-en et strukturert sett med informasjon som vises på nummerets side:

Feltene analysen produserer er som følger:

Beskrivelse — Et naturlig-språk-sammendrag av hvem som ser ut til å stå bak nummeret og hva de vil.
Klagemønstre — De mest gjentatte klagegrunnene på tvers av rapporter (for eksempel anrop på ubeleilige tidspunkter eller pågåenhet etter avslag).
Brukte taktikker — De spesifikke teknikkene som er oppdaget, som press, falskt hastverk eller forespørsler om personopplysninger.
Sektor — Feltet aktiviteten tilhører (telekom, energi, inkasso, undersøkelser osv.).
Oppdaget selskap — Selskapet eller organisasjonen nummeret ser ut til å representere eller etterligne, når det kan identifiseres.
Etterligning — En indikator på om nummeret utgir seg for å være en legitim enhet (bank, offentlig forvaltning, kjent merke).
Anbefalt handling — Den endelige anbefalingen for brukeren: blokker, forsiktighet, ignorer eller trygt.

Denne analysen er veiledende og generert automatisk fra bidrag fra fellesskapet; den erstatter ikke brukerens egen vurdering og utgjør ikke en anklage mot noe bestemt selskap.

Moderering: ingenting publiseres uten gjennomgang

Kvalitetskontroll er hjørnesteinen i metodikken. Rapporter og kommentarer vises ikke i den offentlige katalogen i det øyeblikket de sendes inn: de forblir ventende til en administrator godkjenner dem. Først da teller de mot risikoscoren, mater KI-analysen og blir synlige for andre brukere.

Denne modereringsporten tjener to formål: den forkaster falske eller ondsinnede rapporter før de påvirker et nummers omdømme, og den sikrer at KI-en bare resonnerer over kontrollert informasjon. Forfatteren av en ventende rapport kan se sitt eget bidrag, men ingen andre, til det er godkjent.

Datakilder

Vurderingen av hvert nummer kombinerer tre uavhengige kilder:

Rapporter fra fellesskapet — Grunnlaget for alt. Brukere rapporterer numre fra appen og nettet, anonymt, med en kategori og en kommentar. Etter moderering er de hovedsignalet for scoren.
CNMC operatør- og prefiksdata — Vi bruker offentlige data fra den nasjonale kommisjonen for markeder og konkurranse (CNMC) for å identifisere operatøren som er tildelt hver nummerblokk og linjetypen (mobil, fasttelefon, overtakst).
Pressemeldinger fra selskaper (RSS) — Vi følger selskapers pressrom via RSS-feeder for å oppdage legitime kampanjer og redusere falske positiver når et ekte selskap kjører masseutsendelser.