Metodologia

Questa pagina documenta come NoCall trasforma migliaia di segnalazioni degli utenti in una valutazione affidabile per ogni numero di telefono. Spieghiamo la formula esatta del punteggio di rischio, i livelli di pericolo, come classifichiamo le categorie, come funziona la nostra analisi di intelligenza artificiale e da dove provengono i dati. Pubblichiamo questa metodologia affinché chiunque possa comprendere — e mettere in discussione — le decisioni che il sistema prende.

Come si calcola il punteggio di rischio

A ogni numero del nostro database viene assegnato un punteggio di rischio compreso tra 0 e 100. Non è un giudizio soggettivo: deriva da una formula deterministica che viene ricalcolata ogni volta che arriva una nuova segnalazione approvata.

rischio = min(100, segnalazioni × 5 + (verificato ? 30 : 0))

Ogni segnalazione approvata aggiunge 5 punti. Se il nostro team ha verificato il numero come spam confermato, vengono aggiunti 30 punti extra. Il risultato non supera mai 100.

Il fattore di verifica esiste per distinguere un numero con molte segnalazioni recenti (che potrebbe essere un falso positivo isolato) da un numero che un revisore umano ha attivamente confermato come abusivo. Per questo 20 segnalazioni non verificate (100 punti dalle segnalazioni, limitati) e 14 segnalazioni verificate (70 + 30) possono raggiungere punteggi simili per vie diverse.

Quando un numero è stato analizzato dalla nostra IA e ha segnali approvati dalla community, anche il livello di pericolo rilevato funge da soglia minima per il punteggio: un numero segnalato come critico non scenderà mai sotto 90, uno alto sotto 70, uno medio sotto 45 e uno basso sotto 20, anche con poche segnalazioni. In questo modo un modello chiaramente fraudolento non viene sottovalutato solo perché è recente.

Livelli di pericolo

Dal punteggio numerico classifichiamo ogni numero in uno dei quattro livelli di pericolo. Sono gli stessi identificatori che il nostro database usa internamente:

Categorie di spam

Ogni segnalazione e ogni numero vengono classificati in una di sette categorie. La categoria determina come il numero viene presentato nella directory ed è derivata sia dalla segnalazione dell'utente sia dalla successiva analisi automatica:

SPAM — Chiamate commerciali generiche e indesiderate che non rientrano in una categoria più specifica.
TELEMARKETING — Campagne di vendita telefonica, di solito di telecomunicazioni o energia, che persistono nonostante il rifiuto.
SCAM — Truffe e frodi, inclusa l'impersonificazione di identità (banche, enti pubblici, falso supporto tecnico). La categoria più grave.
DEBT — Chiamate di recupero crediti, spesso aggressive o rivolte alla persona sbagliata.
HARASSMENT — Chiamate ripetute con l'intento di molestare, intimidire o disturbare deliberatamente.
SURVEY — Sondaggi telefonici, indagini e ricerche di mercato non richiesti.
OTHER — Qualsiasi altro tipo di chiamata indesiderata che non rientra nelle precedenti.

Analisi di intelligenza artificiale

Oltre al punteggio numerico, un worker IA analizza i numeri sulla base dei contenuti approvati dalla community: i commenti e le segnalazioni che hanno superato la moderazione. L'IA non lavora mai con contenuti non approvati, quindi nessun contributo non esaminato può influenzare l'analisi pubblica.

Per ogni numero analizzato, l'IA genera un insieme strutturato di informazioni mostrato nella pagina del numero:

I campi prodotti dall'analisi sono i seguenti:

Descrizione — Un riepilogo in linguaggio naturale di chi sembra esserci dietro il numero e cosa vuole.
Modelli di reclamo — I motivi di reclamo più ripetuti nelle segnalazioni (ad esempio, chiamate in orari scomodi o insistenza dopo il rifiuto).
Tattiche utilizzate — Le tecniche specifiche rilevate, come pressione, falsa urgenza o richieste di dati personali.
Settore — Il campo a cui appartiene l'attività (telecomunicazioni, energia, recupero crediti, sondaggi, ecc.).
Azienda rilevata — L'azienda o l'organizzazione che il numero sembra rappresentare o impersonare, quando è identificabile.
Impersonificazione — Un indicatore che segnala se il numero finge di essere un'entità legittima (banca, pubblica amministrazione, marchio noto).
Azione consigliata — La raccomandazione finale per l'utente: bloccare, cautela, ignorare o sicuro.

Questa analisi è indicativa e generata automaticamente dai contributi della community; non sostituisce il giudizio dell'utente né costituisce un'accusa contro alcuna azienda specifica.

Moderazione: nulla viene pubblicato senza revisione

Il controllo qualità è il fulcro della metodologia. Le segnalazioni e i commenti non compaiono nella directory pubblica nel momento in cui vengono inviati: restano in sospeso finché un amministratore non li approva. Solo allora contribuiscono al punteggio di rischio, alimentano l'analisi IA e diventano visibili agli altri utenti.

Questo filtro di moderazione ha due scopi: scartare le segnalazioni false o malevole prima che incidano sulla reputazione di un numero e garantire che l'IA ragioni solo su informazioni vagliate. L'autore di una segnalazione in sospeso può vedere il proprio contributo, ma nessun altro, finché non viene approvato.

Fonti dei dati

La valutazione di ogni numero combina tre fonti indipendenti:

Segnalazioni della community — La base di tutto. Gli utenti segnalano i numeri dall'app e dal web, in modo anonimo, con una categoria e un commento. Dopo la moderazione, sono il segnale principale per il punteggio.
Dati su operatori e prefissi CNMC — Utilizziamo i dati pubblici della Commissione Nazionale per i Mercati e la Concorrenza (CNMC) per identificare l'operatore assegnato a ciascun blocco di numerazione e il tipo di linea (cellulare, fisso, tariffa premium).
Comunicati stampa delle aziende (RSS) — Seguiamo le sale stampa delle aziende tramite feed RSS per rilevare le campagne legittime e ridurre i falsi positivi quando un'azienda reale sta effettuando comunicazioni di massa.