Metodologie

Această pagină documentează cum transformă NoCall mii de raportări ale utilizatorilor într-o evaluare fiabilă pentru fiecare număr de telefon. Explicăm formula exactă a scorului de risc, nivelurile de pericol, cum clasificăm categoriile, cum funcționează analiza noastră de inteligență artificială și de unde provin datele. Publicăm această metodologie pentru ca oricine să poată înțelege — și pune sub semnul întrebării — deciziile pe care le ia sistemul.

Cum se calculează scorul de risc

Fiecărui număr din baza noastră de date i se atribuie un scor de risc între 0 și 100. Nu este o judecată subiectivă: derivă dintr-o formulă deterministă care se recalculează de fiecare dată când sosește o nouă raportare aprobată.

risc = min(100, raportări × 5 + (verificat ? 30 : 0))

Fiecare raportare aprobată adaugă 5 puncte. Dacă echipa noastră a verificat numărul ca spam confirmat, se adaugă încă 30 de puncte. Rezultatul nu depășește niciodată 100.

Factorul de verificare există pentru a distinge un număr cu multe raportări recente (care ar putea fi un fals pozitiv izolat) de un număr pe care un verificator uman l-a confirmat activ ca abuziv. De aceea, 20 de raportări neverificate (100 de puncte din raportări, plafonate) și 14 raportări verificate (70 + 30) pot ajunge la scoruri similare pe căi diferite.

Când un număr a fost analizat de IA și are semnale comunitare aprobate, nivelul de pericol detectat acționează și ca un prag minim pentru scor: un număr semnalat ca critic nu va afișa niciodată sub 90, unul ridicat sub 70, mediu sub 45 și scăzut sub 20, chiar și cu puține raportări. Astfel, un tipar clar fraudulos nu este subevaluat doar pentru că este recent.

Niveluri de pericol

Din scorul numeric, clasificăm fiecare număr într-unul din patru niveluri de pericol. Acestea sunt aceiași identificatori pe care baza noastră de date îi folosește intern:

Scăzut (bajo)0–39

Puține raportări sau deloc. Numărul nu prezintă semne clare de activitate spam. Poate fi o linie legitimă sau o raportare izolată, neconfirmată.

Mediu (medio)40–59

Câteva raportări primite. Se recomandă prudență înainte de a răspunde sau de a suna înapoi. Valoarea implicită când semnalul este ambiguu.

Ridicat (alto)60–79

Numeroase raportări confirmate. Probabilitate mare de telemarketing agresiv sau apeluri nedorite repetate.

Critic (critico)80–100

Număr verificat ca spam sau înșelătorie, ori identificat de IA ca fraudă sau uzurpare de identitate. Recomandăm blocarea lui imediată.

Categorii de spam

Fiecare raportare și fiecare număr este clasificat într-una din șapte categorii. Categoria determină cum este prezentat numărul în director și derivă atât din raportarea utilizatorului, cât și din analiza automată ulterioară:

  • SPAMApeluri comerciale generice, nedorite, care nu se încadrează într-o categorie mai specifică.
  • TELEMARKETINGCampanii de vânzări telefonice, de obicei de telecomunicații sau energie, care persistă în ciuda refuzului.
  • ÎNȘELĂTORIEÎnșelătorii și fraude, inclusiv uzurparea identității (bănci, instituții publice, asistență tehnică falsă). Cea mai gravă categorie.
  • DATORIIApeluri de recuperare a creanțelor, adesea agresive sau adresate persoanei greșite.
  • HĂRȚUIREApeluri repetate menite să hărțuiască, să intimideze sau să deranjeze intenționat.
  • SONDAJSondaje telefonice, anchete și cercetări de piață nesolicitate.
  • ALTULOrice alt tip de apel nedorit care nu se încadrează în cele de mai sus.

Analiză de inteligență artificială

Dincolo de scorul numeric, un proces IA analizează numerele pe baza conținutului aprobat de comunitate: comentariile și raportările care au trecut de moderare. IA nu lucrează niciodată cu conținut neaprobat, astfel încât nicio contribuție neverificată nu poate influența analiza publică.

Pentru fiecare număr analizat, IA generează un set structurat de informații afișat pe pagina numărului:

Câmpurile pe care le produce analiza sunt următoarele:

  • DescriereUn rezumat în limbaj natural despre cine pare să fie în spatele numărului și ce dorește.
  • Tipare de plângeriCele mai repetate motive de plângere din raportări (de exemplu, apeluri la ore nepotrivite sau insistență după refuz).
  • Tactici folositeTehnicile specifice detectate, cum ar fi presiunea, urgența falsă sau solicitarea de date personale.
  • SectorDomeniul de care aparține activitatea (telecomunicații, energie, recuperare de creanțe, sondaje etc.).
  • Companie detectatăCompania sau organizația pe care numărul pare să o reprezinte sau să o uzurpe, atunci când poate fi identificată.
  • Uzurpare de identitateUn indicator care arată dacă numărul se pretinde a fi o entitate legitimă (bancă, administrație publică, marcă cunoscută).
  • Acțiune recomandatăRecomandarea finală pentru utilizator: blochează, atenție, ignoră sau sigur.

Această analiză este orientativă și generată automat din contribuțiile comunității; nu înlocuiește propria judecată a utilizatorului și nu constituie o acuzație împotriva vreunei companii anume.

Moderare: nimic nu se publică fără verificare

Controlul calității este piesa centrală a metodologiei. Raportările și comentariile nu apar în directorul public în momentul în care sunt trimise: rămân în așteptare până când un administrator le aprobă. Abia atunci contează pentru scorul de risc, alimentează analiza IA și devin vizibile pentru alți utilizatori.

Această poartă de moderare are două scopuri: elimină raportările false sau rău intenționate înainte ca acestea să afecteze reputația unui număr și se asigură că IA raționează doar pe baza informațiilor verificate. Autorul unei raportări în așteptare își poate vedea propria contribuție, dar nimeni altcineva, până când este aprobată.

Surse de date

Evaluarea fiecărui număr combină trei surse independente:

  • Raportările comunitățiiFundamentul a tot. Utilizatorii raportează numere din aplicație și de pe web, anonim, cu o categorie și un comentariu. După moderare, sunt principalul semnal pentru scor.
  • Datele de operator și prefix de la CNMCFolosim date publice de la Comisia Națională pentru Piețe și Concurență (CNMC) pentru a identifica operatorul atribuit fiecărui bloc de numerotare și tipul liniei (mobil, fix, tarif premium).
  • Comunicate de presă ale companiilor (RSS)Urmărim sălile de presă ale companiilor prin fluxuri RSS pentru a detecta campaniile legitime și a reduce falsele pozitive atunci când o companie reală desfășoară comunicări în masă.
Metodologie — Cum analizăm numerele spam | NoCall