Metodológia

Táto stránka dokumentuje, ako NoCall mení tisíce nahlásení používateľov na spoľahlivé posúdenie každého telefónneho čísla. Vysvetľujeme presný vzorec skóre rizika, úrovne nebezpečenstva, ako klasifikujeme kategórie, ako funguje naša analýza umelej inteligencie a odkiaľ údaje pochádzajú. Túto metodológiu zverejňujeme, aby ktokoľvek mohol pochopiť — a spochybniť — rozhodnutia, ktoré systém robí.

Ako sa počíta skóre rizika

Každé číslo v našej databáze dostane skóre rizika medzi 0 a 100. Nie je to subjektívny úsudok: vyplýva z deterministického vzorca, ktorý sa prepočítava vždy, keď dorazí nové schválené nahlásenie.

riziko = min(100, nahlásenia × 5 + (overené ? 30 : 0))

Každé schválené nahlásenie pridáva 5 bodov. Ak náš tím overil číslo ako potvrdený spam, pripočíta sa ďalších 30 bodov. Výsledok nikdy nepresiahne 100.

Faktor overenia existuje na odlíšenie čísla s mnohými nedávnymi nahláseniami (ktoré by mohli byť jednorazovým falošným poplachom) od čísla, ktoré ľudský kontrolór aktívne potvrdil ako zneužívajúce. Preto 20 neoverených nahlásení (100 bodov z nahlásení, obmedzené) a 14 overených nahlásení (70 + 30) môžu dosiahnuť podobné skóre rôznymi cestami.

Keď bolo číslo analyzované našou AI a má schválené komunitné signály, zistená úroveň nebezpečenstva tiež slúži ako spodná hranica skóre: číslo označené ako kritické sa nikdy nezobrazí pod 90, vysoké pod 70, stredné pod 45 a nízke pod 20, aj pri málo nahláseniach. Takto sa jasne podvodný vzorec nepodhodnotí len preto, že je nedávny.

Úrovne nebezpečenstva

Z číselného skóre klasifikujeme každé číslo do jednej zo štyroch úrovní nebezpečenstva. Sú to rovnaké identifikátory, aké naša databáza používa interne:

Kategórie spamu

Každé nahlásenie a každé číslo sa klasifikuje do jednej zo siedmich kategórií. Kategória určuje, ako je číslo prezentované v adresári, a vyvodzuje sa z nahlásenia používateľa aj z neskoršej automatizovanej analýzy:

SPAM — Všeobecné nechcené komerčné hovory, ktoré nezapadajú do konkrétnejšej kategórie.
TELEMARKETING — Telefonické predajné kampane, zvyčajne z oblasti telekomunikácií alebo energetiky, ktoré pretrvávajú napriek odmietnutiu.
PODVOD — Podvody a klamstvá vrátane zneužitia identity (banky, verejné inštitúcie, falošná technická podpora). Najzávažnejšia kategória.
DLH — Hovory na vymáhanie a vyberanie dlhov, často agresívne alebo zamerané na nesprávnu osobu.
OBŤAŽOVANIE — Opakované hovory s cieľom obťažovať, zastrašovať alebo zámerne vyrušovať.
PRIESKUM — Nevyžiadané telefonické prieskumy, ankety a prieskumy trhu.
INÉ — Akýkoľvek iný typ nechceného hovoru, ktorý nezapadá do vyššie uvedeného.

Analýza umelej inteligencie

Nad rámec číselného skóre AI analyzuje čísla na základe komunitne schváleného obsahu: komentárov a nahlásení, ktoré prešli moderáciou. AI nikdy nepracuje s neschváleným obsahom, takže žiadny neskontrolovaný príspevok nemôže ovplyvniť verejnú analýzu.

Pre každé analyzované číslo AI generuje štruktúrovanú sadu informácií zobrazenú na stránke čísla:

Polia, ktoré analýza produkuje, sú nasledovné:

Popis — Zhrnutie v prirodzenom jazyku o tom, kto sa zdá byť za číslom a čo chce.
Vzorce sťažností — Najčastejšie opakované dôvody sťažností naprieč nahláseniami (napríklad hovory v nevhodných hodinách alebo vytrvalosť po odmietnutí).
Použité taktiky — Zistené konkrétne techniky, ako nátlak, falošná naliehavosť alebo žiadosti o osobné údaje.
Sektor — Oblasť, do ktorej činnosť patrí (telekomunikácie, energetika, vymáhanie dlhov, prieskumy atď.).
Zistená spoločnosť — Spoločnosť alebo organizácia, ktorú číslo zjavne zastupuje alebo zneužíva, ak sa dá identifikovať.
Zneužitie identity — Ukazovateľ toho, či sa číslo vydáva za legitímny subjekt (banka, verejná správa, známa značka).
Odporúčaný postup — Konečné odporúčanie pre používateľa: zablokovať, opatrnosť, ignorovať alebo bezpečné.

Táto analýza je orientačná a generovaná automaticky z príspevkov komunity; nenahrádza vlastný úsudok používateľa ani nepredstavuje obvinenie voči žiadnej konkrétnej spoločnosti.

Moderácia: nič sa nezverejní bez kontroly

Kontrola kvality je ústredným prvkom metodológie. Nahlásenia a komentáre sa v okamihu odoslania neobjavia vo verejnom adresári: zostávajú v stave čakania, kým ich administrátor neschváli. Až potom sa započítavajú do skóre rizika, napájajú analýzu AI a stávajú sa viditeľnými pre ostatných používateľov.

Táto moderačná brána slúži dvom účelom: vyraďuje falošné alebo škodlivé nahlásenia skôr, než ovplyvnia povesť čísla, a zabezpečuje, že AI uvažuje len nad preverenými informáciami. Autor čakajúceho nahlásenia vidí svoj vlastný príspevok, no nikto iný, kým nie je schválený.

Zdroje údajov

Posúdenie každého čísla kombinuje tri nezávislé zdroje:

Nahlásenia komunity — Základ všetkého. Používatelia nahlasujú čísla z aplikácie a webu, anonymne, s kategóriou a komentárom. Po moderácii sú hlavným signálom pre skóre.
Údaje CNMC o operátoroch a predvoľbách — Používame verejné údaje Národnej komisie pre trhy a hospodársku súťaž (CNMC) na identifikáciu operátora prideleného každému číselnému bloku a typu linky (mobil, pevná linka, prémiová sadzba).
Tlačové správy spoločností (RSS) — Sledujeme tlačové miestnosti spoločností cez RSS kanály, aby sme zistili legitímne kampane a znížili počet falošných poplachov, keď skutočná spoločnosť realizuje hromadnú komunikáciu.