Metodika

Tato stránka dokumentuje, jak NoCall mění tisíce hlášení uživatelů ve spolehlivé hodnocení každého telefonního čísla. Vysvětlujeme přesný vzorec rizikového skóre, úrovně nebezpečí, jak klasifikujeme kategorie, jak funguje naše analýza umělé inteligence a odkud pocházejí data. Tuto metodiku zveřejňujeme, aby každý mohl pochopit — a zpochybnit — rozhodnutí, která systém činí.

Jak se počítá rizikové skóre

Každému číslu v naší databázi je přiděleno rizikové skóre mezi 0 a 100. Nejde o subjektivní úsudek: odvozuje se z deterministického vzorce, který se přepočítá pokaždé, když přijde nové schválené hlášení.

riziko = min(100, hlášení × 5 + (ověřeno ? 30 : 0))

Každé schválené hlášení přidá 5 bodů. Pokud náš tým ověřil číslo jako potvrzený spam, přidá se dalších 30 bodů. Výsledek nikdy nepřekročí 100.

Faktor ověření existuje proto, aby odlišil číslo s mnoha nedávnými hlášeními (které může být ojedinělý falešný poplach) od čísla, které lidský kontrolor aktivně potvrdil jako zneužívající. Proto 20 neověřených hlášení (100 bodů z hlášení, s limitem) a 14 ověřených hlášení (70 + 30) mohou dosáhnout podobného skóre různými cestami.

Když bylo číslo analyzováno naší AI a má schválené signály komunity, zjištěná úroveň nebezpečí také slouží jako spodní hranice skóre: číslo označené jako kritické se nikdy nezobrazí pod 90, vysoké pod 70, střední pod 45 a nízké pod 20, i s málo hlášeními. Jasně podvodný vzorec tak není podhodnocen jen proto, že je nedávný.

Úrovně nebezpečí

Z číselného skóre klasifikujeme každé číslo do jedné ze čtyř úrovní nebezpečí. Jsou to stejné identifikátory, které naše databáze používá interně:

Spamové kategorie

Každé hlášení a každé číslo je klasifikováno do jedné ze sedmi kategorií. Kategorie určuje, jak je číslo prezentováno v adresáři, a odvozuje se jak z hlášení uživatele, tak z pozdější automatické analýzy:

SPAM — Obecné, nevyžádané komerční hovory, které nezapadají do konkrétnější kategorie.
TELEMARKETING — Telefonní prodejní kampaně, obvykle telekomunikace nebo energetika, které přetrvávají i přes odmítnutí.
PODVOD — Podvody, včetně zneužití identity (banky, veřejné orgány, falešná technická podpora). Nejzávažnější kategorie.
VYMÁHÁNÍ — Hovory za vymáháním a vymáháním dluhů, často agresivní nebo mířené na nesprávnou osobu.
OBTĚŽOVÁNÍ — Opakované hovory s cílem obtěžovat, zastrašovat nebo úmyslně rušit.
PRŮZKUM — Nevyžádané telefonní průzkumy, ankety a průzkumy trhu.
JINÉ — Jakýkoli jiný typ nechtěného hovoru, který nezapadá do výše uvedených.

Analýza umělé inteligence

Nad rámec číselného skóre analyzuje AI worker čísla na základě komunitou schváleného obsahu: komentářů a hlášení, které prošly moderací. AI nikdy nepracuje s neschváleným obsahem, takže žádný nezkontrolovaný příspěvek nemůže ovlivnit veřejnou analýzu.

Pro každé analyzované číslo AI generuje strukturovanou sadu informací zobrazenou na stránce čísla:

Pole, která analýza vytváří, jsou následující:

Popis — Shrnutí v přirozeném jazyce o tom, kdo se zdá být za číslem a co chce.
Vzorce stížností — Nejčastěji opakované důvody stížností napříč hlášeními (například hovory v neobvyklých hodinách nebo vytrvalost po odmítnutí).
Použité taktiky — Konkrétní zjištěné techniky, jako je nátlak, falešná naléhavost nebo žádosti o osobní údaje.
Obor — Oblast, do které aktivita patří (telekomunikace, energetika, vymáhání pohledávek, průzkumy atd.).
Zjištěná firma — Firma nebo organizace, kterou číslo zřejmě zastupuje nebo se za ni vydává, pokud ji lze identifikovat.
Zneužití identity — Indikátor, zda číslo předstírá, že je legitimní subjekt (banka, veřejná správa, známá značka).
Doporučená akce — Konečné doporučení pro uživatele: blokovat, opatrnost, ignorovat nebo bezpečné.

Tato analýza je orientační a generovaná automaticky z příspěvků komunity; nenahrazuje vlastní úsudek uživatele ani nepředstavuje obvinění proti žádné konkrétní firmě.

Moderace: nic se nezveřejní bez kontroly

Kontrola kvality je středobodem metodiky. Hlášení a komentáře se neobjeví ve veřejném adresáři ve chvíli, kdy jsou odeslány: zůstávají čekající, dokud je administrátor neschválí. Teprve poté se započítají do rizikového skóre, napájejí analýzu AI a stanou se viditelnými pro ostatní uživatele.

Tato moderační brána slouží dvěma účelům: vyřazuje falešná nebo zlovolná hlášení dřív, než ovlivní reputaci čísla, a zajišťuje, že AI uvažuje pouze nad prověřenými informacemi. Autor čekajícího hlášení může vidět svůj vlastní příspěvek, ale nikdo jiný, dokud není schválen.

Zdroje dat

Hodnocení každého čísla kombinuje tři nezávislé zdroje:

Hlášení komunity — Základ všeho. Uživatelé nahlašují čísla z aplikace i z webu, anonymně, s kategorií a komentářem. Po moderaci jsou hlavním signálem pro skóre.
Data operátorů a předvoleb od CNMC — Používáme veřejná data Národní komise pro trhy a hospodářskou soutěž (CNMC) k identifikaci operátora přiděleného každému číselnému bloku a typu linky (mobilní, pevná, prémiová sazba).
Tiskové zprávy firem (RSS) — Sledujeme tisková centra firem prostřednictvím RSS kanálů, abychom rozpoznali legitimní kampaně a omezili falešné poplachy, když skutečná firma vede hromadnou komunikaci.