Metodika

Tato stránka dokumentuje, jak NoCall mění tisíce hlášení uživatelů ve spolehlivé hodnocení každého telefonního čísla. Vysvětlujeme přesný vzorec rizikového skóre, úrovně nebezpečí, jak klasifikujeme kategorie, jak funguje naše analýza umělé inteligence a odkud pocházejí data. Tuto metodiku zveřejňujeme, aby každý mohl pochopit — a zpochybnit — rozhodnutí, která systém činí.

Jak se počítá rizikové skóre

Každému číslu v naší databázi je přiděleno rizikové skóre mezi 0 a 100. Nejde o subjektivní úsudek: odvozuje se z deterministického vzorce, který se přepočítá pokaždé, když přijde nové schválené hlášení.

riziko = min(100, hlášení × 5 + (ověřeno ? 30 : 0))

Každé schválené hlášení přidá 5 bodů. Pokud náš tým ověřil číslo jako potvrzený spam, přidá se dalších 30 bodů. Výsledek nikdy nepřekročí 100.

Faktor ověření existuje proto, aby odlišil číslo s mnoha nedávnými hlášeními (které může být ojedinělý falešný poplach) od čísla, které lidský kontrolor aktivně potvrdil jako zneužívající. Proto 20 neověřených hlášení (100 bodů z hlášení, s limitem) a 14 ověřených hlášení (70 + 30) mohou dosáhnout podobného skóre různými cestami.

Když bylo číslo analyzováno naší AI a má schválené signály komunity, zjištěná úroveň nebezpečí také slouží jako spodní hranice skóre: číslo označené jako kritické se nikdy nezobrazí pod 90, vysoké pod 70, střední pod 45 a nízké pod 20, i s málo hlášeními. Jasně podvodný vzorec tak není podhodnocen jen proto, že je nedávný.

Úrovně nebezpečí

Z číselného skóre klasifikujeme každé číslo do jedné ze čtyř úrovní nebezpečí. Jsou to stejné identifikátory, které naše databáze používá interně:

Nízká (bajo)0–39

Málo hlášení nebo žádné. Číslo nevykazuje jasné známky spamové aktivity. Může jít o legitimní linku nebo ojedinělé, nepotvrzené hlášení.

Střední (medio)40–59

Přijato několik hlášení. Doporučuje se opatrnost před zvednutím nebo zavoláním zpět. Výchozí hodnota, když je signál nejednoznačný.

Vysoká (alto)60–79

Početná potvrzená hlášení. Vysoká pravděpodobnost agresivního telemarketingu nebo opakovaných nechtěných hovorů.

Kritická (critico)80–100

Číslo ověřené jako spam nebo podvod, nebo identifikované AI jako podvod či zneužití identity. Doporučujeme ho okamžitě zablokovat.

Spamové kategorie

Každé hlášení a každé číslo je klasifikováno do jedné ze sedmi kategorií. Kategorie určuje, jak je číslo prezentováno v adresáři, a odvozuje se jak z hlášení uživatele, tak z pozdější automatické analýzy:

  • SPAMObecné, nevyžádané komerční hovory, které nezapadají do konkrétnější kategorie.
  • TELEMARKETINGTelefonní prodejní kampaně, obvykle telekomunikace nebo energetika, které přetrvávají i přes odmítnutí.
  • PODVODPodvody, včetně zneužití identity (banky, veřejné orgány, falešná technická podpora). Nejzávažnější kategorie.
  • VYMÁHÁNÍHovory za vymáháním a vymáháním dluhů, často agresivní nebo mířené na nesprávnou osobu.
  • OBTĚŽOVÁNÍOpakované hovory s cílem obtěžovat, zastrašovat nebo úmyslně rušit.
  • PRŮZKUMNevyžádané telefonní průzkumy, ankety a průzkumy trhu.
  • JINÉJakýkoli jiný typ nechtěného hovoru, který nezapadá do výše uvedených.

Analýza umělé inteligence

Nad rámec číselného skóre analyzuje AI worker čísla na základě komunitou schváleného obsahu: komentářů a hlášení, které prošly moderací. AI nikdy nepracuje s neschváleným obsahem, takže žádný nezkontrolovaný příspěvek nemůže ovlivnit veřejnou analýzu.

Pro každé analyzované číslo AI generuje strukturovanou sadu informací zobrazenou na stránce čísla:

Pole, která analýza vytváří, jsou následující:

  • PopisShrnutí v přirozeném jazyce o tom, kdo se zdá být za číslem a co chce.
  • Vzorce stížnostíNejčastěji opakované důvody stížností napříč hlášeními (například hovory v neobvyklých hodinách nebo vytrvalost po odmítnutí).
  • Použité taktikyKonkrétní zjištěné techniky, jako je nátlak, falešná naléhavost nebo žádosti o osobní údaje.
  • OborOblast, do které aktivita patří (telekomunikace, energetika, vymáhání pohledávek, průzkumy atd.).
  • Zjištěná firmaFirma nebo organizace, kterou číslo zřejmě zastupuje nebo se za ni vydává, pokud ji lze identifikovat.
  • Zneužití identityIndikátor, zda číslo předstírá, že je legitimní subjekt (banka, veřejná správa, známá značka).
  • Doporučená akceKonečné doporučení pro uživatele: blokovat, opatrnost, ignorovat nebo bezpečné.

Tato analýza je orientační a generovaná automaticky z příspěvků komunity; nenahrazuje vlastní úsudek uživatele ani nepředstavuje obvinění proti žádné konkrétní firmě.

Moderace: nic se nezveřejní bez kontroly

Kontrola kvality je středobodem metodiky. Hlášení a komentáře se neobjeví ve veřejném adresáři ve chvíli, kdy jsou odeslány: zůstávají čekající, dokud je administrátor neschválí. Teprve poté se započítají do rizikového skóre, napájejí analýzu AI a stanou se viditelnými pro ostatní uživatele.

Tato moderační brána slouží dvěma účelům: vyřazuje falešná nebo zlovolná hlášení dřív, než ovlivní reputaci čísla, a zajišťuje, že AI uvažuje pouze nad prověřenými informacemi. Autor čekajícího hlášení může vidět svůj vlastní příspěvek, ale nikdo jiný, dokud není schválen.

Zdroje dat

Hodnocení každého čísla kombinuje tři nezávislé zdroje:

  • Hlášení komunityZáklad všeho. Uživatelé nahlašují čísla z aplikace i z webu, anonymně, s kategorií a komentářem. Po moderaci jsou hlavním signálem pro skóre.
  • Data operátorů a předvoleb od CNMCPoužíváme veřejná data Národní komise pro trhy a hospodářskou soutěž (CNMC) k identifikaci operátora přiděleného každému číselnému bloku a typu linky (mobilní, pevná, prémiová sazba).
  • Tiskové zprávy firem (RSS)Sledujeme tisková centra firem prostřednictvím RSS kanálů, abychom rozpoznali legitimní kampaně a omezili falešné poplachy, když skutečná firma vede hromadnou komunikaci.
Metodika — Jak analyzujeme spamová čísla | NoCall