Методологія

Ця сторінка документує, як NoCall перетворює тисячі скарг користувачів на надійну оцінку для кожного номера телефону. Ми пояснюємо точну формулу оцінки ризику, рівні небезпеки, як ми класифікуємо категорії, як працює наш аналіз на основі штучного інтелекту та звідки беруться дані. Ми публікуємо цю методологію, щоб будь-хто міг зрозуміти — і поставити під сумнів — рішення, які ухвалює система.

Як обчислюється оцінка ризику

Кожному номеру в нашій базі даних присвоюється оцінка ризику від 0 до 100. Це не суб’єктивне судження: воно випливає з детермінованої формули, яка перераховується щоразу, коли надходить нова схвалена скарга.

ризик = min(100, скарги × 5 + (підтверджено ? 30 : 0))

Кожна схвалена скарга додає 5 балів. Якщо наша команда перевірила номер як підтверджений спам, додається ще 30 балів. Результат ніколи не перевищує 100.

Фактор перевірки існує, щоб відрізнити номер із багатьма недавніми скаргами (що може бути разовим хибним спрацюванням) від номера, який людина-рецензент активно підтвердила як зловмисний. Саме тому 20 неперевірених скарг (100 балів від скарг, обмежено) і 14 перевірених скарг (70 + 30) можуть досягати схожих оцінок різними шляхами.

Коли номер проаналізовано нашим ШІ й він має схвалені сигнали спільноти, виявлений рівень небезпеки також діє як нижня межа для оцінки: номер, позначений як критичний, ніколи не показуватиметься нижче 90, високий — нижче 70, середній — нижче 45, а низький — нижче 20, навіть із кількома скаргами. Так явно шахрайський шаблон не недооцінюється лише тому, що він недавній.

Рівні небезпеки

За числовою оцінкою ми класифікуємо кожен номер на один із чотирьох рівнів небезпеки. Це ті самі ідентифікатори, які наша база даних використовує внутрішньо:

Низький (bajo)0–39

Мало скарг або жодної. Номер не показує чітких ознак спам-активності. Це може бути легітимна лінія або поодинока, непідтверджена скарга.

Середній (medio)40–59

Отримано кілька скарг. Радимо бути обережними, перш ніж відповідати чи передзвонювати. Значення за замовчуванням, коли сигнал неоднозначний.

Високий (alto)60–79

Численні підтверджені скарги. Висока ймовірність агресивного телемаркетингу чи повторюваних небажаних дзвінків.

Критичний (critico)80–100

Номер перевірено як спам або шахрайство, або ШІ ідентифікував його як шахрайство чи видавання себе за іншого. Рекомендуємо негайно його заблокувати.

Категорії спаму

Кожна скарга й кожен номер класифікуються в одну з семи категорій. Категорія визначає, як номер показано в каталозі, і виводиться як зі скарги користувача, так і з пізнішого автоматичного аналізу:

  • SPAMЗагальні, небажані комерційні дзвінки, що не підпадають під конкретнішу категорію.
  • TELEMARKETINGТелефонні кампанії продажів, зазвичай телеком чи енергетика, що тривають попри відмову.
  • SCAMШахрайство й афери, зокрема видавання себе за іншого (банки, держоргани, фальшива технічна підтримка). Найсерйозніша категорія.
  • DEBTДзвінки зі стягнення та повернення боргів, часто агресивні чи спрямовані не на ту особу.
  • HARASSMENTПовторювані дзвінки з метою переслідувати, залякувати чи навмисно турбувати.
  • SURVEYНебажані телефонні опитування, анкети та маркетингові дослідження.
  • OTHERБудь-який інший тип небажаного дзвінка, що не підпадає під вищезазначене.

Аналіз на основі штучного інтелекту

Окрім числової оцінки, ШІ-воркер аналізує номери на основі схваленого спільнотою контенту: коментарів і скарг, що пройшли модерацію. ШІ ніколи не працює з несхваленим контентом, тож жоден неперевірений внесок не може вплинути на публічний аналіз.

Для кожного проаналізованого номера ШІ генерує структурований набір інформації, що показується на сторінці номера:

Поля, які видає аналіз, такі:

  • ОписУзагальнення природною мовою того, хто, схоже, стоїть за номером і чого вони хочуть.
  • Шаблони скаргНайповторюваніші причини скарг у різних повідомленнях (наприклад, дзвінки в незручний час чи наполегливість після відмови).
  • Застосовані тактикиКонкретні виявлені прийоми, як-от тиск, фальшива терміновість чи запити персональних даних.
  • СекторСфера, до якої належить діяльність (телеком, енергетика, стягнення боргів, опитування тощо).
  • Виявлена компаніяКомпанія чи організація, яку номер, схоже, представляє чи за яку себе видає, коли це можна ідентифікувати.
  • Видавання себе за іншогоІндикатор того, чи номер удає легітимну організацію (банк, державне управління, відомий бренд).
  • Рекомендована діяОстаточна рекомендація для користувача: блокувати, обережно, ігнорувати чи безпечно.

Цей аналіз є орієнтовним і генерується автоматично з внесків спільноти; він не замінює власного судження користувача й не є звинуваченням будь-якої конкретної компанії.

Модерація: ніщо не публікується без перегляду

Контроль якості — центральна частина методології. Скарги й коментарі не з’являються в публічному каталозі в момент надсилання: вони залишаються в очікуванні, доки адміністратор їх не схвалить. Лише тоді вони зараховуються до оцінки ризику, живлять аналіз ШІ та стають видимими для інших користувачів.

Ці модераційні ворота слугують двом цілям: вони відкидають хибні чи зловмисні скарги, перш ніж ті вплинуть на репутацію номера, і гарантують, що ШІ міркує лише над перевіреною інформацією. Автор скарги в очікуванні може бачити свій власний внесок, але ніхто інший, доки його не схвалять.

Джерела даних

Оцінка кожного номера поєднує три незалежних джерела:

  • Скарги спільнотиОснова всього. Користувачі скаржаться на номери із застосунку та вебу, анонімно, з категорією та коментарем. Після модерації вони є головним сигналом для оцінки.
  • Дані операторів і префіксів CNMCМи використовуємо публічні дані Національної комісії з ринків і конкуренції (CNMC), щоб визначити оператора, призначеного кожному блоку нумерації, і тип лінії (мобільна, стаціонарна, преміум-тариф).
  • Пресрелізи компаній (RSS)Ми стежимо за пресцентрами компаній через RSS-стрічки, щоб виявляти легітимні кампанії та зменшувати кількість хибних спрацювань, коли реальна компанія проводить масові комунікації.
Методологія — Як ми аналізуємо спам-номери | NoCall