Методологія

Ця сторінка документує, як NoCall перетворює тисячі скарг користувачів на надійну оцінку для кожного номера телефону. Ми пояснюємо точну формулу оцінки ризику, рівні небезпеки, як ми класифікуємо категорії, як працює наш аналіз на основі штучного інтелекту та звідки беруться дані. Ми публікуємо цю методологію, щоб будь-хто міг зрозуміти — і поставити під сумнів — рішення, які ухвалює система.

Як обчислюється оцінка ризику

Кожному номеру в нашій базі даних присвоюється оцінка ризику від 0 до 100. Це не суб’єктивне судження: воно випливає з детермінованої формули, яка перераховується щоразу, коли надходить нова схвалена скарга.

ризик = min(100, скарги × 5 + (підтверджено ? 30 : 0))

Кожна схвалена скарга додає 5 балів. Якщо наша команда перевірила номер як підтверджений спам, додається ще 30 балів. Результат ніколи не перевищує 100.

Фактор перевірки існує, щоб відрізнити номер із багатьма недавніми скаргами (що може бути разовим хибним спрацюванням) від номера, який людина-рецензент активно підтвердила як зловмисний. Саме тому 20 неперевірених скарг (100 балів від скарг, обмежено) і 14 перевірених скарг (70 + 30) можуть досягати схожих оцінок різними шляхами.

Коли номер проаналізовано нашим ШІ й він має схвалені сигнали спільноти, виявлений рівень небезпеки також діє як нижня межа для оцінки: номер, позначений як критичний, ніколи не показуватиметься нижче 90, високий — нижче 70, середній — нижче 45, а низький — нижче 20, навіть із кількома скаргами. Так явно шахрайський шаблон не недооцінюється лише тому, що він недавній.

Рівні небезпеки

За числовою оцінкою ми класифікуємо кожен номер на один із чотирьох рівнів небезпеки. Це ті самі ідентифікатори, які наша база даних використовує внутрішньо:

Категорії спаму

Кожна скарга й кожен номер класифікуються в одну з семи категорій. Категорія визначає, як номер показано в каталозі, і виводиться як зі скарги користувача, так і з пізнішого автоматичного аналізу:

SPAM — Загальні, небажані комерційні дзвінки, що не підпадають під конкретнішу категорію.
TELEMARKETING — Телефонні кампанії продажів, зазвичай телеком чи енергетика, що тривають попри відмову.
SCAM — Шахрайство й афери, зокрема видавання себе за іншого (банки, держоргани, фальшива технічна підтримка). Найсерйозніша категорія.
DEBT — Дзвінки зі стягнення та повернення боргів, часто агресивні чи спрямовані не на ту особу.
HARASSMENT — Повторювані дзвінки з метою переслідувати, залякувати чи навмисно турбувати.
SURVEY — Небажані телефонні опитування, анкети та маркетингові дослідження.
OTHER — Будь-який інший тип небажаного дзвінка, що не підпадає під вищезазначене.

Аналіз на основі штучного інтелекту

Окрім числової оцінки, ШІ-воркер аналізує номери на основі схваленого спільнотою контенту: коментарів і скарг, що пройшли модерацію. ШІ ніколи не працює з несхваленим контентом, тож жоден неперевірений внесок не може вплинути на публічний аналіз.

Для кожного проаналізованого номера ШІ генерує структурований набір інформації, що показується на сторінці номера:

Поля, які видає аналіз, такі:

Опис — Узагальнення природною мовою того, хто, схоже, стоїть за номером і чого вони хочуть.
Шаблони скарг — Найповторюваніші причини скарг у різних повідомленнях (наприклад, дзвінки в незручний час чи наполегливість після відмови).
Застосовані тактики — Конкретні виявлені прийоми, як-от тиск, фальшива терміновість чи запити персональних даних.
Сектор — Сфера, до якої належить діяльність (телеком, енергетика, стягнення боргів, опитування тощо).
Виявлена компанія — Компанія чи організація, яку номер, схоже, представляє чи за яку себе видає, коли це можна ідентифікувати.
Видавання себе за іншого — Індикатор того, чи номер удає легітимну організацію (банк, державне управління, відомий бренд).
Рекомендована дія — Остаточна рекомендація для користувача: блокувати, обережно, ігнорувати чи безпечно.

Цей аналіз є орієнтовним і генерується автоматично з внесків спільноти; він не замінює власного судження користувача й не є звинуваченням будь-якої конкретної компанії.

Модерація: ніщо не публікується без перегляду

Контроль якості — центральна частина методології. Скарги й коментарі не з’являються в публічному каталозі в момент надсилання: вони залишаються в очікуванні, доки адміністратор їх не схвалить. Лише тоді вони зараховуються до оцінки ризику, живлять аналіз ШІ та стають видимими для інших користувачів.

Ці модераційні ворота слугують двом цілям: вони відкидають хибні чи зловмисні скарги, перш ніж ті вплинуть на репутацію номера, і гарантують, що ШІ міркує лише над перевіреною інформацією. Автор скарги в очікуванні може бачити свій власний внесок, але ніхто інший, доки його не схвалять.

Джерела даних

Оцінка кожного номера поєднує три незалежних джерела:

Скарги спільноти — Основа всього. Користувачі скаржаться на номери із застосунку та вебу, анонімно, з категорією та коментарем. Після модерації вони є головним сигналом для оцінки.
Дані операторів і префіксів CNMC — Ми використовуємо публічні дані Національної комісії з ринків і конкуренції (CNMC), щоб визначити оператора, призначеного кожному блоку нумерації, і тип лінії (мобільна, стаціонарна, преміум-тариф).
Пресрелізи компаній (RSS) — Ми стежимо за пресцентрами компаній через RSS-стрічки, щоб виявляти легітимні кампанії та зменшувати кількість хибних спрацювань, коли реальна компанія проводить масові комунікації.