Методология

На этой странице описано, как NoCall превращает тысячи жалоб пользователей в надёжную оценку для каждого номера телефона. Мы объясняем точную формулу показателя риска, уровни опасности, как мы классифицируем категории, как работает наш анализ на основе искусственного интеллекта и откуда берутся данные. Мы публикуем эту методологию, чтобы любой мог понять — и поставить под сомнение — решения, которые принимает система.

Как рассчитывается показатель риска

Каждому номеру в нашей базе данных присваивается показатель риска от 0 до 100. Это не субъективная оценка: он выводится по детерминированной формуле, которая пересчитывается каждый раз при поступлении новой одобренной жалобы.

риск = min(100, жалобы × 5 + (подтверждено ? 30 : 0))

Каждая одобренная жалоба добавляет 5 баллов. Если наша команда подтвердила номер как заведомый спам, добавляется ещё 30 баллов. Результат никогда не превышает 100.

Фактор проверки нужен, чтобы отличить номер с множеством недавних жалоб (которые могут оказаться разовым ложным срабатыванием) от номера, который проверяющий человек активно подтвердил как недобросовестный. Поэтому 20 непроверенных жалоб (100 баллов от жалоб, с ограничением) и 14 проверенных жалоб (70 + 30) могут достичь схожих показателей разными путями.

Когда номер проанализирован нашим ИИ и имеет одобренные сигналы сообщества, выявленный уровень опасности также служит нижней границей показателя: номер, отмеченный как критический, никогда не покажет меньше 90, высокий — меньше 70, средний — меньше 45, а низкий — меньше 20, даже при небольшом числе жалоб. Так явно мошенническая схема не будет недооценена лишь потому, что она недавняя.

Уровни опасности

По числовому показателю мы относим каждый номер к одному из четырёх уровней опасности. Это те же идентификаторы, которые наша база данных использует внутри:

Низкий (bajo)0–39

Мало жалоб или их нет. Номер не показывает явных признаков спам-активности. Это может быть законная линия или единичная неподтверждённая жалоба.

Средний (medio)40–59

Получено несколько жалоб. Рекомендуется осторожность, прежде чем отвечать или перезванивать. Значение по умолчанию, когда сигнал неоднозначен.

Высокий (alto)60–79

Многочисленные подтверждённые жалобы. Высокая вероятность агрессивного телемаркетинга или повторяющихся нежелательных звонков.

Критический (critico)80–100

Номер подтверждён как спам или мошенничество либо определён ИИ как обман или подмена. Рекомендуем заблокировать его немедленно.

Категории спама

Каждая жалоба и каждый номер классифицируются в одну из семи категорий. Категория определяет, как номер представлен в каталоге, и выводится как из жалобы пользователя, так и из последующего автоматического анализа:

  • SPAMОбщие нежелательные коммерческие звонки, не подходящие под более конкретную категорию.
  • TELEMARKETINGКампании телефонных продаж, обычно телеком или энергетика, которые продолжаются несмотря на отказ.
  • SCAMМошенничество и обман, включая подмену личности (банки, госорганы, фальшивая техподдержка). Самая серьёзная категория.
  • DEBTЗвонки по взысканию и возврату долгов, часто агрессивные или адресованные не тому человеку.
  • HARASSMENTПовторяющиеся звонки с целью домогаться, запугивать или намеренно беспокоить.
  • SURVEYНежелательные телефонные опросы, голосования и маркетинговые исследования.
  • OTHERЛюбой другой тип нежелательного звонка, не подходящий под перечисленные.

Анализ на основе искусственного интеллекта

Помимо числового показателя, ИИ-обработчик анализирует номера на основе одобренного сообществом контента: комментариев и жалоб, прошедших модерацию. ИИ никогда не работает с неодобренным контентом, поэтому ни один непроверенный вклад не может повлиять на публичный анализ.

Для каждого проанализированного номера ИИ формирует структурированный набор сведений, отображаемый на странице номера:

Поля, которые формирует анализ, следующие:

  • ОписаниеКраткое изложение на естественном языке о том, кто, похоже, стоит за номером и чего он хочет.
  • Схемы жалобСамые повторяющиеся причины жалоб по всем сообщениям (например, звонки в неудобное время или настойчивость после отказа).
  • Используемые приёмыКонкретные обнаруженные методы, такие как давление, ложная срочность или запрос личных данных.
  • СекторОбласть, к которой относится деятельность (телеком, энергетика, взыскание долгов, опросы и т. д.).
  • Выявленная компанияКомпания или организация, которую номер, по-видимому, представляет или под которую маскируется, если её удаётся определить.
  • ПодменаПризнак того, выдаёт ли номер себя за законную организацию (банк, госорган, известный бренд).
  • Рекомендуемое действиеИтоговая рекомендация для пользователя: заблокировать, осторожно, игнорировать или безопасно.

Этот анализ носит ориентировочный характер и формируется автоматически на основе вкладов сообщества; он не заменяет собственное суждение пользователя и не является обвинением какой-либо конкретной компании.

Модерация: ничего не публикуется без проверки

Контроль качества — центральный элемент методологии. Жалобы и комментарии не появляются в публичном каталоге сразу после отправки: они остаются на рассмотрении, пока администратор их не одобрит. Только после этого они учитываются в показателе риска, питают анализ ИИ и становятся видимыми другим пользователям.

Этот барьер модерации служит двум целям: он отсеивает ложные или вредоносные жалобы до того, как они повлияют на репутацию номера, и гарантирует, что ИИ рассуждает только над проверенной информацией. Автор жалобы на рассмотрении видит свой собственный вклад, но больше никто — пока он не одобрен.

Источники данных

Оценка каждого номера сочетает три независимых источника:

  • Жалобы сообществаОснова всего. Пользователи сообщают о номерах из приложения и с сайта анонимно, с категорией и комментарием. После модерации они становятся главным сигналом для показателя.
  • Данные операторов и префиксов CNMCМы используем публичные данные Национальной комиссии по рынкам и конкуренции (CNMC), чтобы определить оператора, присвоенного каждому блоку нумерации, и тип линии (мобильная, стационарная, премиум-тариф).
  • Пресс-релизы компаний (RSS)Мы следим за пресс-центрами компаний через RSS-каналы, чтобы выявлять законные кампании и снижать число ложных срабатываний, когда реальная компания ведёт массовые рассылки.
Методология — как мы анализируем спам-номера | NoCall