方法論

このページでは、NoCall が何千ものユーザー報告をどのようにしてすべての電話番号に対する信頼性の高い評価へと変換しているかを説明します。リスクスコアの正確な計算式、危険度レベル、カテゴリの分類方法、人工知能による分析の仕組み、そしてデータの出所について解説します。誰もがシステムの下す判断を理解し、そして疑問を呈することができるよう、私たちはこの方法論を公開しています。

リスクスコアの算出方法

データベース内のすべての番号には 0 から 100 までのリスクスコアが付与されます。これは主観的な判断ではありません。新しい承認済み報告が届くたびに再計算される、決定論的な計算式から導き出されます。

リスク = min(100, 報告件数 × 5 + (確認済み ? 30 : 0))

承認済みの報告ごとに 5 ポイントが加算されます。私たちのチームがその番号を確定したスパムとして検証済みの場合、さらに 30 ポイントが加算されます。結果が 100 を超えることはありません。

検証係数は、最近多くの報告を受けた番号（一度きりの誤検出の可能性があります）と、人間のレビュアーが実際に悪質であると確認した番号とを区別するために存在します。そのため、未検証の報告 20 件（報告から 100 ポイント、上限に達する）と検証済みの報告 14 件（70 + 30）は、異なる経路で同程度のスコアに達することがあります。

番号が私たちの AI によって分析され、承認済みのコミュニティシグナルを持つ場合、検出された危険度レベルもスコアの下限として作用します。重大とフラグ付けされた番号は、報告が少なくても 90 を下回ることはなく、高は 70、中は 45、低は 20 を下回ることはありません。こうして明らかに不正なパターンが、単に最近のものであるという理由で過小評価されることはありません。

危険度レベル

数値スコアから、各番号を 4 つの危険度レベルのいずれかに分類します。これらは私たちのデータベースが内部で使用しているのと同じ識別子です。

スパムカテゴリ

すべての報告とすべての番号は、7 つのカテゴリのいずれかに分類されます。カテゴリは番号がディレクトリでどのように表示されるかを決定し、ユーザーの報告とその後の自動分析の両方から導き出されます。

SPAM — より具体的なカテゴリに当てはまらない、一般的で望まれない営業電話。
TELEMARKETING — 通常は通信または電力に関する電話セールスキャンペーンで、拒否しても続くもの。
SCAM — 詐欺や不正行為。なりすまし（銀行、公的機関、偽のテクニカルサポート）を含みます。最も深刻なカテゴリです。
DEBT — 借金の取り立てや回収の電話。しばしば攻撃的、または間違った相手に向けられたもの。
HARASSMENT — 嫌がらせ、威圧、または意図的に迷惑をかけることを目的とした繰り返しの電話。
SURVEY — 求めていない電話アンケート、世論調査、市場調査。
OTHER — 上記に当てはまらないその他の種類の迷惑電話。

人工知能による分析

数値スコアに加えて、AI ワーカーがコミュニティで承認されたコンテンツ（モデレーションを通過したコメントと報告）に基づいて番号を分析します。AI は承認されていないコンテンツを扱うことは決してないため、レビューされていない投稿が公開分析に影響を与えることはありません。

分析された各番号について、AI は番号のページに表示される構造化された情報のセットを生成します。

分析が生成するフィールドは次のとおりです。

説明 — その番号の背後にいると思われる人物と、その目的を自然言語で要約したもの。
苦情のパターン — 報告全体で最も繰り返される苦情の理由（例えば、非常識な時間帯の電話や、拒否後もしつこく続くことなど）。
使用された手口 — 圧力、偽りの緊急性、個人情報の要求など、検出された具体的な手法。
業種 — その活動が属する分野（通信、電力、債権回収、アンケートなど）。
検出された企業 — 番号が代表または偽装していると思われる企業や組織。識別できる場合に表示されます。
なりすまし — その番号が正当な機関（銀行、行政、有名ブランド）を装っているかどうかの指標。
推奨される対応 — ユーザーへの最終的な推奨：ブロック、注意、無視、または安全。

この分析は参考用であり、コミュニティの投稿から自動的に生成されたものです。ユーザー自身の判断に代わるものではなく、特定の企業に対する告発を構成するものでもありません。

モデレーション：レビューなしに公開されるものはありません

品質管理は方法論の中核です。報告やコメントは、送信された瞬間に公開ディレクトリに表示されるわけではありません。管理者が承認するまで保留状態のままです。承認されて初めて、それらはリスクスコアに反映され、AI 分析に取り込まれ、他のユーザーに表示されるようになります。

このモデレーションのゲートには 2 つの目的があります。番号の評判に影響を与える前に虚偽または悪意のある報告を排除すること、そして AI が精査された情報のみに基づいて推論することを保証することです。保留中の報告の投稿者は自分自身の投稿を見ることができますが、承認されるまで他の誰にも見えません。

データの出所

各番号の評価は、3 つの独立した情報源を組み合わせています。

コミュニティ報告 — すべての基盤です。ユーザーはアプリやウェブから、匿名で、カテゴリとコメントを付けて番号を報告します。モデレーションを経て、これらがスコアの主要なシグナルとなります。
CNMC の事業者およびプレフィックスのデータ — 国家市場競争委員会（CNMC）の公開データを使用して、各番号ブロックに割り当てられた事業者と回線の種類（携帯電話、固定電話、プレミアムレート）を識別します。
企業のプレスリリース（RSS） — 企業のニュースルームを RSS フィードで追跡し、正当なキャンペーンを検出して、実在する企業が大規模な通信を行っている場合の誤検出を減らします。