Metodologi

Halaman ini mendokumentasikan bagaimana NoCall mengubah ribuan laporan pengguna menjadi penilaian yang andal untuk setiap nomor telepon. Kami menjelaskan rumus skor risiko yang tepat, tingkat bahaya, bagaimana kami mengklasifikasikan kategori, bagaimana analisis kecerdasan buatan kami bekerja, dan dari mana data berasal. Kami menerbitkan metodologi ini agar siapa pun dapat memahami —dan mempertanyakan— keputusan yang dibuat oleh sistem.

Bagaimana skor risiko dihitung

Setiap nomor di basis data kami diberi skor risiko antara 0 dan 100. Ini bukan penilaian subjektif: skor diperoleh dari rumus deterministik yang dihitung ulang setiap kali laporan baru yang disetujui masuk.

risiko = min(100, laporan × 5 + (terverifikasi ? 30 : 0))

Setiap laporan yang disetujui menambah 5 poin. Jika tim kami telah memverifikasi nomor tersebut sebagai spam yang dikonfirmasi, tambahan 30 poin ditambahkan. Hasilnya tidak pernah melebihi 100.

Faktor verifikasi ada untuk membedakan nomor dengan banyak laporan terbaru (yang bisa jadi positif palsu sekali waktu) dari nomor yang telah dikonfirmasi secara aktif sebagai penyalahgunaan oleh peninjau manusia. Itulah sebabnya 20 laporan yang tidak diverifikasi (100 poin dari laporan, dengan batas) dan 14 laporan yang diverifikasi (70 + 30) dapat mencapai skor serupa melalui jalur yang berbeda.

Saat sebuah nomor telah dianalisis oleh AI kami dan memiliki sinyal komunitas yang disetujui, tingkat bahaya yang terdeteksi juga bertindak sebagai batas bawah untuk skor: nomor yang ditandai sebagai kritis tidak akan pernah ditampilkan di bawah 90, tinggi di bawah 70, sedang di bawah 45, dan rendah di bawah 20, bahkan dengan sedikit laporan. Dengan cara ini, pola yang jelas-jelas curang tidak diremehkan hanya karena baru.

Tingkat bahaya

Dari skor numerik, kami mengklasifikasikan setiap nomor ke dalam salah satu dari empat tingkat bahaya. Ini adalah pengidentifikasi yang sama yang digunakan basis data kami secara internal:

Rendah (bajo)0–39

Sedikit laporan atau tidak ada. Nomor tidak menunjukkan tanda-tanda jelas aktivitas spam. Bisa jadi merupakan saluran yang sah atau laporan terisolasi yang tidak dikonfirmasi.

Sedang (medio)40–59

Beberapa laporan diterima. Disarankan berhati-hati sebelum menjawab atau menelepon balik. Nilai default saat sinyal ambigu.

Tinggi (alto)60–79

Banyak laporan yang dikonfirmasi. Kemungkinan besar telemarketing agresif atau panggilan tidak diinginkan yang berulang.

Kritis (critico)80–100

Nomor diverifikasi sebagai spam atau penipuan, atau diidentifikasi oleh AI sebagai kecurangan atau penyamaran. Kami menyarankan untuk segera memblokirnya.

Kategori spam

Setiap laporan dan setiap nomor diklasifikasikan ke dalam salah satu dari tujuh kategori. Kategori menentukan bagaimana nomor ditampilkan di direktori dan diperoleh baik dari laporan pengguna maupun dari analisis otomatis yang dilakukan kemudian:

  • SPAMPanggilan komersial generik yang tidak diinginkan dan tidak sesuai dengan kategori yang lebih spesifik.
  • TELEMARKETINGKampanye penjualan melalui telepon, biasanya telekomunikasi atau energi, yang terus berlanjut meskipun ditolak.
  • SCAMPenipuan dan kecurangan, termasuk penyamaran identitas (bank, badan publik, dukungan teknis palsu). Kategori paling serius.
  • DEBTPanggilan penagihan dan pemulihan utang, sering kali agresif atau ditujukan ke orang yang salah.
  • HARASSMENTPanggilan berulang yang dimaksudkan untuk melecehkan, mengintimidasi, atau dengan sengaja mengganggu.
  • SURVEYSurvei telepon, jajak pendapat, dan riset pasar yang tidak diminta.
  • OTHERJenis panggilan tidak diinginkan lainnya yang tidak sesuai dengan yang di atas.

Analisis kecerdasan buatan

Selain skor numerik, sebuah pekerja AI menganalisis nomor berdasarkan konten yang disetujui komunitas: komentar dan laporan yang telah lolos moderasi. AI tidak pernah bekerja dengan konten yang tidak disetujui, sehingga tidak ada kontribusi yang belum ditinjau yang dapat memengaruhi analisis publik.

Untuk setiap nomor yang dianalisis, AI menghasilkan kumpulan informasi terstruktur yang ditampilkan di halaman nomor tersebut:

Bidang yang dihasilkan oleh analisis adalah sebagai berikut:

  • DeskripsiRingkasan dalam bahasa alami tentang siapa yang tampaknya berada di balik nomor dan apa yang mereka inginkan.
  • Pola keluhanAlasan keluhan yang paling sering diulang di seluruh laporan (misalnya, panggilan pada jam yang tidak pantas atau ketekunan setelah penolakan).
  • Taktik yang digunakanTeknik spesifik yang terdeteksi, seperti tekanan, urgensi palsu, atau permintaan data pribadi.
  • SektorBidang aktivitas yang dimaksud (telekomunikasi, energi, penagihan utang, survei, dll.).
  • Perusahaan terdeteksiPerusahaan atau organisasi yang tampaknya diwakili atau disamarkan oleh nomor tersebut, jika dapat diidentifikasi.
  • PenyamaranIndikator apakah nomor berpura-pura menjadi entitas yang sah (bank, administrasi publik, merek terkenal).
  • Tindakan yang disarankanRekomendasi akhir untuk pengguna: blokir, hati-hati, abaikan, atau aman.

Analisis ini bersifat indikatif dan dihasilkan secara otomatis dari kontribusi komunitas; analisis ini tidak menggantikan penilaian pengguna sendiri maupun merupakan tuduhan terhadap perusahaan tertentu mana pun.

Moderasi: tidak ada yang diterbitkan tanpa peninjauan

Kontrol kualitas adalah inti dari metodologi. Laporan dan komentar tidak muncul di direktori publik saat dikirimkan: keduanya tetap tertunda sampai administrator menyetujuinya. Hanya setelah itu mereka diperhitungkan dalam skor risiko, mengisi analisis AI, dan menjadi terlihat oleh pengguna lain.

Gerbang moderasi ini melayani dua tujuan: membuang laporan palsu atau berbahaya sebelum memengaruhi reputasi sebuah nomor, dan memastikan AI hanya menalar atas informasi yang telah diperiksa. Penulis laporan yang tertunda dapat melihat kontribusinya sendiri, tetapi tidak ada orang lain, sampai laporan itu disetujui.

Sumber data

Penilaian setiap nomor menggabungkan tiga sumber independen:

  • Laporan komunitasFondasi dari segalanya. Pengguna melaporkan nomor dari aplikasi dan web, secara anonim, dengan kategori dan komentar. Setelah moderasi, laporan adalah sinyal utama untuk skor.
  • Data operator dan awalan CNMCKami menggunakan data publik dari Komisi Nasional untuk Pasar dan Persaingan (CNMC) untuk mengidentifikasi operator yang ditetapkan untuk setiap blok penomoran dan jenis saluran (seluler, telepon tetap, tarif premium).
  • Siaran pers perusahaan (RSS)Kami mengikuti ruang redaksi perusahaan melalui umpan RSS untuk mendeteksi kampanye yang sah dan mengurangi positif palsu saat sebuah perusahaan nyata menjalankan komunikasi massal.
Metodologi — Bagaimana kami menganalisis nomor spam | NoCall