Μεθοδολογία

Αυτή η σελίδα τεκμηριώνει πώς το NoCall μετατρέπει χιλιάδες αναφορές χρηστών σε μια αξιόπιστη αξιολόγηση για κάθε αριθμό τηλεφώνου. Εξηγούμε τον ακριβή τύπο της βαθμολογίας κινδύνου, τα επίπεδα κινδύνου, πώς ταξινομούμε τις κατηγορίες, πώς λειτουργεί η ανάλυσή μας με τεχνητή νοημοσύνη και από πού προέρχονται τα δεδομένα. Δημοσιεύουμε αυτή τη μεθοδολογία ώστε ο καθένας να μπορεί να κατανοήσει —και να αμφισβητήσει— τις αποφάσεις που παίρνει το σύστημα.

Πώς υπολογίζεται η βαθμολογία κινδύνου

Κάθε αριθμός στη βάση δεδομένων μας λαμβάνει μια βαθμολογία κινδύνου μεταξύ 0 και 100. Δεν είναι υποκειμενική κρίση: προκύπτει από έναν ντετερμινιστικό τύπο που υπολογίζεται εκ νέου κάθε φορά που φτάνει μια νέα εγκεκριμένη αναφορά.

κίνδυνος = min(100, αναφορές × 5 + (επαληθευμένο ? 30 : 0))

Κάθε εγκεκριμένη αναφορά προσθέτει 5 πόντους. Αν η ομάδα μας έχει επαληθεύσει τον αριθμό ως επιβεβαιωμένο spam, προστίθενται επιπλέον 30 πόντοι. Το αποτέλεσμα δεν ξεπερνά ποτέ το 100.

Ο παράγοντας επαλήθευσης υπάρχει για να ξεχωρίζει έναν αριθμό με πολλές πρόσφατες αναφορές (που θα μπορούσε να είναι ένα μεμονωμένο ψευδώς θετικό) από έναν αριθμό που ένας ανθρώπινος ελεγκτής έχει ενεργά επιβεβαιώσει ως καταχρηστικό. Γι' αυτό 20 μη επαληθευμένες αναφορές (100 πόντοι από αναφορές, με ανώτατο όριο) και 14 επαληθευμένες αναφορές (70 + 30) μπορούν να φτάσουν παρόμοιες βαθμολογίες από διαφορετικές διαδρομές.

Όταν ένας αριθμός έχει αναλυθεί από την τεχνητή νοημοσύνη μας και έχει εγκεκριμένες ενδείξεις από την κοινότητα, το εντοπισμένο επίπεδο κινδύνου λειτουργεί επίσης ως κατώφλι για τη βαθμολογία: ένας αριθμός που έχει επισημανθεί ως κρίσιμος δεν θα εμφανίζεται ποτέ κάτω από 90, ένας υψηλός κάτω από 70, ένας μέτριος κάτω από 45 και ένας χαμηλός κάτω από 20, ακόμη και με λίγες αναφορές. Έτσι ένα ξεκάθαρα δόλιο μοτίβο δεν υποτιμάται απλώς επειδή είναι πρόσφατο.

Επίπεδα κινδύνου

Από την αριθμητική βαθμολογία ταξινομούμε κάθε αριθμό σε ένα από τέσσερα επίπεδα κινδύνου. Αυτά είναι τα ίδια αναγνωριστικά που χρησιμοποιεί εσωτερικά η βάση δεδομένων μας:

Χαμηλό (bajo)0–39

Λίγες αναφορές ή καμία. Ο αριθμός δεν δείχνει σαφή σημάδια δραστηριότητας spam. Μπορεί να είναι μια νόμιμη γραμμή ή μια μεμονωμένη, μη επιβεβαιωμένη αναφορά.

Μέτριο (medio)40–59

Έχουν ληφθεί αρκετές αναφορές. Συνιστάται προσοχή πριν απαντήσετε ή καλέσετε ξανά. Η προεπιλεγμένη τιμή όταν η ένδειξη είναι ασαφής.

Υψηλό (alto)60–79

Πολυάριθμες επιβεβαιωμένες αναφορές. Υψηλή πιθανότητα επιθετικού τηλεμάρκετινγκ ή επαναλαμβανόμενων ανεπιθύμητων κλήσεων.

Κρίσιμο (critico)80–100

Αριθμός επαληθευμένος ως spam ή απάτη, ή αναγνωρισμένος από την τεχνητή νοημοσύνη ως εξαπάτηση ή πλαστοπροσωπία. Συνιστούμε να τον μπλοκάρετε αμέσως.

Κατηγορίες spam

Κάθε αναφορά και κάθε αριθμός ταξινομείται σε μία από επτά κατηγορίες. Η κατηγορία καθορίζει πώς παρουσιάζεται ο αριθμός στον κατάλογο και προκύπτει τόσο από την αναφορά του χρήστη όσο και από τη μεταγενέστερη αυτοματοποιημένη ανάλυση:

  • SPAMΓενικές, ανεπιθύμητες εμπορικές κλήσεις που δεν εμπίπτουν σε πιο συγκεκριμένη κατηγορία.
  • ΤΗΛΕΜΑΡΚΕΤΙΝΓΚΕκστρατείες τηλεφωνικών πωλήσεων, συνήθως τηλεπικοινωνιών ή ενέργειας, που επιμένουν παρά την άρνηση.
  • ΑΠΑΤΗΑπάτες και εξαπάτηση, συμπεριλαμβανομένης της πλαστοπροσωπίας ταυτότητας (τράπεζες, δημόσιοι φορείς, ψεύτικη τεχνική υποστήριξη). Η πιο σοβαρή κατηγορία.
  • ΟΦΕΙΛΗΚλήσεις είσπραξης οφειλών και ανάκτησης, συχνά επιθετικές ή προς λάθος άτομο.
  • ΠΑΡΕΝΟΧΛΗΣΗΕπαναλαμβανόμενες κλήσεις με σκοπό την παρενόχληση, τον εκφοβισμό ή τη σκόπιμη ενόχληση.
  • ΕΡΕΥΝΑΑνεπιθύμητες τηλεφωνικές έρευνες, δημοσκοπήσεις και έρευνες αγοράς.
  • ΑΛΛΟΟποιοσδήποτε άλλος τύπος ανεπιθύμητης κλήσης που δεν εμπίπτει στα παραπάνω.

Ανάλυση με τεχνητή νοημοσύνη

Πέρα από την αριθμητική βαθμολογία, ένας worker τεχνητής νοημοσύνης αναλύει τους αριθμούς με βάση το εγκεκριμένο από την κοινότητα περιεχόμενο: τα σχόλια και τις αναφορές που έχουν περάσει από τον έλεγχο. Η τεχνητή νοημοσύνη δεν επεξεργάζεται ποτέ μη εγκεκριμένο περιεχόμενο, οπότε καμία μη ελεγμένη συνεισφορά δεν μπορεί να επηρεάσει τη δημόσια ανάλυση.

Για κάθε αριθμό που αναλύεται, η τεχνητή νοημοσύνη δημιουργεί ένα δομημένο σύνολο πληροφοριών που εμφανίζεται στη σελίδα του αριθμού:

Τα πεδία που παράγει η ανάλυση είναι τα εξής:

  • ΠεριγραφήΜια σύνοψη σε φυσική γλώσσα του ποιος φαίνεται να βρίσκεται πίσω από τον αριθμό και τι θέλει.
  • Μοτίβα παραπόνωνΟι πιο επαναλαμβανόμενοι λόγοι παραπόνων στις αναφορές (για παράδειγμα, κλήσεις σε ακατάλληλες ώρες ή επιμονή μετά την άρνηση).
  • Τακτικές που χρησιμοποιούνταιΟι συγκεκριμένες τεχνικές που εντοπίζονται, όπως πίεση, ψεύτικο επείγον ή αιτήματα για προσωπικά δεδομένα.
  • ΤομέαςΟ τομέας στον οποίο ανήκει η δραστηριότητα (τηλεπικοινωνίες, ενέργεια, είσπραξη οφειλών, έρευνες κ.λπ.).
  • Εντοπισμένη εταιρείαΗ εταιρεία ή ο οργανισμός που ο αριθμός φαίνεται να εκπροσωπεί ή να πλαστοπροσωπεί, όταν μπορεί να αναγνωριστεί.
  • ΠλαστοπροσωπίαΜια ένδειξη για το αν ο αριθμός προσποιείται ότι είναι μια νόμιμη οντότητα (τράπεζα, δημόσια διοίκηση, γνωστή μάρκα).
  • Προτεινόμενη ενέργειαΗ τελική σύσταση για τον χρήστη: μπλοκάρισμα, προσοχή, αγνόηση ή ασφαλές.

Αυτή η ανάλυση είναι ενδεικτική και δημιουργείται αυτόματα από συνεισφορές της κοινότητας· δεν αντικαθιστά την κρίση του ίδιου του χρήστη ούτε αποτελεί κατηγορία κατά οποιασδήποτε συγκεκριμένης εταιρείας.

Έλεγχος: τίποτα δεν δημοσιεύεται χωρίς εξέταση

Ο έλεγχος ποιότητας είναι το επίκεντρο της μεθοδολογίας. Οι αναφορές και τα σχόλια δεν εμφανίζονται στον δημόσιο κατάλογο τη στιγμή που υποβάλλονται: παραμένουν σε αναμονή μέχρι να τα εγκρίνει ένας διαχειριστής. Μόνο τότε προσμετρώνται στη βαθμολογία κινδύνου, τροφοδοτούν την ανάλυση τεχνητής νοημοσύνης και γίνονται ορατά σε άλλους χρήστες.

Αυτή η πύλη ελέγχου εξυπηρετεί δύο σκοπούς: απορρίπτει ψευδείς ή κακόβουλες αναφορές πριν επηρεάσουν τη φήμη ενός αριθμού, και διασφαλίζει ότι η τεχνητή νοημοσύνη επεξεργάζεται μόνο ελεγμένες πληροφορίες. Ο συντάκτης μιας εκκρεμούς αναφοράς μπορεί να δει τη δική του συνεισφορά, αλλά κανείς άλλος, μέχρι να εγκριθεί.

Πηγές δεδομένων

Η αξιολόγηση κάθε αριθμού συνδυάζει τρεις ανεξάρτητες πηγές:

  • Αναφορές κοινότηταςΤο θεμέλιο των πάντων. Οι χρήστες αναφέρουν αριθμούς από την εφαρμογή και τον ιστό, ανώνυμα, με μια κατηγορία και ένα σχόλιο. Μετά τον έλεγχο, αποτελούν το κύριο σήμα για τη βαθμολογία.
  • Δεδομένα παρόχων και προθεμάτων της CNMCΧρησιμοποιούμε δημόσια δεδομένα από την Εθνική Επιτροπή Αγορών και Ανταγωνισμού (CNMC) για να αναγνωρίσουμε τον πάροχο που έχει ανατεθεί σε κάθε μπλοκ αρίθμησης και τον τύπο της γραμμής (κινητό, σταθερό, αυξημένης χρέωσης).
  • Δελτία τύπου εταιρειών (RSS)Παρακολουθούμε τα γραφεία τύπου των εταιρειών μέσω ροών RSS για να εντοπίζουμε νόμιμες εκστρατείες και να μειώνουμε τα ψευδώς θετικά όταν μια πραγματική εταιρεία πραγματοποιεί μαζικές επικοινωνίες.
Μεθοδολογία — Πώς αναλύουμε αριθμούς spam | NoCall