Catégories et Classification de contenus Bodyguard

Vous trouverez ici un guide détaillant les différentes catégories et classifications Bodyguard.

Sommaire

Bodyguard.ai maps content using 3 types of classifications:

Bodyguard.ai cartographie les contenus en se basant sur trois types de classifications :

Les classifications générales
Les classifications additionnelles (pour un usage de supervision statistique seulement)
Les classifications personnalisées (pour un usage de supervision statistique seulement)

Les classifications générales

Dash - categories

Pour faciliter la gestion des filtres, les classifications de contenus appartiennent chacune à une catégorie. Ce sont celles qui apparaissent en haut de votre page Analytics :

Catégorie "Neutre" : commentaires appropriés qui ne contiennent pas de contenu jugé comme problématique ou positif.
Catégorie "Positif" : contenu exprimant de l'approbation ou du soutien à un individu, un groupe ou une entité.
Catégorie "Discours de haine" : contenu associé à la promotion de la discrimination de comportements hostiles ou violents envers un individu ou un groupe défini par leur ethnicité, religion, orientation sexuelles ou autres facteurs.
Catégorie "Haine" : contenu détecté comme agressif, dénigrant ou condescendant à l'encontre d'un individu, d'un groupe ou d'une entité.
Catégorie "Critique" : contenu exprimant la désapprobation de quelque chose ou quelqu'un.
Catégorie "Indésirable" : contenu détecté comme répétitif, embêtant, inutile, non pertinent ou potentiellement frauduleux.

Les différentes classifications et catégories de contenu

Que ce soit à des fins de visualisation ou de modération, les contenus sont analysés et triés par catégorie. Vous trouverez le détail ci-dessous :

Catégorie "Neutre"

Nous classons les contenus de la catégorie "Neutral" en 6 classifications :

Celle-ci englobe les classifications:
- Neutral (Neutre): Des commentaires qui ne présentent aucun contenu favorable ou problématique
  - "il va pleuvoir"
- Vulgarity (Vulgarité) : Un langage qui peut être déplaisant, offensant ou obscène pour la société.
  - "Sa mèèèère comment c'était un putain de bon match !
- Sexually Explicit (Sexuellement explicite): Tout type de commentaire qui parle ou détaille des actes sexuels et des organes génitaux.
  - "Si les autres citoyens européens aiment se faire sodomiser, tant mieux pour eux. Moi j'ai toujours une préférence pour le vagin"
- Drug explicit (Drogue explicite): Tout type de commentaire qui parle ou encourage l'usage de drogues
  - "Mp si ça cherche des 20balles par ici, teh ou beuh"
- Weapon explicit (Arme explicite): Tout type de commentaire qui parle ou encourage l'utilisation d'armes.
  - "bien sur je sais ou trouver des kalash"

- PII (IPI): Le fait pour une personne de publier, volontairement ou involontairement, ses informations personnelles identifiables (IPI) en ligne.
  - "J'habite au 6 rue des moulins à Paris."
- Link (Lien): Commentaires contenant un lien vers une autre page ou un autre site
- Geopolitical (Géopolitique): Les commentaires qui parlent ou donnent des opinions concernant la politique, en particulier les relations internationales, telles qu'elles sont influencées par des facteurs géographiques.
  - "www.bodyguard.ai"
- Underage user (Utilisateur mineur): Un commentaire dans lequel l'utilisateur révèle ou fait comprendre être mineur
  - "alors déjà j'ai 11 ans et demi"

Cette classification peut être configurée selon votre définition et vos préférences d'âge : under 13, under 16 or under 18.

- Dating (Drague): Commentaires explicitant l'intention d'un itilisateur de prendre part à une relation romantique ou sexuelle.
  - "pas de soucis, tu peux venir chez moi bébé et on fera ce que tu veux"
- Terrorism reference (référence au terrorisme): Commentaires qui mentionnent explicitement ou font référence à des actes de terrorisme, à des organisations terroristes spécifiques ou à des personnes associées à ces groupes.
- Pedophilia Reference (référence à la pédophilie): Commentaires référant des abus ou activités illégales avec des persdonnes mineures.
  - "il est question d'une personne ayant détourné des enfants de moins de 16 ans"
- Politics: les commentaires liés ou mentionnant le gouvernement, les partis politiques et les personnalités politiques.
- Cybersecurity: Commentaires liés au sujet de sécurité digitales.
  - "La puissance d’une attaque par phishing c’est une dinguerie quand même"
- Finance: Commentaires traitant d'enjeux monétaires et économiques, particulièrement la gestion, l'impact ou l'éthique de pratiques financières.

Catégorie "Positif"

Dash -positive classifiications

On distingue 3 classifications de commentaires "Positive"
- Supportive (Supportif): Commentaires montrant de la considération pour un utilisateur ou pour son contenu
  - "Super, ta vidéo !"
- Fair Play: L'acte ou le fait de respecter les règles, comme dans les sports ou les jeux ; l'équité et l'honneur dans les relations avec les concurrents, les clients, etc
  - "Bien joué les gars !"
- Encouragement : Commentaires donnant votre soutien à un individu ou une entité
  - "Allez les gars, on croit en vous !"

Catégorie "Discours de haine"

Dash - hate speech classifiications

La catégorie Hate Speech englobe les classifications:
- Threats (Menaces) : Commentaires visant à intimider ou à effrayer une autre personne en la menaçant de faire quelque chose qui la mettra en danger mentalement ou physiquement.
  - "J'vais te choper et je vais t'éclater toi et toute ta miff"
- Sexual Harassment (Harcèlement sexuel): Commentaires sexuels déplacés et inappropriés sur l'apparence physique d'une personne ou tentatives d'approche d'une personne de manière sexuelle.
  - "Aller fais pas ta timide, enlève ton haut"
- Moral Harassment (Harcèlement moral) : Commentaires et comportements abusifs visant à rabaisser et à humilier une personne.
  - "toute ta vie t'es inutile toi, suicide toi c'est mieux"
- Racism (Racisme) : Tout type de discrimination ou de préjudice à l'encontre d'individus en raison de leur appartenance à un groupe racial ou ethnique particulier, généralement minoritaire ou marginalisé.
  - "tous les mêmes ces débiles de 🐵"
- LGBTQIA+Phobia (LGBTQIA+Phobie): Tout type de discrimination ou de préjugé à l'égard des personnes qui s'identifient comme membres de la communauté LGBTQIA+ ; cela inclut les commentaires ou les comportements visant des personnes non LGBTQ+ qui représentent néanmoins des attitudes haineuses LGBTQ+phobes.
  - "ça me dégoute, ça se voit que c'est un trans prenez des gens normaux"
- Ableism (Capacitisme) : Tout type de discrimination ou de préjugé à l'égard des personnes présentant un handicap.
  - "Les paralympiques c'est ridicule"
- Misogyny (Misogynie) : Tout type de discrimination ou de préjugé à l'égard des femmes, y compris les commentaires qui ne visent pas une femme en particulier mais qui représentent néanmoins des attitudes patriarcales et transphobes haineuses.
  - "retourne à la cuisine au lieu de parler foot meuf"
- Self-Harm (Automutilation): Commentaire mentionnant un comportement intentionnel de prendre ou de vouloir prendre des mesures nuisibles envers son propre corps.
  - "j'en peux plus, je préfère en finir que de continuer à vivre comme ça"

Même s'ils sont dans la catégorie 'discours de haine', les commentaires classifiés comme 'self harm' ne sont pas supprimés.

- Terrorism and violent extremism (Terrorisme et extrémisme violent): Commentaire qui implique l'intimidation ou la coercition de populations ou d'autorités par la menace de perpétrer des actions violentes pouvant engendrer blessures, prises d'otage ou décès.
  - "Il aurait du en tuer plus, ils sont impurs c'est tout ce qu'ils méritent"
- Pedophilia: Tout commentaire qui comprend ou fait la promotion d'intérêt sexuel envers des personnes mineures.
  - "t'as beau avoir 12 ans tu m'excites déjà"

Catégorie "Haine"

Dash - hateful classifiications

La catégorie Hateful englobe les classifications:
- Insult (Insulte) : Langage irrespectueux ou abusif à l'encontre d'une personne.
  - "va te faire foutre connard"
- Hatred (Haine) : Les commentaires qui visent à insulter ou à blesser un individu, un groupe ou une entité, représentant une attitude d'hostilité fondamentale envers la cible.
  - "comment je le déteste fort"
- Body Shaming (Moquerie sur le physique): Tout type de discrimination ou de préjugé à l'égard de l'apparence physique d'une personne ou de ses modifications physiques.
  - "arrêtez de dire qu'elle est belle, elle est just grosse"
- Trolling (Troll) : Le fait de poster des messages déconcertants et manipulateurs dans le but de provoquer une réaction.
  - "t'as le seum on dirait un belge à la coupe du monde"
- Doxxing : Forme de harcèlement en ligne consistant à trouver et à publier, ou à menacer de publier, les informations personnelles d'une personne sans son consentement. Il est souvent utilisé comme une tactique d'intimidation ou d'abus, ainsi que comme une forme de vengeance.
  - "venez on l'appelle tous les jours, vla son num 0653827302"
- Reputation harm: Commentaires visant à nuire à la réputation d'une marque ou d'un individu.
  - "[Nom de la marque] a pris un virage antisémite"

Catégorie "Critique"

Bodyguard détecte également les commentaires de Catégorie "Criticism".
- Negative criticism (Critique négative): les commentaires offrant des critiques à l'utilisateur sans intention de lui nuire.
  - "Je ne suis pas du tout fan de son travail et je n'apprécie pas non plus le personnage."
- Boycott: Commentaires incitant d'autres utilisateurs à ne plus acheter ou soutenir un produit ou une marque.
  - "N'allez pas acheter de sac chez [Marque], ils ne méritent pas notre soutien après tout ce qu'ils ont fait! "

Catégorie "Indésirable"

Dash - undesirable classifiications

Nous distinguons également 5 classifications de commentaires "Undesirable" qui polluent un espace communautaire :

La catégorie Undesirable englobe les classifications :
- Useless (Inutile): Commentaires sans contenu significatif qui n'ajoutent rien à la conversation ou ne l'enrichissent pas.
  - "premier commentaire"
- Scam : Tout type de message encourageant l'utilisateur à visiter une page externe (n'importe quelle page, site web) sans rapport avec la plateforme d'où provient le message, dans le but d'extorquer de l'argent à un utilisateur.
  - "argent facile sur www.devenirmillionaire.fr"
- Spam : Commentaires indésirables envoyés de façon répétée à un grand nombre de personnes.

Nous ne donnons pas d'exemple de 'spam' car leur classification se fait selon des règles automatiques permettant de détecter des schémas de comportement.

- Flood : Commentaire destiné à perturber le fonctionnement normal d'un medium comme la publication massive de textes insensés.
  - "ooooooooooooooooooooooo"
- Ads (Publicités): commentaires incluant de la promotion de contenus ou d'individus sans lien avec le sujet traité ou l'utilisateur.
  - "venez me donnez de la force sur ma chaîne il me faut des abos"

2. Les classifications additionnelles

Les classifications additionnelles sont des classifications de contenu métier permettant aux utilisateurs de prendre des décisions éclairées au travers de statistiques communautaires.

Développées pour correspondre à chaque secteur d'activité et à ses besoins spécifiques, notre équipe NLP a travaillé sur des classifications dédiées aux marques de Luxe, du sport, d'applications ou encore du gaming.

Environment: Commentaires exprimant des inquiétudes ou des accusations quant au respect des normes écologiques de la fabrication des produits d'une marque.
Plagiarism: Commentaires exprimant des inquiétudes ou des accusations envers une marque quant à la copie ou au vol de certains concepts, idées ou produits.
Customer complaint: Commentaires impliquant des critiques envers la marque, ses représentants ou les produits ou services qu'elle propose.
Customer satisfaction: Commentaires impliquant des compliments envers la marque, ses représentants ou les produits ou services qu'elle propose.
Customer request: Commentaires contenant des demandes d'assistance ou requêtes de clients de la marque.
Pricing: Commentaires comprenant des critiques concernant les prix pratiqués par la marque.
Animal wellbeing: Commentaires exprimant une préoccupation concernant l'utilisation de produits d'origine animale ou faisant campagne contre cette utilisation par une marque.
Cultural appropriation: Commentaires accusant la marque de vol conceptuel ou culturel d'une culture ou d'une communauté historiquement marginalisée.
Betting: Commentaires contenant un lien vers des sites illicites de paris sportifs en ligne.
Illegal streaming: Commentaires contenant un lien vers des sites de streaming illégal d'événement sportif.
Pricing: Commentaires comprenant des critiques concernant les prix pratiqués par la marque (produits, services, merch,...)
Sexting: Commentaires à portée sexuelle à propos du physique d'une personne, ou incitation ou invitation à des actes sexuels.

Les classifications additionnelles sont incluses dans notre plan avancé de pricing. Pour les activer, contactez notre équipe Customer Sucess.

3. Les classifications personnalisées

Une classification personnalisée est une classification demandée par un client pour répondre à un besoin métier spécifique à son activité. Elles répondent à un besoin de supervision, et ne déclenchent aucune action de modération automatique. Comme les autres, les classifications personnalisées sont développées en interne par notre équipe de linguistes, dans toutes les langues premium.

Avant leur développement, chaque demande est étudiée par notre équipe afin d'évaluer leur faisabilité. Suite à la validation, le développement d'une classification personnalisée peut prendre jusqu'à deux semaines.

Les classifications personnalisées sont disponibles sur demande en tant que service additionel. Pour en ajouter, contactez notre équipe Customer Success.