Descrição
Este estudo avalia uma abordagem de classificação hierárquica para detecção de
discurso de ódio em português, comparando estratégias planas e hierárquicas para
melhorar o desempenho das predições. Utilizou-se um corpus de 5.668 mensagens do
Twitter, anotado em 28 categorias organizadas em níveis, de classes gerais, como
racismo e sexismo, a subclasses específicas. Três experimentos foram realizados. O
primeiro, de classificação plana binária, identificou com eficiência a presença de discurso
de ódio, mas sem distinguir suas diferentes formas, resultando em análise limitada. O
segundo, de classificação plana multirrótulo, permitiu associar uma mensagem a várias
categorias, capturando interseccionalidades, mas gerou inconsistências, como a atribuição
de subcategorias sem a confirmação das categorias ancestrais. O terceiro aplicou
classificação hierárquica local por nó pai, em que a escolha de uma subclasse depende da
confirmação da classe pai, preservando a lógica da hierarquia e evitando contradições.
Assim, uma mensagem rotulada como mulheres gordas também foi corretamente
associada a mulheres e corpo. Apesar de apresentarem métricas globais semelhantes (f1-
score de 0,78), os resultados indicam que a abordagem hierárquica é mais robusta e
interpretável, garantindo coerência entre níveis e representação mais fiel da
complexidade do discurso de ódio. Conclui-se, portanto, que a hierarquia agrega valor
prático, especialmente em sistemas de moderação online automática que exigem
classificações consistentes e explicáveis.
| Selecione a modalidade do seu trabalho | Resumo Simples |
|---|