Raggruppamento di testi con la Propagazione di affinità di semi veloci migliorati
Il clustering dei testi è una tecnica essenziale nel text mining e nell'elaborazione del linguaggio naturale per organizzare grandi volumi di dati non strutturati in gruppi significativi. Gli algoritmi di clustering tradizionali devono spesso affrontare problemi di scalabilità, efficienza e accuratezza quando si tratta di dati testuali ad alta dimensionalità. Questo lavoro propone un approccio migliorato che utilizza la Novel Fast Seeds Affinity Propagation (NFAP) per migliorare le prestazioni del clustering. Introducendo una selezione ottimizzata dei semi, il metodo accelera la convergenza, riduce la complessità computazionale e migliora la qualità della formazione dei cluster. I risultati sperimentali dimostrano che il modello proposto raggiunge un'accuratezza e un'efficienza di clustering superiori rispetto ai metodi standard di propagazione dell'affinità, rendendolo adatto ad applicazioni di text mining su larga scala.
Edizioni Sapienza
978-620-9-68467-8

