Clasificador de spam
Version 1.0.0 (130 KB) by
Alejandro Mendez
calsificador de mensajes spam con un modelo de clasificador de códigos de salida con corrección de errores (fitcecoc)
- Los datos de SPAM SMS es un conjunto de mensajes etiquetados, recopilados para la investigación. Contiene un conjunto de 5572 mensajes SMS en inglés, etiquetados en spam o ham, a los que se pueden acceder en el siguiente enlace: https://www.kaggle.com/datasets/uciml/sms-spam-collection-dataset
- Se hace una partición de los datos, donde el 80% corresponden a los de entrenamiento (textDataTrain) y el 20% corresponden a los datos de prueba (textDataTest).
- Por medio de la función wordcloud se representa graficamente, una nube de datos de los mensajes de entrenamiento y de prueba.
- Posteriormente se realiza una tokenización de los datos, lematización de palabras, borrado de signos de puntuación, eliminación de palabras vacías, eliminación de palabras con 2 o menos caracteres y palabras con 15 o más caracteres, por medio de removeInfrequentWords y removeEmptyDocuments.
- Se hace un entrenamiento del modelo por medio de la instrucción fitcecoc(XTrain, YTrain,'Learners','linear').
- Se realiza una prueba del modelo con los datos de prueba, donde se obtiene un índice de precisión acc = 0.9811.
- Se realiza una matriz de confusión de las clasificaciones en el modelo.
- Una nueva prueba se realiza con 20 nuevos datos, donde 10 corresponden a spam, y 10 a ham. De los cuales se detectaron 2 errores de clasificación (falsos negativos).
Cite As
Alejandro Mendez (2025). Clasificador de spam (https://uk.mathworks.com/matlabcentral/fileexchange/181665-clasificador-de-spam), MATLAB Central File Exchange. Retrieved .
MATLAB Release Compatibility
Created with
R2025a
Compatible with any release
Platform Compatibility
Windows macOS LinuxTags
Acknowledgements
Inspired by: spam-classifier-by-SVM
Community Treasure Hunt
Find the treasures in MATLAB Central and discover how the community can help you!
Start Hunting!Discover Live Editor
Create scripts with code, output, and formatted text in a single executable document.
| Version | Published | Release Notes | |
|---|---|---|---|
| 1.0.0 |
