Clasificador de spam
Version 1.0.0 (130 KB) by
Alejandro Mendez
calsificador de mensajes spam con un modelo de clasificador de códigos de salida con corrección de errores (fitcecoc)
- Los datos de SPAM SMS es un conjunto de mensajes etiquetados, recopilados para la investigación. Contiene un conjunto de 5572 mensajes SMS en inglés, etiquetados en spam o ham, a los que se pueden acceder en el siguiente enlace: https://www.kaggle.com/datasets/uciml/sms-spam-collection-dataset
- Se hace una partición de los datos, donde el 80% corresponden a los de entrenamiento (textDataTrain) y el 20% corresponden a los datos de prueba (textDataTest).
- Por medio de la función wordcloud se representa graficamente, una nube de datos de los mensajes de entrenamiento y de prueba.
- Posteriormente se realiza una tokenización de los datos, lematización de palabras, borrado de signos de puntuación, eliminación de palabras vacías, eliminación de palabras con 2 o menos caracteres y palabras con 15 o más caracteres, por medio de removeInfrequentWords y removeEmptyDocuments.
- Se hace un entrenamiento del modelo por medio de la instrucción fitcecoc(XTrain, YTrain,'Learners','linear').
- Se realiza una prueba del modelo con los datos de prueba, donde se obtiene un índice de precisión acc = 0.9811.
- Se realiza una matriz de confusión de las clasificaciones en el modelo.
- Una nueva prueba se realiza con 20 nuevos datos, donde 10 corresponden a spam, y 10 a ham. De los cuales se detectaron 2 errores de clasificación (falsos negativos).
Cite As
Alejandro Mendez (2026). Clasificador de spam (https://uk.mathworks.com/matlabcentral/fileexchange/181665-clasificador-de-spam), MATLAB Central File Exchange. Retrieved .
MATLAB Release Compatibility
Created with
R2025a
Compatible with any release
Platform Compatibility
Windows macOS LinuxTags
Acknowledgements
Inspired by: spam-classifier-by-SVM
Discover Live Editor
Create scripts with code, output, and formatted text in a single executable document.
| Version | Published | Release Notes | |
|---|---|---|---|
| 1.0.0 |
