Clasificador de spam

calsificador de mensajes spam con un modelo de clasificador de códigos de salida con corrección de errores (fitcecoc)
1 Download
Updated 30 Jul 2025

View License

  1. Los datos de SPAM SMS es un conjunto de mensajes etiquetados, recopilados para la investigación. Contiene un conjunto de 5572 mensajes SMS en inglés, etiquetados en spam o ham, a los que se pueden acceder en el siguiente enlace: https://www.kaggle.com/datasets/uciml/sms-spam-collection-dataset
  2. Se hace una partición de los datos, donde el 80% corresponden a los de entrenamiento (textDataTrain) y el 20% corresponden a los datos de prueba (textDataTest).
  3. Por medio de la función wordcloud se representa graficamente, una nube de datos de los mensajes de entrenamiento y de prueba.
  4. Posteriormente se realiza una tokenización de los datos, lematización de palabras, borrado de signos de puntuación, eliminación de palabras vacías, eliminación de palabras con 2 o menos caracteres y palabras con 15 o más caracteres, por medio de removeInfrequentWords y removeEmptyDocuments.
  5. Se hace un entrenamiento del modelo por medio de la instrucción fitcecoc(XTrain, YTrain,'Learners','linear').
  6. Se realiza una prueba del modelo con los datos de prueba, donde se obtiene un índice de precisión acc = 0.9811.
  7. Se realiza una matriz de confusión de las clasificaciones en el modelo.
  8. Una nueva prueba se realiza con 20 nuevos datos, donde 10 corresponden a spam, y 10 a ham. De los cuales se detectaron 2 errores de clasificación (falsos negativos).

Cite As

Alejandro Mendez (2025). Clasificador de spam (https://uk.mathworks.com/matlabcentral/fileexchange/181665-clasificador-de-spam), MATLAB Central File Exchange. Retrieved .

MATLAB Release Compatibility
Created with R2025a
Compatible with any release
Platform Compatibility
Windows macOS Linux
Acknowledgements

Inspired by: spam-classifier-by-SVM

Community Treasure Hunt

Find the treasures in MATLAB Central and discover how the community can help you!

Start Hunting!
Version Published Release Notes
1.0.0