이 제출물을 팔로우합니다
- 팔로우하는 게시물 피드에서 업데이트를 확인할 수 있습니다
- 정보 수신 기본 설정에 따라 이메일을 받을 수 있습니다
- Los datos de SPAM SMS es un conjunto de mensajes etiquetados, recopilados para la investigación. Contiene un conjunto de 5572 mensajes SMS en inglés, etiquetados en spam o ham, a los que se pueden acceder en el siguiente enlace: https://www.kaggle.com/datasets/uciml/sms-spam-collection-dataset
- Se hace una partición de los datos, donde el 80% corresponden a los de entrenamiento (textDataTrain) y el 20% corresponden a los datos de prueba (textDataTest).
- Por medio de la función wordcloud se representa graficamente, una nube de datos de los mensajes de entrenamiento y de prueba.
- Posteriormente se realiza una tokenización de los datos, lematización de palabras, borrado de signos de puntuación, eliminación de palabras vacías, eliminación de palabras con 2 o menos caracteres y palabras con 15 o más caracteres, por medio de removeInfrequentWords y removeEmptyDocuments.
- Se hace un entrenamiento del modelo por medio de la instrucción fitcecoc(XTrain, YTrain,'Learners','linear').
- Se realiza una prueba del modelo con los datos de prueba, donde se obtiene un índice de precisión acc = 0.9811.
- Se realiza una matriz de confusión de las clasificaciones en el modelo.
- Una nueva prueba se realiza con 20 nuevos datos, donde 10 corresponden a spam, y 10 a ham. De los cuales se detectaron 2 errores de clasificación (falsos negativos).
인용 양식
Alejandro Mendez (2026). Clasificador de spam (https://kr.mathworks.com/matlabcentral/fileexchange/181665-clasificador-de-spam), MATLAB Central File Exchange. 검색 날짜: .
도움
도움 받은 파일: spam-classifier-by-SVM
| 버전 | 퍼블리시됨 | 릴리스 정보 | Action |
|---|---|---|---|
| 1.0.0 |
