martes, 10 de mayo de 2011

Actividad de programación 4 (Redes Neuronales)

Spam o No Spam 

1.    Breve descripción del medio ambiente.
El medio ambiente es un sistema anti spam en el cual se tratará de clasificar los correos como spam o no spam. El programa recibe de entrada un archivo de csv, el cual contiene los patrones de entrenamiento y otro archivo del mismo formato con los patrones de prueba. La aplicación luego de ser entrenada y probar los patrones te pregunta por mas patrones.

2.    Descripción detallada de la actividad o acción que va a aprender tu agente.
El agente aprende a discernir entre correo spam y el que no lo es

3.    Solución planteada al problema utilizando Redes Neuronales. Describe con detalle cada elemento del planteamiento:
a.    Patrones de aprendizaje a alimentar a la red.
i.      Los patrones de entrenamiento tiene el siguiente formato :
1.    Spamwords : 0.3,0.6,0.9
2.    Importantwords: 0.3,0.6,0.9
3.    Chain: 0.1,0.9
4.    Self: 0.1,0.9
5.    Si el mail incluye %: 0.1,0.9
6.    Level: 0.3,0.6,0.9
7.    Links:0.1,0.9
8.    Trusting: 0.3,0.6,0.9
b.    Codificación de la salida de la red.
Un numero entre 0 y 1. Si el numero esta proximo a 0.9 es spam y si esta proximo a 0.1 no es spam.
c.    Tipo de red neuronal a ser utilizada.
                                    Feed forward con backpropagation
d.    Numero de capas(entrada, intermedias,salida) y número de neuronas en cada capa.
3 capas entrada, intermedia(hidden) y salida. La capa de entrada tiene 8 neuronas, la intermedia tiene 3 y la salida tiene una.
e.    Parametros de la red (tasa de aprendizaje, momento, iteraciones).
Tasa de aprendizaje es de 0.15, la tasa del momento es 0.1 y las iteraciones son 20000

4.    Ejemplos de corridas:
La red debe de poder consultarse antes de ser entrenada y después de ser            entrenada.
i.      Consultas antes de ser entrenada
Patron [0.6, 0.9, 0.9, 0.1, 0.9, 0.9, 0.1, 0.3]
Respuesta 0.5
No es ni spam ni no spam


Patron [0.3, 0.3, 0.1, 0.9, 0.9, 0.3, 0.9, 0.9]
Respuesta 0.5
No es ni spam ni no spam

Patron [0.3, 0.3, 0.1, 0.9, 0.1, 0.9, 0.9, 0.3]
Respuesta 0.5
No es ni spam ni no spam


ii.     Consultas despues de ser entrenada
            Patron [0.6, 0.9, 0.9, 0.1, 0.9, 0.9, 0.1, 0.3]
Respuesta 0.944
            Es spam

            Patron [0.3, 0.3, 0.1, 0.9, 0.9, 0.3, 0.9, 0.9]
            Respuesta 0.026
            No es spam
           
            Patron [0.3, 0.3, 0.1, 0.9, 0.1, 0.9, 0.9, 0.3]
            Respuesta 0.98
            Es spam



       5. Conclusiones después de la programación.
                La programacion no fue tan dificil, lo dificil fue cambiar los valores de los patrones y elegir ejemplos representativos para los patrones de prueba.

No hay comentarios:

Publicar un comentario