Actividad de Programación 5 (Redes Neuronales)
Equipo 666: Tectrón
Medio Ambiente
Para este proyecto se cambió el medio ambiente, el medio anterior siendo el juego “Planet Wars” utilizado en el concurso de inteligencia artificial de Google. El nuevo medio es el popular juego de Gato; en este juego se tiene un tablero dividido en tres filas y tres columnas, lo cual forma nueve casillas; cada casilla puede ser llenado por dos símbolos distintos,cada uno propio de un jugador lo que quiere decir que un jugador en un juego dado no podrá llenar una casilla con otra cosa que no sea su símbolo. El juego se juega por turnos y termina cuando alguno de los dos jugadores logra completar una línea en cualquier orientación (i.e. horizontal, vertical o diagonal) con sus símbolos.
Actividad que el Agente Aprenderá: El agente aprenderá a identificar los patrones de dentro de un juego de su contrincante
Solución Planteada
Patrones de Aprendizaje: son los tableros en sí, los cuales almacenan casillas y la posición de las tiradas que han sido realizadas.
Codificación de la salida: La salida esta codificada como un nuevo tablero con la tirada que ha realizado el agente.
Tipo de red Neuronal Utilizada: El tipo de red neuronal utilizada es de Back-Propagation estocástica.
Numero de Capas y Numero de neuronas por Capa
El agente utiliza X capas, a continuación se presenta cuantas neuronas componen cada capa:
· Capa 1->18 neuronas que reciben los patrones (entrada).
· Capa 2-> 36 neuronas que trabajan para determinar la salida óptima (intermedia).
· Capa 3-> 9 neuronas que trabajan para determinar la posición de la tirada exitosa en el tablero (salida).
Parámetros de la Red
La red neuronal tenía los siguientes parámetros:
· Tasa de aprendizaje: es variable, con valores entre 0 y 1; el valor usado comúnmente para las pruebas es de 0.1.
· Momento: es variable, con valor entre 0 y 1. El valor comúnmente usado para las pruebas es de .8
· Iteraciones: es variable, aunque el ideal es hasta que no haya nada que aprender, esta condición fue la usada para las pruebas.
Conclusiones
Después de programar la red neuronal podemos concluir que si sirve para esta tarea, así como para muchas otras, ya que detecto eficientemente los patrones y se modificaron los pesos de la función, modificando a su vez la respuesta del agente.
Pedimos disculpas pero por cuestiones de tiempo no se pudo generar y adjuntar el vídeo de las corridas a este post, ese se presentara en un post posterior este mismo dia.