El Proceso de Aprendizaje
Storyboard
Debido a la magnitud de datos involucrados, el aprendizaje no consiste en procesar sistemáticamente toda la información disponible. En su lugar, se seleccionan aleatoriamente grupos de datos con respuestas conocidas, y mediante un proceso iterativo, los criterios de respuesta se optimizan evaluando la precisión de las respuestas obtenidas. Existen técnicas específicas para acelerar este proceso, lo que permite culminar en la creación de un modelo. Este modelo incluye tanto la arquitectura (es decir, la red de nodos que realiza los cálculos y sus conexiones) como las funciones, los pesos de ponderación y los procesos de activación que ofrecen los mejores resultados.
ID:(4536, 0)
Los Datos Necesarios
Descripción
El proceso de estructurar una red neuronal se conoce como el aprendizaje de un sistema de inteligencia artificial. La calidad de este aprendizaje depende del modelo utilizado y, en particular, de la complejidad de las redes neuronales. Los sistemas de alta capacidad suelen incluir múltiples capas de nodos ocultos, lo que se denomina aprendizaje profundo.
Para realizar este aprendizaje, es esencial contar con una gran cantidad de datos correctamente etiquetados, es decir, con las respuestas esperadas asociadas a cada entrada.
En el aprendizaje supervisado, el sistema de inteligencia artificial accede a bases de datos extensas que incluyen tanto las características de entrada que podría encontrar en el futuro como las respuestas o etiquetas esperadas.
En el aprendizaje supervisado, estos datos son proporcionados externamente, mientras que en el aprendizaje no supervisado, el sistema puede generarlos de manera autónoma. Un ejemplo típico es el aprendizaje mediante juegos, donde el sistema aprende generando datos al jugar contra sí mismo.
Los datos de aprendizaje se dividen aleatoriamente en tres conjuntos. El primero, el más grande, se utiliza para entrenar el sistema; el segundo sirve para verificar la calidad del entrenamiento; y el tercero asegura que el sistema mantenga su objetividad al enfrentarse a datos completamente nuevos.
ID:(6037, 0)
La Selección de Datos
Descripción
Para comprender cómo el sistema ajusta sus parámetros durante el aprendizaje, se puede comparar este proceso con un análisis de regresión. En la regresión, se asume una función que depende de varios parámetros ajustados para aproximarse a los puntos medidos. Sin embargo, a diferencia de la regresión, en el aprendizaje de redes neuronales, la función misma se adapta dinámicamente mediante las funciones de activación.
Durante el aprendizaje, el sistema selecciona aleatoriamente subconjuntos de datos, incluyendo las respuestas correspondientes, para entrenarse de manera iterativa.
El sistema selecciona al azar un subconjunto de datos, buscando una respuesta adecuada para entrenar y ajustar el modelo.
Tras seleccionar un conjunto de datos, el modelo en su estado actual intenta generar una respuesta. Esta respuesta se evalúa mediante la función de pérdida, que mide la desviación respecto al resultado esperado. Si el error es significativo, se realiza una corrección en el modelo ajustando los parámetros de los nodos y los pesos de los enlaces.
El conjunto de datos es empleado para ajustar progresivamente la capacidad de respuesta del modelo, afinando sus parámetros con el objetivo de aproximarse al resultado correcto.
ID:(6038, 0)
La Propagación Hacia Adelante y Hacia Atrás
Descripción
Aunque el aprendizaje del modelo puede parecer un proceso de prueba y error, sigue un enfoque sistemático definido por algoritmos específicos. Para ilustrarlo, consideremos una analogía: un sistema de inteligencia artificial intenta salir de una habitación sin ver la puerta, pero cuenta con una función de pérdida que le indica si está avanzando en la dirección correcta.
Un caso hipotético en el que el sistema intenta salir de una habitación a ciegas, utilizando retroalimentación para tomar decisiones más precisas.
El sistema comienza recibiendo información inicial sobre su posición y realiza intentos para avanzar. Aunque no descarta todas las opciones, evita retroceder y, poco a poco, delimita un rango probable para la ubicación de la puerta. Este enfoque iterativo le permite, finalmente, "triangular" la posición de la salida, aprendiendo no solo a localizar puertas, sino a desarrollar un método general para resolver problemas similares en el futuro.
El sistema aprende de manera iterativa, detectando errores y ajustando su estrategia para encontrar la salida.
El aprendizaje se inicia con un proceso llamado propagación hacia adelante (forward propagation), en el que los datos fluyen desde la entrada hasta la salida. Luego, se aplica la propagación hacia atrás (backward propagation), un método que optimiza el modelo al calcular los errores en la salida y ajustar los parámetros de las capas anteriores. Este enfoque se asemeja a la manera en que los humanos resuelven problemas al partir de la solución y trabajar hacia atrás para comprender el proceso.
La retropropagación acelera el aprendizaje al ajustar parámetros con base en los errores detectados, optimizando así el camino hacia soluciones precisas.
ID:(6039, 0)
El Overfitting
Descripción
A medida que el sistema analiza datos, desarrolla reglas generales para resolver problemas futuros. Sin embargo, un entrenamiento excesivo con los mismos datos puede hacer que el sistema pierda su capacidad de generalización y se ajuste demasiado a los datos específicos del entrenamiento, lo que se conoce como sobreajuste (overfitting).
El sobreajuste ocurre cuando el modelo pasa de seguir una regla general representada por una línea negra a ajustarse excesivamente a los detalles específicos de la curva verde, lo que reduce su capacidad de generalización.
El término sobreajuste proviene de la teoría de regresión, donde el uso de demasiados parámetros ajustados a datos específicos puede deteriorar el rendimiento con nuevos datos. Para evitarlo, se emplea un conjunto de validación que detecta cuándo la precisión en los datos de entrenamiento mejora, pero el rendimiento en los datos de validación disminuye. Este punto indica que el modelo está perdiendo su capacidad de generalización y el proceso de aprendizaje debe detenerse.
Finalmente, la evaluación del modelo se realiza utilizando el conjunto de datos de prueba. Este paso permite determinar su calidad mediante métricas como la exactitud (proporción de respuestas correctas) y la precisión (confiabilidad de las respuestas correctas).
ID:(6040, 0)