in

La evolución de AlphaGo to MuZero

1lhIGimngzFRsdDGY3v8 uw

La evolución de AlphaGo to MuZero

El algoritmo MuZero de DeepMind alcanza una habilidad sobrehumana en 57 juegos diferentes de Atari. ¡Este artículo explicará el contexto que lo condujo!

Connor acortar

17 de enero de 2020·8 min de lectura

1*P8mOMhYz6lrfl3afRsIDNg

Chess, Go y Shogi vienen con un simulador que sabe cómo
1*RBz39wnkO9eniB2 mzyfEA

La planificación integrada amplía el encuadre de los problemas de aprendizaje por refuerzo
1*m9vkY9HRpfCA9EJSLl2MGg

Búsqueda de árboles de Monte Carlo de MuZero
1*ynAs03NRe cz6oBC9l H w

Un ejemplo de RL basado en modelos que reconstruye el espacio de píxeles en el modelo. Imagen tomada de: https://worldmodels.github.io/

AlphaGo

1*sycPq0SfiUjEASNOENJXkQ

1*YmmFO1seK7q P0FrEZ OrA

AlphaGo Zero

1*bzd7rqTw

1*Fb1zutdoVskZEPa7 y2sQQ

AlphaZero

1*YZfdt1WHWB1kllQtvHuKBg

1*CyzF5KT0B jQsEN79tGUOA

1*5rGuVf2bubbo5pXYsKDKtA

MuZero

1*UfX gcQkO8Y9e1l4alky0w

AlphaGo → AlphaGo Zero → AlphaZero → MuZero

Enlaces de papel

1*lhIGimngzFRsdDGY3v8 uw

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

movil mano hangouts app

¿Cómo sé si alguien ha iniciado sesión en Hangouts?

obic industries financial services

Monitoreo de transacciones: cumplimiento de AML y delitos financieros