000 | 02700nam a2200337 i 4500 | ||
---|---|---|---|
001 | LEO01000000000000000037503 | ||
005 | 20171019180137.0 | ||
008 | 040514s2014 xxud r 000 0 eng d | ||
020 | _a9781118362082 | ||
040 |
_aUIALE _bspa _cUIALE _erda |
||
041 | 0 | _aeng | |
050 | 1 | 4 |
_aQ325.6 _bS24 2014 |
100 | 1 |
_aSchwartz, Howard M., _eautor. |
|
245 | 1 | 0 | _aMulti-agent Machine Learning : A Reinforcement Approach. |
246 | 1 | 0 | _aA Reinforcement Approach. |
250 | _aprimera edición. | ||
260 |
_aHoboken, New Jersey : _bWiley, _cc2014. |
||
300 |
_axi, 242 páginas : _bgráficas. |
||
336 |
_aTexto _btxt _2rdacontent |
||
337 |
_aSin medio _bn _2rdamedia |
||
338 |
_aVolumen _bnc _2rdacarrier |
||
500 | _aIncluye referencias es índice. | ||
520 | 3 | _aEl libro comienza con un capítulo sobre los métodos tradicionales de aprendizaje supervisado, cubriendo los mínimos cuadrados recursivos aprendizaje, significa métodos de error cuadrados, y la aproximación estocástica. Capítulo 2 cubre el aprendizaje único refuerzo agente. Los temas incluyen funciones de aprendizaje de valores, juegos de Markov, y TD aprendizaje con rastros de elegibilidad. Capítulo 3 se analizan dos jugadores, incluyendo dos juegos de matriz jugador con ambas estrategias puras y mixtas. Se presentan numerosos algoritmos y ejemplos. Capítulo 4 cubre el aprendizaje en los juegos multijugador, juegos estocásticos, y juegos de Markov, se centra en el aprendizaje de juegos multi-jugador y dos juegos de la red de rejilla jugador, Q-learning, y Nash Q-learning. Capítulo 5 discute juegos diferenciales, incluyendo juegos multi jugador diferenciales, estructura crítica actor, control difuso de adaptación y sistemas de interferencia difusos, el juego busca evasor, y la defensa de un territorio juegos. Capítulo 6 discute nuevas ideas sobre el aprendizaje dentro de enjambres robóticos y la innovadora idea de la evolución de los rasgos de personalidad. • Marco para la comprensión de una variedad de métodos y enfoques multi-agente de aprendizaje automático. • Discute los métodos de aprendizaje por refuerzo, como un número de formas de multi-agente Q-learning • Aplicable a la investigación profesores y estudiantes graduados que estudian ingeniería eléctrica e informática, ciencias de la computación y la ingeniería mecánica y aeroespacial. | |
650 | 1 | 4 | _aAprendizaje por refuerzo. |
650 | 2 | 4 | _aAprendizaje automático (Inteligencia artificial). |
650 | 2 | 4 | _aInteligencia artificial. |
650 | 2 | 4 | _aInteligencia de enjambre. |
650 | 2 | 4 | _aJuegos diferenciales. |
942 | _cBK | ||
999 |
_c37448 _d37448 |