- Используйте введённые ранее данные
- Отслеживайте статус заказа
- Сохраняйте историю заказа
- Получайте персонализированные предложения
Каталог
Товары для творчества
Восковые и пластиковые карандаши и мелки
Кисточки
Краски
Наборы для рисования
Смотреть все
Бумага и бумажная продукция
Бланки и сопутствующие материалы
Бумага для орг. техники
Ватман
Конверты
Смотреть все
Календари
Календари на магните
Календари на ригеле
Календари настенные
Календари настольные
Смотреть все
Народные художественные промыслы
Игрушки, прочие товары
Матрешки 10 и больше вложений
Матрешки 5-7 вложений
Ордена, медали, знаки отличия, награды
Смотреть все
Глубокое обучение с подкреплением. AlphaGo и другие технологии
0 отзывов
В избранное
16+
Код: ЦБ-00167316
Характеристики
ISBN
978-5-4461-1079-7
Год издания
2020
Тираж
700
Количество страниц
496
Переиздание
Нет
Вес нетто
634
Язык издания
Русский
Размеры изделия (ДxШxВ)
23x233x165
Серия
Описание
Эта книга — подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям.
Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения.
В этой книге
- Вы узнаете, какое место в контексте глубокого обучения занимают методы RL, реализуете сложные модели глубокого обучения.
- Изучите основу RL: марковские процессы принятия решений.
- Рассмотрите примеры реализации методов RL: метод кросс-энтропии, DQN, A3C, TRPO, PPO, DDPG, D4PG и других.
- Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах.
- Увидите, как разработать систему, обучающуюся играм Atari, используя обучение с подкреплением.
- Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента.
- Реализуете метод AlphaGo Zero для игры в Connect4.
- Познакомитесь с применением RL в обработке речи: узнаете, как обучить диалогового бота на фразах из кинофильмов.
Мы расскажем Вам про скидки и новинки!
Просто подпишитесь на наши рассылки
Другие книги серии
Вход
и регистрация
и регистрация
Войти
Зарегистрироваться
Выберите свой город
Москва
Санкт-Петербург
Анадырь
Архангельск
Астрахань
Барнаул
Белгород
Великий Новгород
Владивосток
Волгоград
Воронеж
Выборг
Екатеринбург
Ижевск
Иркутск
Казань
Калининград
Кемерово
Краснодар
Красноярск
Нижний Новгород
Новосибирск
Омск
Пермь
Петропавловск-Камчатский
Ростов-на-Дону
Рязань
Самара
Симферополь
Ставрополь
Сургут
Тула
Тюмень
Уфа
Хабаровск
Челябинск
Якутск
Ярославль
Выберите свой город из списка или воспользуйтесь поиском.
Если вы не можете найти свой город или населенный пункт — выберите ближайший найденый.
Если вы не можете найти свой город или населенный пункт — выберите ближайший найденый.
Связаться с нами
Ошибка
К сожалению сервис временно недоступен, просим повторить попытку позже