О книге
Книга посвящена промышленно-ориентированному применению обучения с подкреплением (Reinforcement Learning, RL). Объяснено, как обучать промышленные и научные системы решению любых пошаговых задач методом проб и ошибок – без подготовки узкоспециализированных учебных множеств данных и без риска переобучить или переусложнить алгоритм. Рассмотрены марковские процессы принятия решений, глубокие Q-сети, градиенты политик и их вычисление, методы устранения энтропии и многое другое. Данная книга – первая на русском языке, где теоретический базис RL и алгоритмы даны в прикладном, отраслевом ключе. Для аналитиков данных и специалистов по искусственному интеллекту.
    		Характеристики
    	
    	
    			Издательство:
    		
    		
    			БХВ    		
    	
    			Год издания:
    		
    		
    			-    		
    	
    			ISBN:
    		
    		
    			978-5-9775-6885-2    		
    	Отзывы
0Чтобы оставить отзыв или проголосовать, необходимо авторизоваться
 
    								