强化学习:原理与Python实现在线阅读
会员

强化学习:原理与Python实现

肖智清
开会员,本书免费读 >

计算机网络编程语言与程序设计12.2万字

更新时间:2019-10-11 15:10:40 最新章节:12.3 本章小结

立即阅读
加书架
下载
听书

书籍简介

全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强化学习算法,结合TensorFlow实现源码。第三部分介绍强化学习综合应用案例。
品牌:机械工业出版社
上架时间:2019-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清
主页
  • 会员
    本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理
    肖智清人工智能17.2万字

同类热门书

最新上架

  • 会员
    本书详细讲解JavaEE中Spring、SpringMVC和MyBatis三大框架(以下简称SSM)的基本知识和应用。本书在对知识点进行描述时采用了大量案例,以便读者理解SSM的核心技术。本书共15章,第1~5章主要讲解MyBatis的相关知识,包括初识MyBatis框架、MyBatis的核心配置、动态SQL、MyBatis的关联映射和缓存机制,以及MyBatis的注解开发;第6~9章主要讲解
    黑马程序员编著计算机15.8万字
  • 会员
    本书是网页特效设计任务驱动式教材。本书将网页特效分为9类,分别是基本网页特效、日期时间类网页特效、文字类网页特效、图片类网页特效、表单控件类网页特效、导航菜单类网页特效、选项卡类网页特效、内容展开与折叠类网页特效和页面类网页特效,同时相应地将全书分为9个教学单元,每个教学单元分析和设计一种类型的网页特效,将JavaScript和jQuery的相关知识合理地安排到各个教学单元中。
    陈承欢编著计算机7.4万字
  • 会员
    本书立足于新工科和工程教育,从工程应用和实践者的视角,全面系统地介绍了目前在工业界中使用最为广泛的JDK8的全部核心知识。全书共17章,主要内容包括Java概述、Java基本类型与运算符、程序流程控制、数组、类与对象、抽象类、接口与嵌套类、GUI编程、Swing高级组件、异常与处理、I∕O流与文件、多线程与并发、容器框架与泛型、字符串与正则表达式、反射与注解。本书适合可作为普通高等院校、高职院校
    胡平 刘涛主编计算机21万字
  • 会员
    本书讲解了C++语言基础知识,以及编程解题常用的方法和基础算法。每章都是由一个小故事来引出编程思维。本书也介绍了各种有趣的计算机知识,并涵盖了全国青少年软件编程等级考试(C语言)一级和二级考试的知识点。
    王桂平 周祖松 穆云波 葛昌威编著计算机13.4万字
  • 会员
    本书系统地介绍了Java语言高级程序设计内容,主要包括Java集合框架、异常处理、输入/输出流、多线程、网络编程、图形用户界面程序设计、泛型、JDBC编程、Java8新特性。本书所有知识点都结合具体实例进行分析,既注重理论介绍,又强调实际应用,从实用的角度精心设计知识结构和代码示例,同时每章后面配有相应习题。本书可作为普通高等院校计算机及相关专业Java程序设计课程的教材,也适合程序开发人员学习
    周化祥 许金元主编计算机8.8万字
  • 会员
    PHP是一种运行于服务器端并完全跨平台的嵌入式脚本编程语言,是目前开发各类Web应用的主流语言之一。本书站在初学者的角度,以通俗易懂的语言、丰富的图表、实用的案例详细介绍了PHP语言。全书共分11章:第1~7章主要介绍了Web开发概念和PHP入门、PHP基本语法、PHP流程控制和数组、PHP函数及应用、PHP与网页交互、PHP访问MySQL数据库、会话控制;第8~11章则围绕PHP进阶、PHP中的
    陈运军 李洪建主编计算机14.5万字
  • 会员
    本书以MySQL为平台,从数据库管理和开发的角度出发,介绍开发数据库应用系统所需的基础知识和技术。本书将一个贯穿全书的数据库应用系统开发实例“学生信息管理系统”融入各项目,将每个项目分解成若干任务,使读者逐步学会创建、管理、开发数据库,并掌握使用SQL进行程序设计的编程思想和技术。本书内容由浅入深,由实践到理论,再从理论到实践,通过任务驱动的方式将理论与实践密切结合,体现了高职高专和应用型本科教育
    杨云 温凤娇 余建浙 张志强编著计算机12.6万字
  • 会员
    本书分为9篇,共35章。第1篇主要介绍基本配置;第2篇主要介绍用户及权限管理;第3篇主要介绍网络相关配置;第4篇主要介绍存储管理;第5篇主要介绍系统管理;第6篇主要介绍软件管理;第7篇主要介绍安全管理;第8篇主要介绍容器管理;第9篇主要介绍自动化管理工具ansible的使用。
    段超飞计算机12.4万字
  • 会员
    本书从分布式系统的基础概念讲起,随后介绍分布式系统中间件SpringCloudAlibaba进阶实战,重点介绍了使用SpringCloudAlibaba框架整合各种分布式组件的完整过程。
    高洪岩编著计算机3.1万字

同类书籍最近更新

  • 会员
    在大力提倡互联网+的今天,人们在PC、手机、Pad上安装了各式各样的软件服务或APP,享受着互联网技术带来的高效和便捷。同时,随着这些产品的高速发展,用户规模急剧扩大,系统承载能力会逐渐达到瓶颈,一些早期不常出现的问题也会慢慢浮出水面。实际上,系统开发者们也越来越重视软件的稳定性、高可用性、可扩展性对用户体验的影响,大家纷纷使出浑身解数,实践出多个构建大型应用所需要的技术架构。在这些架构方案中,有
    杜云飞程序设计8.8万字
  • 会员
    为了避免说教式的讲解带来枯燥乏味的阅读体验,本书给出了大量的实例及生产环境下的案例。本书可分为四个部分:第一部分是入门,从理论基础开始讲解,最终会产生两个实践项目;第二部分是提高,基于第一部分的项目添加特效,形成一个完整的多媒体项目;第三部分是扩展,结合当下比较流行的直播场景进行实际案例分析;第四部分是工具,介绍当下大部分可以提高开发以及测试效率的工具。
    展晓凯 魏晓红程序设计26.3万字
  • 会员
    本书对Spark内部高度抽象的数据结构RDD、分布式DAG调度器/驱动器,以及高效的基于Non-blockingIO分布式计算框架Akka/Netty等内核设计进行了深度剖析,不可多得,是适合大型分布式计算架构师和资深开源贡献者阅读的参考书。
    耿嘉安程序设计25.2万字
  • 会员
    《跟老男孩学Linux运维:Web集群实战》及《跟老男孩学Linux运维:Shell编程实战》这两本书自出版以来,得到了广大网友的一致好评和赞扬。同时也有部分读者提出了很多宝贵的建议,其中之一就是这两本书都不是面向纯零基础读者的书,需要具备一些基础的Linux知识辅助才能更好地进行学习。
    老男孩 张耀程序设计12.4万字
  • 会员
    本书分为四篇:第一篇即为第1章,介绍开发环境的准备及账号的注册。学完本章内容,相当于取得了入场券。第二篇包括第2~10章,是项目实战部分。其中第2~6章是小程序前端案例,使用了后台地址但未涉及后台编程;第7~10章是在已有案例的基础上添加了后端程序的支持。先学习前端,再学习后端,由浅入深,这样更易于理解和掌握。第三篇包括第11~14章,详细讲解所有小程序组件的使用方法,几乎全部组件都具有生产可用的
    石桥码农程序设计7.8万字
  • 会员
    写一本关于编程的书,是我大概15年前就有的一个想法,当时,我体会到了编程中数据结构的美妙和神奇,有一种收获的喜悦和分享的冲动。这种收获是我反复阅读教程十几遍,花大量时间上机练习调试得到的,这是一个比较痛苦的过程。我想,如果把我学到的知识更为清晰易懂地表达出来,其他人不就可以掌握编程容易一些,并体会到那种喜悦了吗?不过,当时感觉自己学识太浅,要学习的东西太多,想一想也就算了。
    马俊昌程序设计32.2万字