深度强化学习理论与实践在线阅读
会员

深度强化学习理论与实践

龙强 章胜编著
开会员,本书免费读 >

计算机网络计算机理论、基础知识12.5万字

更新时间:2024-12-27 22:26:05 最新章节:参考文献

立即阅读
加书架
下载
听书

书籍简介

本书比较全面、系统地介绍了深度强化学习的理论和算法,并配有大量的案例和编程实现。全书核心内容可以分为3部分,第一部分为经典强化学习,包括第2、3、4章,主要内容有动态规划法,蒙特卡洛法、时序差分法;第二部分为深度强化学习,包括第6、7、8章,主要内容有值函数近似法、策略梯度法、策略梯度法进阶;第三部分重点介绍了深度强化学习的经典应用——AlphaGo系列算法。另外,作为理论和算法的辅助,第1章介绍了强化学习的模型,第5章简单介绍了深度学习和PyTorch编程框架。本书可以作为理工科大学相关专业研究生的学位课教材,也可以作为人工智能、机器学习相关专业高年级本科生的选修课教材,还可以作为相关领域学术研究人员、教师和工程技术人员的参考资料。
品牌:清华大学
上架时间:2023-03-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

龙强 章胜编著
主页

同类热门书

最新上架

  • 会员
    《细说机器学习:从理论到实践》从数学知识入手,详尽细致地阐述机器学习各方面的理论知识、常用算法与流行框架,并以大量代码示例进行实践。本书内容分为三篇:第一篇为基础知识,包括机器学习概述、开发环境和常用模块、特征工程、模型评估、降维方法等内容。本篇详细而友好地介绍机器学习的核心概念与原理,并结合大量示例帮助读者轻松入门。第二篇为算法应用,涵盖机器学习最重要与高频使用的模型,包括K-Means聚类、K
    凌峰编著计算机17.6万字
  • 会员
    本书深入剖析了互联网主导下的数字广告系统,详细阐述了如何通过数据驱动的产品技术、计算算法和动态定价模型来推进广告主的数字营销,并使其在广告领域与技术广告体系全面融合。同时,本书还探讨了数字化升级对广告业流程的影响,包括市场研究、内容匹配、定制化广告、广告竞投以及消费者沉浸式互动和用户忠诚度提升等营销职能。这些内容共同构建了数字化和智能化广告发展的综合知识体系。全书分为三篇(共10章):第一篇为基础
    顾明毅计算机30.5万字
  • 会员
    测试设计思想是本书的主题。针对测试的两个基本目的和五个基本问题,本书归纳了八类测试设计思想,即系统的思想、枚举的思想、准则化的思想、多样化的思想、统计的思想、冗余的思想、推理的思想、控制的思想。围绕每一类思想,本书深入讲解来自不同领域的测试设计方法、实践及理念,借此剖析如何依据该思想缓解测试的基本问题。了解这些思想,有助于读者奠定扎实的测试理论基础,适应当代研发生产活动多学科交叉、多领域融合的发展
    周海旭编著计算机20.4万字
  • 会员
    《微课设计与制作标准教程(全彩微课版)》内容围绕微课制作展开,以实用高效为写作目的,用通俗易懂的语言对微课设计与制作的相关知识进行详细介绍。
    钱慎一 石月凤编著计算机6.6万字
  • 会员
    本书内容是在充分利用偏最小二乘原理优势的基础上,重点研究改进与优化偏最小二乘的不足方面,使其更好地适应中医药数据分析。主要内容包括分别引入非径向数据包络分析和降噪稀疏自编码器优化偏最小二乘的噪声处理,使其处理缺失值和噪声更有效;分别引入特征相关、L1正则项和灰色关联优化偏最小二乘的特征提取,实现有效降维和提取特征子集;分别融合受限玻尔兹曼机、稀疏自编码器、深度置信网络提取非线性成分,优化偏最小二乘
    杜建强 聂斌 熊旺平计算机10.5万字
  • 会员
    本书源于斯坦福大学的相关课程,主要介绍不确定状态下的决策算法,涵盖基本的数学问题和求解算法。本书共分为五个部分:首先解决在单个时间点上简单决策的不确定性和目标的推理问题;然后介绍随机环境中的序列决策问题;接着讨论模型不确定性,包括基于模型的方法和无模型的方法;之后讨论状态不确定性,包括精确信念状态规划、离线信念状态规划、在线信念状态规划等;最后讨论多智能体系统,涉及多智能体推理和协作智能体等。本书
    (美)米凯尔·J.科申德弗 (美)蒂姆·A.惠勒 (美)凯尔·H.雷计算机25.7万字
  • 会员
    本书以理论为基础,以应用为导向,用大量的实例对Access数据库的应用进行全面讲解。全书共8章,主要内容包括数据库的基础知识、Access的基本操作、表的构建、查询的创建、窗体的设计、报表的设计、宏的自动化操作,以及数据库文件的管理。知识点覆盖《全国计算机等级考试二级Access数据库程序设计》考试大纲规定的内容。在介绍Access操作方法的同时,安排大量的动手练案例,并且穿插知识延伸小体例,理论
    金松河计算机8.5万字
  • 会员
    《重构知识:在线知识传播的疆域、结构与机制》旨在探究社会化媒体知识分享平台的知识分享行为规律、知识疆域结构特征、知识构建的动力机制以及知识普惠的技术实现。依托于当前人文社会科学新文科建设总体要求,本书基于传播学理论视野,利用信息科学计算技术,结合复杂网络分析框架,致力于解决当前传播学现实问题。具体而言,本研究旨在探究基于互联网技术的知识传播,提高知识传播效率,推进知识普惠,探究信息技术能够惠及广泛
    张伦 李永宁计算机11.1万字
  • 会员
    《剪映短视频剪辑与运营标准教程(全彩微课版)》围绕剪映短视频的创作展开,由浅入深、全面系统地对短视频的拍摄、剪辑、发布、运营等环节进行介绍,不仅能让新手制作出精彩的短视频,还可以让有一定后期剪辑基础的读者掌握更多创意效果的制作方法。《剪映短视频剪辑与运营标准教程(全彩微课版)》共9章,内容包括短视频剪辑基础知识、素材拍摄技法、短视频剪辑工具—剪映的基本功能、短视频字幕处理、音效的添加、视频转场特效
    张晓涵编著计算机6.3万字