
会员
Python强化学习:算法、核心技术与行业应用
更新时间:2024-04-15 11:58:27 最新章节:文后
书籍简介
本书使用受现实世界商业和行业问题启发的实际示例来讲授强化学习技术的相关知识。本书分为四部分:第一部分涵盖强化学习的必要背景,包括定义、数学基础和强化学习解决方案的概述;第二部分深入介绍最先进的强化学习算法(规模化的深度Q-学习、基于策略的方法、基于模型的方法、多智能体强化学习等),包括每种算法的优缺点;第三部分介绍强化学习中的高级技术,包括机器教学、泛化和域随机化、元强化学习等主题,还涵盖强化学习中有助于改进模型的各种高级主题;第四部分讲解强化学习的各种应用,例如自主系统、供应链管理、营销和金融、智慧城市与网络安全等,并讨论强化学习领域的一些挑战及未来方向。学完本书,你将掌握如何训练和部署自己的强化学习智能体来解决强化学习问题。
品牌:机械工业出版社
译者:朱小虎等
上架时间:2023-10-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
(美)埃内斯·比尔金
同类热门书
最新上架
- 会员《ChatGLM3大模型本地化部署、应用开发与微调》作为《PyTorch2.0深度学习从零开始学》的姊妹篇,专注于大模型的本地化部署、应用开发以及微调等。《ChatGLM3大模型本地化部署、应用开发与微调》不仅系统地阐述了深度学习大模型的核心理论,更注重实践应用,通过丰富的案例和场景,引导读者从理论走向实践,真正领悟和掌握大模型本地化应用的精髓。全书共分13章,全方位、多角度地展示了大模型本地化计算机13万字
- 会员2023年以来,OpenAI相继发布了聊天机器人模型ChatGPT、新一代多模态大模型GPT-4等产品,以强大的能力俘获了大量用户,颠覆了用户对于AI的认知。本书以ChatGPT为中心,对ChatGPT的相关知识进行详细的讲解。本书共12章,前5章从ChatGPT概述、技术底座、内容变革、产业格局、商业展望5个方面对ChatGPT进行了解读,帮助用户全面了解ChatGPT,对其形成完整的认知。第6计算机12.8万字
- 会员随着ChatGPT等人工智能和语言模型不断进步,了解这些技术的含义和潜在陷阱比以往任何时候都更加重要。作为享誉全球的跨技术和设计学科思想家,前田约翰利用他的丰富经验,为企业、产品设计师和决策者提供了可行的指导。通过深思熟虑和偶尔异想天开的例子,他构造了一个可以描述任何机器学习系统的关键功能的框架,并展望了可以如何使用它们来创造富有包容性和改变世界的产品。对任何想要深入了解机器如何“思考”以及未来可计算机9.6万字
- 会员PyTorch是一个开源的机器学习框架,它提供了动态计算图的支持,让用户能够自定义和训练自己的神经网络,目前是机器学习领域中的框架之一。《PyTorch2.0深度学习从零开始学》共分15章,内容包括PyTorch概述、开发环境搭建、基于PyTorch的MNIST分类实战、深度学习理论基础、MNIST分类实战、数据处理与模型可视化、基于PyTorch卷积层的分类实战、PyTorch数据处理与模型可计算机11.3万字
- 会员作为一本技术性很强的书,《中国人形机器人创新发展报告2025》覆盖人工智能、大模型、视觉捕捉、自动化控制等一些列技术和学科。本书系统性梳理了《人形机器人创新发展指导意见》发布以来中国人形机器人产业在关键技术、产品培育、场景应用、生态营造、支撑能力以及保障措施等多方面的发展态势,通过多角度案例研究,全面解析了中国在这一领域的成果与经验,力图展示中国人形机器人产业的全貌,洞察人形机器人产业未来发展的新计算机9万字
- 会员AI的本质是什么?自然语言和人工语言的区别在哪里?ChatGPT究竟是人工智能发展道路上的里程碑,还是某种误入歧途的“假AI”?我们不许诺美丽空洞的AI前景,而是告诉读者,未来的AI之路到底有多少激流险滩——对于统计学工具与硬件升级的片面崇拜,对于智能科学基本原理的蔑视,是目前AI研究的大危机。在我们看来,万众期待的ChatGPT,只是新时代的“牛顿炼金术”。计算机17.8万字
- 会员DeepSeek是一种基于Transformer架构的生成式AI(ArtificialIntelligence)大模型,融合了MoE架构、混合精度训练、分布式优化等先进技术,具备强大的文本生成、多模态处理和任务定制化能力。本书系统性地介绍了开源大模型DeepSeek-V3的核心技术及其在实际开发中的深度应用。全书分三部分共12章,涵盖理论解析、技术实现和应用实践。本书通过深度讲解与实用案例相结合计算机17万字
同类书籍最近更新
- 会员本书共11章,主要内容包括深度学习简介、Python基础、神经网络基础、卷积神经网络、经典卷积网络结构、迁移学习、循环神经网络、强化学习、深度强化学习、基于策略的算法更新与趋势等,通过具体案例,将Python语言、深度学习思想、强化学习思想和实际工程完美地结合起来。本书由浅入深,从易到难,各章节既相对独立又前后关联,其最大的特点就是打破了传统书籍的讲解方法,在介绍各部分理论基础的同时,搭配具体实例人工智能11.6万字