Python强化学习:算法、核心技术与行业应用在线阅读
会员

Python强化学习:算法、核心技术与行业应用

(美)埃内斯·比尔金
开会员,本书免费读 >

计算机网络人工智能19.5万字

更新时间:2024-04-15 11:58:27 最新章节:文后

立即阅读
加书架
下载
听书

书籍简介

本书使用受现实世界商业和行业问题启发的实际示例来讲授强化学习技术的相关知识。本书分为四部分:第一部分涵盖强化学习的必要背景,包括定义、数学基础和强化学习解决方案的概述;第二部分深入介绍最先进的强化学习算法(规模化的深度Q-学习、基于策略的方法、基于模型的方法、多智能体强化学习等),包括每种算法的优缺点;第三部分介绍强化学习中的高级技术,包括机器教学、泛化和域随机化、元强化学习等主题,还涵盖强化学习中有助于改进模型的各种高级主题;第四部分讲解强化学习的各种应用,例如自主系统、供应链管理、营销和金融、智慧城市与网络安全等,并讨论强化学习领域的一些挑战及未来方向。学完本书,你将掌握如何训练和部署自己的强化学习智能体来解决强化学习问题。
品牌:机械工业出版社
译者:朱小虎等
上架时间:2023-10-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

(美)埃内斯·比尔金
主页

最新上架

  • 会员
    本书是关于如何从零开始构建大模型的指南,由畅销书作家塞巴斯蒂安·拉施卡撰写,通过清晰的文字、图表和实例,逐步指导读者创建自己的大模型。在本书中,读者将学习如何规划和编写大模型的各个组成部分、为大模型训练准备适当的数据集、进行通用语料库的预训练,以及定制特定任务的微调。此外,本书还将探讨如何利用人工反馈确保大模型遵循指令,以及如何将预训练权重加载到大模型中。
    (美)塞巴斯蒂安·拉施卡计算机13.8万字
  • 会员
    这是一本面向初中级读者的Agent学习指南,作者既是资深的AI技术专家,又是经验丰富的项目导师,融合作者亲身实践、培训反馈与官方资源,为Agent使用者和开发者提供了快速上手的实用指导。本书从基础知识、操作和应用开发3个维度循序渐进地讲解Agent实战技巧,分为三篇:基础篇(1~2章):介绍Agent定义、发展历程、常用开源技术、主要组件等基础知识和开发环境的搭建过程。应用篇(3~6章):从通用型
    高强文计算机7.2万字
  • 会员
    《Manus实用操作极简入门与指南》是一本为普通用户设计的AIAgent使用手册,旨在帮助读者快速掌握AIAgent的核心功能,提升工作效率。本书从AIAgent的基本概念入手,详细介绍了AIAgent的自主性、智能性和目标导向性,并通过丰富的实例展示了AIAgent在数据分析、自动化流程、决策支持等领域的强大能力。书中重点介绍了Manus这一新一代通用AIAgent,它不仅能理解用户
    苏江 温洁计算机8.9万字
  • 会员
    优化提示词是用好GPT的关键。本书基于GPT,讨论提示词的使用技巧和优化方法。本书不仅讨论如何让GPT不再“胡说八道”,如何用GPT解决各种问题,如何让GPT了解用户的需求,如何让GPT记忆力超群,还讲述如何应用GPT,如何让GPT自动运行,如何打造商业级别的GPT,如何辨别GPT生成的内容。无论你是职场人士,还是在校大学生,通过阅读本书,都可以掌握用好GPT的关键,提升自己的工作或学习效率。
    梁成睿计算机8.5万字
  • 会员
    在人工智能技术快速发展的时代,DeepSeek?作为国产自研的高性能?AI模型,在多领域得到广泛应用。本书是关于DeepSeek的实践指南,分为基础认知、开发实战、高能应用3篇。基础认知篇介绍DeepSeek的核心功能、使用方法与对话技巧;开发实战篇讲解DeepSeekAPI的申请与使用,以及部署方法;高能应用篇展示DeepSeek在多媒体生成、办公软件、智能助手方面的应用。本书内容由浅入深,涵
    李艮基 曹方咏峥 肖灵儿编著计算机3.3万字
  • 会员
    本书是继《EasyRL:强化学习教程》(俗称“蘑菇书”)之后,为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“Joy
    江季 王琦 杨毅远计算机7.8万字
  • 会员
    本书全程图解式讲解,通过大量全彩插图拆解概念,让读者真正告别学习大模型的枯燥和复杂。全书分为三部分,依次介绍语言模型的原理、应用及优化。第一部分理解语言模型(第1~3章),解析语言模型的核心概念,包括词元、嵌入向量及Transformer架构,帮助读者建立基础认知。第二部分使用预训练语言模型(第4~9章),介绍如何使用大模型进行文本分类、聚类、语义搜索、文本生成及多模态扩展,提升模型的应用能力。第
    (沙特)杰伊·阿拉马尔 (荷)马尔滕·格鲁滕多斯特计算机16.4万字
  • 会员
    本书共14章,主要内容包括探索性数据分析、有监督学习(线性回归、SVM、决策树等)、无监督学习(降维、聚类等),以及深度学习的基础原理和应用等。
    段小手计算机18万字
  • 会员
    本书聚焦如何高效运用DeepSeek这一前沿AI工具,帮助读者在技术浪潮中把握机遇。全书从DeepSeek发展历程切入,系统解析DeepSeek在信息处理、创意生成与决策辅助中的核心能力,并结合生活管理、职场协作、学习优化、社交互动等场景,通过真实案例讲解其应用方法。同时,针对内容创作、自媒体运营、副业变现等需求,书中提供了可落地的策略与案例,助力读者实现效率提升与价值创造。书中不仅提供技术使用技
    何华平编著计算机5.5万字

同类书籍最近更新

  • 会员
    本书全面系统地介绍了字节跳动旗下AI智能助手——豆包的使用方法,涵盖注册登录流程及基本操作要点,并通过丰富多样的学习、工作、生活等场景的应用实例,如化身学习小能手、担当高效职场助手、呈现精彩模拟人物互动等,充分展现了豆包的强大效用。此外,还深入介绍了豆包智能体及其应用实例,以及豆包App的注册/登录方式和便捷功能。随书赠送学习资源,包含50个高效提问公式,40个深度提问模板、100个豆包智能体模板
    何华平编著人工智能7.1万字
  • 会员
    本书全程图解式讲解,通过大量全彩插图拆解概念,让读者真正告别学习大模型的枯燥和复杂。全书分为三部分,依次介绍语言模型的原理、应用及优化。第一部分理解语言模型(第1~3章),解析语言模型的核心概念,包括词元、嵌入向量及Transformer架构,帮助读者建立基础认知。第二部分使用预训练语言模型(第4~9章),介绍如何使用大模型进行文本分类、聚类、语义搜索、文本生成及多模态扩展,提升模型的应用能力。第
    (沙特)杰伊·阿拉马尔 (荷)马尔滕·格鲁滕多斯特人工智能16.4万字
  • 会员
    本书全面介绍了生成式人工智能(AIGC)的基础理论与实践应用,旨在通过45个典型案例细化AIGC技术的应用过程、实战技巧、优化规则及生成结果,帮助读者全面理解和掌握大模型与AIGC的基本原理、核心技术、应用实践及伦理规范,激发读者的学习兴趣与创新思维,指导读者在学习、工作、研究中充分利用AI技术提高工作效率,增强信息技术应用能力,提升核心竞争力。本书教学资源丰富,适合作为应用型本科院校和职业院校学
    尹湘萍 赵萍主编人工智能15.6万字
  • 会员
    本书以当下热门的人工智能工具DeepSeek为核心,通过丰富实用的内容,助力读者从对DeepSeek一无所知的新手,成长为能够灵活运用其功能解决各类问题的行家。书中选取了多个领域的典型应用场景,如学习辅助、职场办公、生活娱乐以及自媒体创作等,为读者全方位展示DeepSeek的强大功能。全书共7章,内容层层递进。第1~3章为读者介绍了DeepSeek的功能和技术特点、基础操作技巧和提问策略,帮助读者
    麓山AI研习社编著人工智能9万字
  • 会员
    本书是一本全面介绍Manus及其应用的实用指南,旨在帮助读者深入了解Manus的核心技术、独特优势及其在各个领域的广泛应用,为读者在智能化时代的学习、工作和生活提供有力支持。首先,本书深入剖析智能体的本质与技术基础,详细阐述AIAgent的核心架构、运作原理,及其与传统AI模型的区别,并从不同维度对比Manus与其他AI大模型(如DeepSeek、ChatGPT),让读者对Manus的技术优势有清
    董浩宇人工智能16.8万字
  • 会员
    本书以“从入门到精通”为逻辑主线,从基础操作指南到提示词深度优化,系统拆解DeepSeek的核心能力。书中给出的100个DeepSeek实用技巧,既讲究由浅入深,又讲究实战落地,从0到1教你如何让DeepSeek帮你提高效率:针对办公、创作、营销等高频场景,提炼文档处理、工具应用等实战技巧;聚焦金融、教育、交通等七大行业,解析AI技术落地场景与解决方案;同时介绍了本地部署、智能体开发等应用指南,通
    王吉斌 祝丽丽 吴佳莹等人工智能12.7万字