会员
深度强化学习理论与实践
龙强 章胜编著计算机网络/计算机理论、基础知识· 12.5万字
更新时间:2024-12-27 22:26:05
最新章节:参考文献开会员,本书免费读 >
本书比较全面、系统地介绍了深度强化学习的理论和算法,并配有大量的案例和编程实现。全书核心内容可以分为3部分,第一部分为经典强化学习,包括第2、3、4章,主要内容有动态规划法,蒙特卡洛法、时序差分法;第二部分为深度强化学习,包括第6、7、8章,主要内容有值函数近似法、策略梯度法、策略梯度法进阶;第三部分重点介绍了深度强化学习的经典应用——AlphaGo系列算法。另外,作为理论和算法的辅助,第1章介绍了强化学习的模型,第5章简单介绍了深度学习和PyTorch编程框架。本书可以作为理工科大学相关专业研究生的学位课教材,也可以作为人工智能、机器学习相关专业高年级本科生的选修课教材,还可以作为相关领域学术研究人员、教师和工程技术人员的参考资料。
品牌:清华大学
上架时间:2023-03-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
龙强 章胜编著
主页
同类热门书
最新上架
- 会员
人工智能数学基础
本书面向广大数据科学与人工智能专业的学生及初学者,力求通俗易懂、简洁清晰地呈现学习大数据与人工智能需要的基础数学知识,助力读者为进一步学习人工智能打好数学基础。全书分为4篇,共19章:微积分篇(第1~5章),主要介绍极限、导数、极值、多元函数导数与极值、梯度下降法等;线性代数篇(第6~10章),主要介绍向量、矩阵、行列式、线性方程组、特征值和特征向量等,并介绍这些数学知识在人工智能中的应用;概率统计算机8.5万字 - 会员
深度序列模型与自然语言处理:基于TensorFlow 2实践
《深度序列模型与自然语言处理:基于TensorFlow2实践》以自然语言和语音信号处理两大应用领域为载体,详细介绍深度学习中的各种常用序列模型。在讲述理论知识的同时辅以代码实现和讲解,帮助读者深入掌握相关知识技能。《深度序列模型与自然语言处理:基于TensorFlow2实践》共12章,不仅涵盖了词向量、循环神经网络、卷积神经网络、Transformer等基础知识,还囊括了注意力机制、序列到序列问题计算机21.9万字 - 会员
深度强化学习:算法原理与金融实践入门
深度强化学习是人工智能和机器学习的重要分支领域,有着广泛应用,如AlphaGo和ChatGPT。本书作为该领域的入门教材,在内容上尽可能覆盖深度强化学习的基础知识和经典算法。全书共10章,大致分为4部分:第1部分(第1~2章)介绍深度强化学习背景(智能决策、人工智能和机器学习);第2部分(第3~4章)介绍深度强化学习基础知识(深度学习和强化学习);第3部分(第5~9章)介绍深度强化学习经典算法(D计算机16.9万字 - 会员
Web 3.0时代:重构科技与商业新生态
在区块链、人工智能、3D、AR等底层技术的支持下,Web3.0高速发展,获得了更多的关注。从Web1.0到Web3.0,互联网由中心化走向去中心化,由以平台为中心转向以用户为中心,经济由实体经济转向数字经济。可以说,Web3.0正在全方位赋能数字时代科技发展,重构商业模式。本书以Web3.0如何重构数字时代科技与商业新生态为切入点,面向互联网领域的创业者、从业者、企业家与投资人等。读者可以计算机12.9万字 - 会员
测试设计思想
测试设计思想是本书的主题。针对测试的两个基本目的和五个基本问题,本书归纳了八类测试设计思想,即系统的思想、枚举的思想、准则化的思想、多样化的思想、统计的思想、冗余的思想、推理的思想、控制的思想。围绕每一类思想,本书深入讲解来自不同领域的测试设计方法、实践及理念,借此剖析如何依据该思想缓解测试的基本问题。了解这些思想,有助于读者奠定扎实的测试理论基础,适应当代研发生产活动多学科交叉、多领域融合的发展计算机20.4万字 - 会员
文心一言从新手到高手(写作+绘画+教育+编程+助手)
文心一言是百度推出的一款基于大语言模型的生成式AI产品,《文心一言从新手到高手(写作+绘画+教育+编程+助手)》详细介绍了其在不同领域的应用方法,是一本全面、详尽的文心一言使用指南。《文心一言从新手到高手(写作+绘画+教育+编程+助手)》共8章,依次讲解了文心一言的基础知识、创意写作、零基础绘画、数据分析、营销文案写作、职场百宝箱、求职招聘、教育教学、学生学习、编程辅助、生活顾问、插件、文心一言A计算机12.2万字 - 会员
决策算法
本书源于斯坦福大学的相关课程,主要介绍不确定状态下的决策算法,涵盖基本的数学问题和求解算法。本书共分为五个部分:首先解决在单个时间点上简单决策的不确定性和目标的推理问题;然后介绍随机环境中的序列决策问题;接着讨论模型不确定性,包括基于模型的方法和无模型的方法;之后讨论状态不确定性,包括精确信念状态规划、离线信念状态规划、在线信念状态规划等;最后讨论多智能体系统,涉及多智能体推理和协作智能体等。本书计算机25.7万字 - 会员
微课设计与制作标准教程(全彩微课版)
《微课设计与制作标准教程(全彩微课版)》内容围绕微课制作展开,以实用高效为写作目的,用通俗易懂的语言对微课设计与制作的相关知识进行详细介绍。计算机6.6万字 - 会员
WPS Office高级应用与设计标准教程(计算机等级考试二级·实战微课版)
本书以理论为基础,以应用为导向,用大量的实例对WPS文字处理、电子表格、演示文档三大板块进行全面讲解。全书共12章,主要内容包括WPS综合应用基础、PDF文件的查看及处理、常规文档的创建和编辑、长文档的高效编排、文档的校对与批量处理、WPS制表入门操作、公式与函数的应用、图形和图表的应用、对数据进行处理与分析、基本演示文稿的创建、动态交互式演示文稿的创建、演示文稿的放映与输出等。知识点全面覆盖《全计算机9.3万字