会员
深度强化学习:算法原理与金融实践入门
谢文杰 周炜星编著计算机网络/计算机理论、基础知识· 16.9万字
更新时间:2024-12-31 18:45:49
最新章节:第10章习题开会员,本书免费读 >
深度强化学习是人工智能和机器学习的重要分支领域,有着广泛应用,如AlphaGo和ChatGPT。本书作为该领域的入门教材,在内容上尽可能覆盖深度强化学习的基础知识和经典算法。全书共10章,大致分为4部分:第1部分(第1~2章)介绍深度强化学习背景(智能决策、人工智能和机器学习);第2部分(第3~4章)介绍深度强化学习基础知识(深度学习和强化学习);第3部分(第5~9章)介绍深度强化学习经典算法(DQN、AC、DDPG等);第4部分(第10章)为总结和展望。每章都附有习题并介绍了相关阅读材料,以便有兴趣的读者进一步深入探索。本书可作为高等院校计算机、智能金融及相关专业的本科生或研究生教材,也可供对深度强化学习感兴趣的研究人员和工程技术人员阅读参考。
品牌:清华大学
上架时间:2023-09-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
谢文杰 周炜星编著
主页
同类热门书
最新上架
- 会员
局域网组建、管理与维护标准教程(全彩微课版)
在物联网及大数据被广泛应用的时代背景下,计算机网络在人们的日常生产生活中的应用比重越来越大,并潜移默化地改变着人们的生产生活方式。在计算机网络中,应用最广泛的是局域网。本书对局域网的组建、管理与维护进行全面剖析,向读者揭开局域网的神秘面纱,在熟悉局域网知识要点的同时,重点培养读者的动手能力和专业思维能力。全书共9章,内容包括局域网概述、局域网基础技术、局域网网络设备、无线局域网的组建、局域网规划与计算机10.8万字 - 会员
决策算法
本书源于斯坦福大学的相关课程,主要介绍不确定状态下的决策算法,涵盖基本的数学问题和求解算法。本书共分为五个部分:首先解决在单个时间点上简单决策的不确定性和目标的推理问题;然后介绍随机环境中的序列决策问题;接着讨论模型不确定性,包括基于模型的方法和无模型的方法;之后讨论状态不确定性,包括精确信念状态规划、离线信念状态规划、在线信念状态规划等;最后讨论多智能体系统,涉及多智能体推理和协作智能体等。本书计算机25.7万字 - 会员
重构知识:在线知识传播的疆域、结构与机制
《重构知识:在线知识传播的疆域、结构与机制》旨在探究社会化媒体知识分享平台的知识分享行为规律、知识疆域结构特征、知识构建的动力机制以及知识普惠的技术实现。依托于当前人文社会科学新文科建设总体要求,本书基于传播学理论视野,利用信息科学计算技术,结合复杂网络分析框架,致力于解决当前传播学现实问题。具体而言,本研究旨在探究基于互联网技术的知识传播,提高知识传播效率,推进知识普惠,探究信息技术能够惠及广泛计算机11.1万字 - 会员
深度探索Vue.js:原理剖析与实战应用
本书系统的介绍了Vue框架基础、框架应用、生态组成、项目实战、框架演进、Vue原理剖析及Vue框架的原理实现。全书共分为8章:第1章为行业发展介绍,第2章为Vue2.x的开发基础,第3章为Vue2.x的组件开发,第4章为VueCLI开发完全指南,第5章为VueCLI项目实战,第6章为Vite+Vue3完全开发指南,第7章为Vue3.x项目实战,第8章为实现原理介绍。书中主要内容包括:W计算机13.9万字 - 会员
深度强化学习:算法原理与金融实践入门
深度强化学习是人工智能和机器学习的重要分支领域,有着广泛应用,如AlphaGo和ChatGPT。本书作为该领域的入门教材,在内容上尽可能覆盖深度强化学习的基础知识和经典算法。全书共10章,大致分为4部分:第1部分(第1~2章)介绍深度强化学习背景(智能决策、人工智能和机器学习);第2部分(第3~4章)介绍深度强化学习基础知识(深度学习和强化学习);第3部分(第5~9章)介绍深度强化学习经典算法(D计算机16.9万字 - 会员
网络安全技术标准教程(实战微课版)
本书以网络安全为主线,对计算机网络安全所面对的各种威胁、表现形式、解决技术、应对方案等知识进行讲解,让读者全面掌握网络安全技术的应用方法和防范措施。全书共10章,内容包括计算机网络安全概述、网络模型中的安全体系、常用渗透手段及防范、病毒与木马的防范、加密与解密技术、局域网与网站安全、身份认证及访问控制、远程控制及代理技术、灾难恢复技术等。在正文讲解过程中,穿插了知识点拨注意事项动手练等板块,以助读计算机12.3万字 - 会员
WPS Office高级应用与设计标准教程(计算机等级考试二级·实战微课版)
本书以理论为基础,以应用为导向,用大量的实例对WPS文字处理、电子表格、演示文档三大板块进行全面讲解。全书共12章,主要内容包括WPS综合应用基础、PDF文件的查看及处理、常规文档的创建和编辑、长文档的高效编排、文档的校对与批量处理、WPS制表入门操作、公式与函数的应用、图形和图表的应用、对数据进行处理与分析、基本演示文稿的创建、动态交互式演示文稿的创建、演示文稿的放映与输出等。知识点全面覆盖《全计算机9.3万字 - 会员
深度强化学习理论与实践
本书比较全面、系统地介绍了深度强化学习的理论和算法,并配有大量的案例和编程实现。全书核心内容可以分为3部分,第一部分为经典强化学习,包括第2、3、4章,主要内容有动态规划法,蒙特卡洛法、时序差分法;第二部分为深度强化学习,包括第6、7、8章,主要内容有值函数近似法、策略梯度法、策略梯度法进阶;第三部分重点介绍了深度强化学习的经典应用——AlphaGo系列算法。另外,作为理论和算法的辅助,第1章介绍计算机12.5万字 - 会员
偏最小二乘法优化及其在中医药领域的应用研究
本书内容是在充分利用偏最小二乘原理优势的基础上,重点研究改进与优化偏最小二乘的不足方面,使其更好地适应中医药数据分析。主要内容包括分别引入非径向数据包络分析和降噪稀疏自编码器优化偏最小二乘的噪声处理,使其处理缺失值和噪声更有效;分别引入特征相关、L1正则项和灰色关联优化偏最小二乘的特征提取,实现有效降维和提取特征子集;分别融合受限玻尔兹曼机、稀疏自编码器、深度置信网络提取非线性成分,优化偏最小二乘计算机10.5万字