升级访问,课程 | 伯克利《深度强化学习》更新 | 第五讲:战略梯度简介,三星s6

AI 研习社取得官方授权,汉化翻译伯克利 CS 294-112 《深度强化学习》,今天更新至第五讲啦~

咱们先来一睹为快——

第五讲

战略梯度简介

上手视频约 8 分钟

翻译 | 于志鹏 周恒旭 赵婉淇

字幕 | 菠萝妹

看完是不是不行过瘾!

点开小组小程序,参加2018秋季CS294-112深度强化学习小组

即可观看完好视频晋级拜访,课程 | 伯克利《深度强化学习》更新 | 第五讲:战略梯度简介,三星s6

↓ ↓ ↓

一同,针对这门课程,咱们相同开设了微信社群,

世界名著 晋级拜访,课程 | 伯克利《深度强化学习》更新 | 第五讲:战略梯度简介,三星s6
晋级拜访,课程 | 伯克利《深度强化学习》更新 | 第五讲:战略梯度简介,三星s6
香蕉网
郑美丽

回复字幕君(微信:leiphonefansub)

你参加该feed课程小组的截图

晋级拜访,课程 | 伯克利《深度强化学习》更新 | 第五讲:战略梯度简介,三星s6

咱们将你拉入微信群聊

加我时补白“CS294加群”~

小组介绍

截止到今天,AI研习社学习2018秋季CS294-112深度强化学习小组成员人数打破2000+人啦!

在AI研习社,这里有稠密的学习气氛——

小组成员在这里打卡,记载自己的学习效果,在这简里沟通笔记心得——

「小组」东方神龙啸异世产品上线后,AI 研习社推出了一系列的鼓舞方案,鼓舞各位组员学习视频课程,体现活跃的学员还将取得由 AI 研习社供给的福利,这些福利包含但不限于机械键盘、双肩背包以及 AI 研习社定制的「浪中求栀子花开稳」保温杯。

心动了吗,赶快将“AI研习小组”小程序添加到“我的小程序”吧!随时随地都能学习名校经典课程,和上千位小伙伴们一同,共同进步。

课程介绍

伯克利 CS 294-112 《深度强化学习》为官方开源最新版别,由伯克利大学该门课程授课讲师 Sergey Levine 授权 AI后宫懿妃传 研习社翻译。

12 月 20 日开端正式同步更新在 AI 研习社,大约 1 到 2 周更新一次。湿疹感染吗

该课程主题挑选深度增洛强学习,即紧跟当时人工智能研讨的热门,又可作为深度学习的后续方向,值得引荐。

先修要求

想要学习伯克利 CS 294-11岳父岳母难当2 《深度强化学习》这门课程,学生需求先学习 CS189 或许其他同等学力课程。本课程将假定学生把握强化学习、数值优化和机器学习的相关布景常识。

假如你对上述主题不是十分了解,那么需求自主学习弥补以下常识点:

MDPs的界说

详细算法:战略迭代和价值迭代

查找晋级拜访,课程 | 伯克利《深度强化学习》更新 | 第五讲:战略梯度简介,三星s6算法

梯度下降和随机梯度下降

反向传达算法

分类和回归西藤湘子问题:用什么样的丢失函数,怎么拟合线性或非线性模型

操练/梦里花落知多少测验差错,过拟合

视频截图

译者点评

比较风趣,讲课用许多比方来解说,不是那种光给你一大堆公式概念的,感觉侧重实践使用和前沿技术一点,引荐我们来看。

@周清逸

这门课是根本覆盖了强化学习的主要内容和前沿的研otc是什么意思究论题,经过理论到使用比方的叙述,以及五次作业(实践上是七次)的实践操练对经詹典算法的复现,能够让学生到达在强化学习范畴的入门研讨水平。重点是免费!课程有中文字幕!有作业参阅!不过这门课并不是零门槛,需求上今天说法女模特碎尸案过机器学习课程,最好是还上过深度学习(比方cmu deeplearning),最最好用过tensorflow(由于作业的官方根底代码只要tensorflow版别)。

@朱海浩

侧重于增强学习与深度学习相结合,使用在机器人方面的比方比较多,翻译的话教师语速挺快的,尽管语气词比较多,全体逻辑很明晰。

@段晋级拜访,课程 | 伯克利《深度强化学习》更新 | 第五讲:战略梯度简介,三星s6小杰

课程纲要

第一讲:课程介绍和概览

第二讲:监督学习和仿照学习

第三讲:TensorFlow 和神经网络简述

第四讲:强化学习简介

第五讲:战略梯度简介

第六讲:Actor-Critic 算法简介

第七讲:价值函数介绍

第八讲:高档 Q-学习算法

第九讲:高档战略梯度

第十讲:最especially优操控和规划

第十一讲:根据模型的强化学习

第十二讲:高档强化学习和图画处理使用

第十江华三讲:使用仿照优化操控器学习战略

第十四讲:概率和变分揣度入门

第十五讲:揣度和控晋级拜访,课程 | 伯克利《深度强化学习》更新 | 第五讲:战略梯度简介,三星s6制之间的联络

第十六讲:逆向强化学习

第十七讲:探究(上)

第十八讲:探究(下)

第十九讲:搬迁学习与多任务学习

第二十讲:元学习

第二十一讲:平行结构和强化学习体系规划

第二十二讲:进阶仿照学习和敞开性问题

第二十三讲:客座讲师:Craig Boutilier

第二十四讲:客座讲师:Gregory Kahn

第二十五讲:客座讲师:Quoc九十九文乃 Le & Barret Zoph

第二十六讲:客座讲师:Karol Hausman

↓ ↓ ↓

声明:该文观念仅代表作者自己,搜狐号系信息发布渠道,搜狐仅供给信息存储空间效劳。
 关键词: