当前位置:网站首页>李宏毅老师2020年深度学习系列讲座笔记2
李宏毅老师2020年深度学习系列讲座笔记2
2022-07-20 16:09:00 【ViviranZ】
瞎看吧。。。。至少做个笔记
https://www.bilibili.com/video/BV1UE411G78S?from=search&seid=11796990666136537025
Policy Gradient(看起来不全)
主要思路:
有一个state-agent takes an action-the state changes to another state-agent get a reward-
例子:分类问题对应的优化的目标函数是交叉熵损失(cross entropy loss)函数
希望输出的结果是(1,0,0)(向左走),\theta更新的方向也是‘left’
问题可以看作,当状态是s_1^1的时候我们target是a_1,想让agent做这个action。
与直接做action有什么区别?A:在前面(蓝色糊住的地方)会乘以R(reward)
唯一区别是加入weight,每收集一次数据就要train一次network。。。。
边栏推荐
- VMware low version starts the blue screen solution of virtual machine (it takes 3 days to restart the installation experience, which must be seen before installation)
- [wechat applet] xxxxx is not in the following list of socket legal domain names, please refer to the document
- 19_ Built in instructions
- yaml编写规则以及YAML和JSON对比
- influxdb查询时间戳问题
- JS-----第五章 函数及事件
- 我想问下ODPS的建表ddl不能直接在mysql里执行,STRING类型不兼容,这个是只能自己调整吗
- find_var.sh
- Wpf 多指应用开发解析
- MCU external interrupt trigger mode: description of level trigger and edge trigger
猜你喜欢
廖雪峰老师系列课程 迅速过一遍 1
不懂点儿统计学,《星球大战》白看了
Some easily confused pointers [summary direction]
视频聊天源码——一对一直播系统源码
百度网盘 yundetectservice.exe可以禁用关闭吗
Tmech publishes the latest progress in the operation control technology of the must choose: to realize the high robustness walking of humanoid robots
2021/7/16 学习散射网络第一步-神经网络入门
Xilinx Mipi csi-2 receiver subsystem IP details
50个名额限量开放|带着OceanBase年度发布会的消息走来了!
Prometheus operator configuration alarm
随机推荐
Using ODBC to consume SAP ABAP CDs view in Excel
wmware启用虚拟化功能报错
dpkg : Breaks: libapt-pkg5.0 (< 1.7~b) but 1.6.15 is to be installedE: Broken packages
尚硅谷SSM新版视频教程发布
What is pyGame
redis集群搭建及配置优化详解
效率提升98%!高海拔光伏电站运维巡检背后的AI利器
codeforces round #797 ABCDEFG
对于IT互联网行业来说,家觉得学历重要还是能力?
SQL结果导出功能,工单点不进去,点了工单,一直是空白界面,没有响应,怎么办?
Paper Time 回顾|MB2:为自治数据库建立行为模型
MCU external interrupt trigger mode: description of level trigger and edge trigger
程序员初入职场,如何规划好自己的职业生涯?
Transmission 下载列表、下载文件 迁移机器指南
IBM MQ运维使用手册
深度学习基础与实践课程笔记0&1
July training (day 20) - binary search tree
商城异地多活架构设计
openGauss内核分析:查询重写
Centos7中通过docker安装mysql