强化学习概要性了解
参考:Shusen Wang - YouTubewangshusen/DRL: Deep Reinforcement Learning (github.com)《深度强化学习》王树森《神经网络与深度学习》邱锡鹏一、前置知识1. 概率论随机变量、随机变量的观测值、概率、概率质量函数、概率密度函数、条件概率、期望、随机抽样等。2. 蒙特卡洛近似蒙特卡洛(Monte Carlo)是一大类随机算法(ran
参考:Shusen Wang - YouTubewangshusen/DRL: Deep Reinforcement Learning (github.com)《深度强化学习》王树森《神经网络与深度学习》邱锡鹏一、前置知识1. 概率论随机变量、随机变量的观测值、概率、概率质量函数、概率密度函数、条件概率、期望、随机抽样等。2. 蒙特卡洛近似蒙特卡洛(Monte Carlo)是一大类随机算法(ran
下载论文:[[2103.03012v1] The Transformer Network for the Traveling Salesman Problem (arxiv.org)](https://arxiv.org/abs/2103.03012v1)代码:xbresson/TSP_Transformer: Code for TSP Transformer (github.com)前置知识Se