2024开悟智能体比赛(学习期) 环境启动方法 为了能直接使用 test_train.py 进行模型训练并保存(比客户端训练效率更高),显示当前镜像下载速度,推荐如下直接使用命令行打开镜像的方法。 我们以打开走迷宫的代码为例: 在腾讯开悟APP中设置工作空间为 .../kaiwu2024/gorgewalk/(路径自选),启动开发环境(CPU或GPU随便选),在容器检测已完成后就可以停止启动。 打开 .../kaiw 2024-07-18 coding > 比赛
CALVT - 2023劳动竞赛(智能体对抗)总结 China Academy of Launch Vehicle Technology (CALVT) 中国运载火箭技术研究院(航天工业部第一研究院) 劳动竞赛环境:百度网盘 - 劳动竞赛2023 完整代码GitHub:GitHub-Blog-file-CALVT2023 也可以从上面的网盘分享中下载 CALVT2023_太初.zip,解压后执行 agent_train.py 即可看到红蓝方执行设 2023-11-20 coding > 比赛
github使用镜像源加速clone 老方法(无法使用): 只需要将 github.com/… 改为 github.com.cnpmjs.org/… 即可使用镜像库clone 新的代理源:https://mirror.ghproxy.com/ 在原有的 clone 连接前面加上https://mirror.ghproxy.com/即可使用代理。 git clone https://mirror.ghproxy.com/https: 2021-07-27 tools
DQN (Deep Q-Network) 算法 DQN (Deep Q-Network) Algorithm 算法 DQN is based on Q-Learning, it changes the estimate of the Q function from “grid search” to “network search”. It’s an off-policy algorithm, which allow us to store 2023-08-03 强化学习
Scikit-Learn 常用函数及模型写法 Scikit-learn安装 pip install scikit-learn # 基础包安装 pip install scikit-image # 图像处理包 Scikit-Learn设计原则 参考论文API design for machine learning software: experiences from the scikit-learn project,这里给出Scikit- 2022-12-29 机器学习 #scikit-learn
A2C (Advantage Actor-Critic) 算法 A2C (Advantage Actor-Critic) Algorithm 算法 设 π(a∣s;θ)\pi(a|s;\theta)π(a∣s;θ) 为当前智能体策略网络,其中 θ\thetaθ 为网络参数,Vπ(S)V_\pi(S)Vπ(S) 为状态价值函数,最优化目标 maxθES[Vπ(S)]=:J(θ)\max_\theta\mathbb{E}_S[V_{\pi}(S)] =: 2023-08-03 强化学习
SAC (Soft Actor-Critic) 算法 概述 SAC算法可以简单理解为一种将Q-Learning用于策略 πθ(a∣s)\pi_{\theta}(a|s)πθ(a∣s) 估计的算法,由于使用了策略网络,所以可以用于解决连续问题,与梯度策略定理(A2C)或策略迭代定理(TRPO,PPO)不同,SAC策略网路的更新目标浅显易赅,就是要近似 Qπ∗(s,⋅)Q_{\pi^*}(s,\cdot)Qπ∗(s,⋅) 对应的 softmax 分 2023-09-05 强化学习
SSH端口转发连接服务器上的Jupyter Notebook 参考 CSDN - SSH 端口转发实现 Jupyter Notebook 远程连接服务器 Jupyter Notebook在启动后会默认在服务器中的 localhost:8888 端口启动,所以我们只需要将其映射回本机即可,可以使用 ssh 中的端口转发实现,在使用 ssh 连接服务器前使用 -L 命令: ssh -L 本地地址:[本地端口,可选]:目标地址:目标端口 用户名@你的服务器地址 2024-06-12 Linux
在服务器上配置shell及神经网络框架 由于CVPR大作业需要,学校给我们申请了一些服务器账号,这里记录下服务器基本配置方法及操作流程. 登录服务器 我使用的是最简单的方法登录的服务器,直接使用ssh进行连接. (还可以使用vscode连接服务器方法,也比较方便,且可以编辑代码) Windows,可以使cmd或者PowerShell,这里推荐在Windows Store中下载Windows Terminal,集成了上述两个,而 2022-11-17 Linux
Pandas数据处理实例 这里列一些使用pandas包做数据处理的例子. 数据格式: 填报规则: 请在对应姓名后面按照志愿优先次序按数字1~5进行填写. | 姓名 | 数学 | 人工智能 | 计算机 | 软件工程 | 大数据管理 | ----------------------------------------------------------- | 名称1 | 1 | 2 | 3 2022-05-25 coding > Python #pandas