Home
  • 首页
  • 归档
  • 分类
  • 标签
  • 关于
  • 友链
  • 文档
    杂记 模板&dotfiles 常用命令及函数 算法总结 Linux杂记

DQN (Deep Q-Network) 算法

DQN (Deep Q-Network) Algorithm 算法 DQN is based on Q-Learning, it changes the estimate of the Q function from “grid search” to “network search”. It’s an off-policy algorithm, which allow us to store
2023-08-03
强化学习

SAC (Soft Actor-Critic) 算法

概述 SAC算法可以简单理解为一种将Q-Learning用于策略 πθ(a∣s)\pi_{\theta}(a|s)πθ​(a∣s) 估计的算法,由于使用了策略网络,所以可以用于解决连续问题,与梯度策略定理(A2C)或策略迭代定理(TRPO,PPO)不同,SAC策略网路的更新目标浅显易赅,就是要近似 Qπ∗(s,⋅)Q_{\pi^*}(s,\cdot)Qπ∗​(s,⋅) 对应的 softmax 分
2023-09-05
强化学习

SSH端口转发连接服务器上的Jupyter Notebook

参考 CSDN - SSH 端口转发实现 Jupyter Notebook 远程连接服务器 Jupyter Notebook在启动后会默认在服务器中的 localhost:8888 端口启动,所以我们只需要将其映射回本机即可,可以使用 ssh 中的端口转发实现,在使用 ssh 连接服务器前使用 -L 命令: ssh -L 本地地址:[本地端口,可选]:目标地址:目标端口 用户名@你的服务器地址
2024-06-12
Linux

在服务器上配置shell及神经网络框架

由于CVPR大作业需要,学校给我们申请了一些服务器账号,这里记录下服务器基本配置方法及操作流程. 登录服务器 我使用的是最简单的方法登录的服务器,直接使用ssh进行连接. (还可以使用vscode连接服务器方法,也比较方便,且可以编辑代码) Windows,可以使cmd或者PowerShell,这里推荐在Windows Store中下载Windows Terminal,集成了上述两个,而
2022-11-17
Linux

Python学习笔记

参考文献 [1] 周越.人工智能基础与进阶(Python编程)[M].上海:上海交通大学出版社,2020. Python入门基础 数学运算 5/2 = 2.5 # 直接做除法 5//2 = 2 # 整除 2**10 = 1024 # 幂次 # 下面这三个都返回的是str bin() # 转二进制 oct() # 转八进制 hex() # 转十六进制 判断 if 逻辑表示 pytho
2021-10-06
coding > Python

Pandas数据处理实例

这里列一些使用pandas包做数据处理的例子. 数据格式: 填报规则: 请在对应姓名后面按照志愿优先次序按数字1~5进行填写. | 姓名 | 数学 | 人工智能 | 计算机 | 软件工程 | 大数据管理 | ----------------------------------------------------------- | 名称1 | 1 | 2 | 3
2022-05-25
coding > Python
#pandas

Python & 算法竞赛

最近尝试使用Python打下算法题,记录下需要注意的地方吧。 使用main()函数 这样的习惯就和c++一样了,这样的好处在于如果其他文件中 import ,使用该文件中的函数,不会运行其主函数部分。 def main(): pass if __name__ == "__main__": main() 全局变量的问题 ans = 0 def main(): ans += 1 这样
2021-10-15
coding > Python

本科毕设《基于非嵌入式强化学习的卡牌游戏AI研究》相关技术

代码:KataCR,图像数据集(切片图像,分类图像):Clash-Royale-Detection-Dataset,离线数据集:Clash-Royale-Replay-Dataset 本文主要对我的本科毕设流程、算法细节进行简要介绍,首先给出本科毕设论文作为参考(有非常多冗余内容): 英文论文(投稿到 ICIRA 2024): 结题答辩P
2024-06-04

CF1614 - Codeforces Round 757 (Div. 2)

比赛链接 C. Divan and bitwise operations 题意 存在一个长度为 nnn 的正整数序列 {ai}\{a_i\}{ai​},mmm 个限制条件,每个限制条件由 l,r,xl, r, xl,r,x 构成,表示 {ai}\{a_i\}{ai​} 在区间 [l,r][l,r][l,r] 中的元素或运算值为 xxx。对于任意一个满足该条件的序列,求该序列的所有子序列的异或值
2021-12-13
coding > cf
#位运算 #数论 #动态规划

2022 xjtu校赛 B题西安二手房房价分析 pandas数据分析 线性回归模型

题意 python整理代码 由于是第一次使用pandas进行数据分析,有很多不熟悉的地方,首先记录一下. 使用的是Jupyter Notebook完成,这个做数据分析确实非常好用,效果可以直接从网页中打开: 完整代码(颜色不清楚,请使用白色背景):数据处理,回归分析-改进 使用的头文件,和绘图所用的参数 import numpy as np import panda
2022-07-03
数学建模
#pandas #线性回归
1…34567…17

搜索

Hexo Fluid
Enjoy sharing!