第 2 页 - 显示 8 / 16 篇
按年份查看归档 →
- RL学习笔记:贝尔曼公式
详细梳理了State Value与Action Value的定义,推导了贝尔曼期望方程(Bellman Expectation Equation)的通用形式及其矩阵表达。
7 min 中文 - RL学习笔记:基本概念
整理了强化学习中的State、Action、Reward等核心定义,以及马尔可夫决策过程(MDP)的组成要素。
5 min 中文 - 告别混乱:我如何用 SiliconVault 优雅地管理电子元器件库存
一款高颜值的本地化电子元器件库存管理工具。基于 Electron + Vue 3 开发,支持智能布局、BOM 一键扣减与数据可视化,专为硬件开发者打造。
7 min 中文 - Xss-labs通关全解&&XSS笔记04
分析以及笔记
9 min 中文 - Xss-labs通关全解&&XSS笔记01
分析以及笔记
18 min 中文 - Xss-labs通关全解&&XSS笔记02
分析以及笔记
8 min 中文 - Xss-labs通关全解&&XSS笔记03
分析以及笔记
13 min 中文 - 踩坑记录:我是如何把这个双语博客折腾出来的
杂谈&&博客艰辛
6 min 中文