Transformer中的位置编码 发表于 2023-05-06 更新于 2024-02-08 分类于 公式推导 , NLP 0. 前言 "Attention is all you need"中有一个位置编码方案,目的是消除绝对位置的影响。本文尝试从数学角度验证该编码方案可使两位置的编码相关性只受相对位置影响,而不受绝对位置影响。 阅读全文 »
EM算法公式推导 发表于 2023-05-03 更新于 2024-02-08 分类于 公式推导 , ML 0. 前言 以下针对《统计学习方法(第二版)》的中的内容 1. 背景介绍 2. EM公式推导 记可观测变量为YYY,隐变量为ZZZ,参数为θ\thetaθ 。根据对YYY的nnn次观测,估计θ\thetaθ 阅读全文 »
pytorch多卡训练 发表于 2023-04-30 更新于 2024-02-08 分类于 笔记 , pytorch多卡训练 1. pytorch多卡训练 在Ubuntu 20.04上,探索多块显卡的分布式训练 以下代码 pytorch 1.10 和 pytorch 2.0 均通过测试 阅读全文 »
Ubuntu20.04 安装 Boost 1.70.0 发表于 2023-01-19 更新于 2024-02-08 分类于 笔记 , Ubutnu 安装 官网:https://www.boost.org/users/history/ boost 1.70.0 版本:https://boostorg.jfrog.io/artifactory/main/release/1.70.0/source/ 阅读全文 »
Docker学习笔记 发表于 2023-01-19 更新于 2024-02-08 分类于 笔记 , Ubutnu 0. 安装 sudo wget -qO- https://get.docker.com/ | sh docker --version 阅读全文 »