云海仙泽 Hexo
  • 首页
  • 归档
  • 分类
  • 标签
  • 关于
  • 友链
NVIDIA-GPU历史

NVIDIA-GPU历史

笔者调研了NVIDIA-GPU的发展历史,并进行做了简单归纳。
2021-12-25
常看常新
#深度学习 #GPU
Megatron-LM中的权重初始化

Megatron-LM中的权重初始化

笔者近期的工作中,对Megatron-LM和PyTorch中权重的初始化方式产生了疑惑,尝试解读源码进行分析。
2024-12-01
保住饭碗
#Megatron-LM #PyTorch #深度学习
Megatron-LM中的loss-scale

Megatron-LM中的loss-scale

loss-scale被广泛用于混精训练中,扩大反向传播过程中的参数梯度计算。笔者进一步解读了Megatron-LM框架中的loss-scale设置到应用的完整过程,希望能加深理解。
2024-06-05
保住饭碗
#Megatron-LM #PyTorch #深度学习

大模型中的计算和内存占用理论分析

简单探讨一下Decoder only的Transformer大模型,其在理论计算复杂度和内存占用分析(模型状态量和激活值内存)。
2024-05-01
保住饭碗
#深度学习
Matlab 命令行安装

Matlab 命令行安装

简单记录一下在命令行模式下安装并激活科大正版Matlab的过程。
2024-03-12
运维苦海
#Ubuntu #Matlab
vscode-server端问题记录

vscode-server端问题记录

vscode-remote连接神威时,vscode-server触发了更新,由于复杂的网络问题,导致一直卡在vscode-server的下载安装和初始化部分。
2023-09-09
助人为乐
#vscode
Git 学习整理

Git 学习整理

笔者时隔一年再次整理关于git较新内容的整理,为日常使用服务,原理不做过多介绍。
2022-09-25
常看常新
#Git
Vim 学习整理

Vim 学习整理

Vim对于提高编写生产力有很大帮助,笔者正在适应在日常场景下,更多地使用Vim进行代码编写工作。
2022-08-17
常看常新
#Vim
TVM安装

TVM安装

笔者近期的工作涉及到TVM的使用,故开一坑,简单记录。
2022-07-26
助人为乐
#深度学习 #TVM
openMP简记

openMP简记

学习使用单核多线程的CPU编程模式(openMP)来撰写并行程序。
2022-06-30
常看常新
#openMP #并行程序
123

搜索

Hexo Fluid
载入天数... 载入时分秒...
正在加载今日诗词....

总访问量 次 总访客数 人