labml-nn:带注释的 pyTorch 论文实现

news/2024/7/8 2:03:07 标签: pytorch, 人工智能, python

作者:CSDN @ _养乐多_

labml-nn库集合了多种神经网络和相关算法的简单 PyTorch 实现,可以帮助我们快速开发深度学习模型。并配有逐行解释代码的文档。

一、网站

给大家分享一个深度学习模型代码逐行解释网站(https://nn.labml.ai/),主流模型都包含在里面。

在这里插入图片描述

该网站中文翻译网站:https://nn.labml.ai/zh/

该网站可以逐行解释深度模型代码。

在这里插入图片描述

二、主要包含的模型

主要包含的模型有

类型项目
Transformers多头注意力、Transformer构建模块、Transformer XL、相对多头注意力、旋转位置嵌入(RoPE)、带线性偏置的注意力(ALiBi)、RETRO、压缩Transformer、GPT架构、GLU变种、kNN-LM: 通过记忆实现泛化、反馈Transformer、开关Transformer、快速权重Transformer、FNet、无注意力Transformer、掩码语言模型、MLP-Mixer: 用于视觉的全MLP架构、关注MLPs(gMLP)、视觉Transformer(ViT)、Primer EZ、Hourglass
Eleuther GPT-NeoX在48GB GPU上生成、在两个48GB GPU上微调、LLM.int8()
扩散模型(Diffusion models)降噪扩散概率模型(DDPM)、降噪扩散隐式模型(DDIM)、潜在扩散模型、稳定扩散
生成对抗网络(Generative Adversarial Networks)原始GAN、具有深度卷积网络的GAN、Cycle GAN、Wasserstein GAN、具有梯度惩罚的Wasserstein GAN、StyleGAN 2
递归高速公路网络(Recurrent Highway Networks)循环公路网络
LSTM
HyperNetworks - HyperLSTM超网络 - HyperLSTM
ResNet残差网络
ConvMixer
胶囊网络(Capsule Networks)
U-Net
Sketch RNN
图神经网络(Graph Neural Networks)图注意力网络(GAT)、图注意力网络v2(GATv2)
强化学习(Reinforcement Learning)近端策略优化与广义优势估计、具有双网络、优先回放和双Q网络的深度Q网络
反事实遗憾最小化(CFR)用 CFR 解决信息不完全的游戏,例如扑克。库恩扑克
优化器(Optimizers)Adam、AMSGrad、具有预热的Adam优化器、Noam优化器、修正的Adam优化器、AdaBelief优化器、Sophia-G优化器
标准化层(Normalization Layers)批标准化、层标准化、实例标准化、组标准化、权重标准化、批-通道标准化、DeepNorm
蒸馏(Distillation)
自适应计算(Adaptive Computation)PonderNet
不确定性(Uncertainty)用于分类不确定性量化的证据深度学习
激活函数(Activations)模糊平铺激活(Fuzzy Tiling Activations)
语言模型抽样技术(Language Model Sampling Techniques)贪婪抽样、温度抽样、前k个抽样、核抽样(Nucleus Sampling)
可扩展训练/推理(Scalable Training/Inference)Zero3内存优化

三、github代码

https://github.com/labmlai/annotated_deep_learning_paper_implementations/tree/master/labml_nn

四、pip安装

pip install labml-nn

http://www.niftyadmin.cn/n/5023363.html

相关文章

优维低代码实践:菜单

优维低代码技术专栏,是一个全新的、技术为主的专栏,由优维技术委员会成员执笔,基于优维7年低代码技术研发及运维成果,主要介绍低代码相关的技术原理及架构逻辑,目的是给广大运维人提供一个技术交流与学习的平台。 优维…

网站不收录没排名降权怎么处理-紧急措施可恢复网站

网站降权对于SEO人员来说是非常致命的打击,因为网站一旦被搜索引擎降权,排名会严重地下降,网站的流量也会大幅下降,直接影响到收益。而且处理不好的话会导致恢复的时间周期无限拉长,所以网站被降权后我们要第一时间采取…

Matlab之DICOM(数字图像和通信医学)格式图像数据读取函数dicomread

一、DICOM是什么? DICOM是数字图像和通信医学格式的图像数据,在MATLAB中,可以使用dicomread函数读取DICOM格式的图像数据。 二、dicomread函数 使用方法如下: imageData dicomread(filename);其中,filename表示DI…

【数据仓库设计基础1】关系数据模型理论与数据仓库Inmon方法论

文章目录 一. 关系数据模型中的结构1.关系2.属性3.属性域4.元组5. 关系数据库6.关系表的属性7.关系数据模型中的键 二. 关系完整性1.空值(NULL)2.关系完整性规…

出行计划(2023寒假每日一题 16)

最近西西艾弗岛上出入各个场所都要持有一定时限内的核酸检测阴性证明。 具体来时,如果在 t t t 时刻做了核酸检测,则经过一段时间后可以得到核酸检测阴性证明。 这里我们假定等待核酸检测结果需要 k k k 个单位时间,即在 t k tk tk 时刻…

Vue自动生成二维码并可下载二维码

遇到一个需求,需要前端自行生成用户的个人名片分享二维码,并提供二维码下载功能。在网上找到很多解决方案,最终吭哧吭哧做完了,把它整理记录一下,方便后续学习使用!嘿嘿O(∩_∩)O~ 这个小东西有以下功能特点…

微信小程序手写时间间隔组件,可设置间隔时间一分钟,半小时,一小时的间隔

纯手写时间间隔组件 需求:小程序中可以根据时间段进行选择开始时间和结束时间,如:当前时间是09:00, 则我可以从9点开始选择时间,每半个小时为间隔,那么下一个时间就算9:30&#xff…

【深度学习】 Python 和 NumPy 系列教程(九):NumPy详解:1、创建数组的n种方式

目录 一、前言 二、实验环境 三、NumPy 0. 多维数组对象(ndarray) a. 多维数组的属性 1. 创建数组 a. 使用numpy.array函数: b. 使用numpy.zeros函数 c. 使用numpy.ones函数 d. 使用numpy.arange函数 e. 使用numpy.linspace函数 …