Models（Architectures）

浏览 90 扫码分享 2023-11-24 00:30:00

1、architectures / models
2、Summary of the models
">

All the model checkpoints provided by Transformers are seamlessly integrated from the huggingface.co model hub where they are uploaded directly by users and organizations.
- model checkpoints：https://huggingface.co/models
- users：https://huggingface.co/users
- organizations：https://huggingface.co/organizations
  1、architectures / models
  （1）A-H
  【A】
  ALBERT (Google Research & Toyota Technological Institute at Chicago)
https://huggingface.co/docs/transformers/model_doc/albert
paper：ALBERT: A Lite BERT for Self-supervised Learning of Language Representations

【B】

BART (Facebook)

BARThez (École polytechnique)

BARTpho (VinAI Research)

BEiT (Microsoft)

BERT (Google)

BERTweet (VinAI Research)

BERT For Sequence Generation (Google)

BigBird-RoBERTa (Google Research)

BigBird-Pegasus (Google Research)

Blenderbot (Facebook)

BlenderbotSmall (Facebook)

BORT (Alexa)

ByT5 (Google Research)

【C】

CamemBERT (Inria/Facebook/Sorbonne)

CANINE (Google Research)

ConvNeXT (Facebook AI)

CLIP (from OpenAI)

ConvBERT (YituTech)

CPM (Tsinghua University)

CTRL (Salesforce)

【D】

Data2Vec (Facebook)

DeBERTa (Microsoft)

DeBERTa-v2 (Microsoft)

Decision Transformer (Berkeley/Facebook/Google)

DiT (Microsoft Research)

DeiT (Facebook)

DETR (Facebook)

DialoGPT (Microsoft Research)

DistilBERT (HuggingFace)

https://huggingface.co/docs/transformers/model_doc/distilbert
paper：DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter
The same method has been applied to compress GPT2 into DistilGPT2, RoBERTa into DistilRoBERTa, Multilingual BERT into DistilmBERT and a German version of DistilBERT.

DPR (Facebook)

DPT (Intel Labs)

【E】

EncoderDecoder (Google Research)

ELECTRA (Google Research/Stanford University)

【F】

FlauBERT (CNRS)

FNet (Google Research)

Funnel Transformer (CMU/Google Brain)

【G】

GLPN (KAIST)

GPT (OpenAI)

GPT-2 (OpenAI)

GPT-J (EleutherAI)

GPT Neo (EleutherAI)

https://huggingface.co/docs/transformers/model_doc/gpt_neo
repository：EleutherAI/gpt-neo

【H】

Hubert (Facebook)

（2）I-T

【I】

I-BERT (Berkeley)

ImageGPT (OpenAI)

【L】

LayoutLM (Microsoft Research Asia)

LayoutLMv2 (Microsoft Research Asia)

LayoutXLM (Microsoft Research Asia)

LED (AllenAI)

Longformer (AllenAI)

LUKE (Studio Ousia)

【M】

mLUKE (Studio Ousia)

LXMERT (UNC Chapel Hill)

M2M100 (Facebook)

MarianMT（Microsoft Translator Team & Jörg Tiedemann）

Machine translation models trained using OPUS data by .
https://huggingface.co/docs/transformers/model_doc/marian

MaskFormer (Meta and UIUC)

MBart (Facebook)

MBart-50 (Facebook)

Megatron-BERT (NVIDIA)

Megatron-GPT2 (NVIDIA)

MPNet (Microsoft Research)

MT5 (Google AI)

【N】

Nyströmformer (University of Wisconsin - Madison)

【P】

Pegasus (Google)

Perceiver IO (Deepmind)

PhoBERT (VinAI Research)

PLBart (UCLA NLP)

PoolFormer (Sea AI Labs)

ProphetNet (Microsoft Research)

【Q】

QDQBert (NVIDIA)

【R】

REALM (Google Research)

Reformer (Google Research)

RemBERT (Google Research)

RegNet (META Platforms)

ResNet (Microsoft Research)

RoBERTa (Facebook)

RoFormer (ZhuiyiTechnology)

【S】

SegFormer (NVIDIA)

SEW (ASAPP)

SEW-D (ASAPP)

SpeechToTextTransformer (Facebook)

SpeechToTextTransformer2 (Facebook)

Splinter (Tel Aviv University)

SqueezeBert (Berkeley)

Swin Transformer (Microsoft)

【T】

T5 (Google AI)

T5v1.1 (Google AI)

TAPAS (Google AI)

TAPEX (Microsoft Research)

Transformer-XL (Google/CMU)

TrOCR (Microsoft)

（3）U-Z

【U】

UniSpeech (Microsoft Research)

UniSpeechSat (Microsoft Research)

【V】

VAN (Tsinghua University and Nankai University)

ViLT (NAVER AI Lab/Kakao Enterprise/Kakao Brain)

Vision Transformer (ViT) (Google AI)

ViTMAE (Meta AI)

VisualBERT (UCLA NLP)

【W】

WavLM (Microsoft Research)

Wav2Vec2 (Facebook AI)

Wav2Vec2Phoneme (Facebook AI)

【X】

XGLM (Facebook AI)

XLM (Facebook)

XLM-ProphetNet (Microsoft Research)

XLM-RoBERTa (Facebook AI)

XLM-RoBERTa-XL (Facebook AI)

XLNet (Google/CMU)

XLSR-Wav2Vec2 (Facebook AI)

XLS-R (Facebook AI)

【Y】

YOSO (University of Wisconsin - Madison)

2、Summary of the models

model summary
- https://huggingface.co/docs/transformers/model_summary
To check if each model has an implementation in Flax, PyTorch or TensorFlow, or has an associated tokenizer backed by the Tokenizers library, refer to:
- https://huggingface.co/docs/transformers/index#supported-frameworks

若有收获，就点个赞吧

上一篇:

下一篇:

让时间为你证明

展开/收起文章目录