【论文笔记】GPT，GPT-2，GPT-3 - 服务器托管|北京服务器租用|机房托管租用|IDC托管租用|机房机柜带宽租用-价格及费用咨询

参考：GPT，GPT-2，GPT-3【论文精读】

GPT

Transformer的解码器，仅已知”过去”，推导”未来”

论文地址：Improving Language Understanding by Generative Pre-Training

半监督学习：无标签数据集预训练模型，有标签数据集微调

Transformer的编码器，完形填空，已知 “过去” 和 “未来”，推导中间值

论文地址：BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

zero-ont – 探索模型泛化能力；兼容 下游任务 的无障碍使用；

论文地址：Language Models are Unsupervised Multitask Learners

引入 prompt，提升 GPT-2 的有效性；

论文地址：language models are few-shot learners

写在最后：若本文章对您有帮助，请点个赞啦 (๑••๑)

服务器托管，北京服务器托管，服务器租用 http://www.fwqtg.net