В разделе Статьи опубликована новая статья Generative Pretrained Transformer — общий взгляд на архитектуру, в которой я постарался простыми словами объяснить работу пайплайна GPT.
На странице Generative Pretrained Transformer — конспект доступно больше технических подробностей для углубления понимания.