Архитектура GPT-2: как работает модель