1925
5775
研究生
我们通过使用自定义内核和 torch.compile 的组合,使用 Accelerated PyTorch 2 transformer 实现了训练 transformer 模型的大幅加速,特别是大语言模型。
使用道具 举报
本版积分规则 发表回复 回帖后跳转到最后一页