从零构建大模型：算法、训练与微调-梁楠-编程语言与程序设计

~~编程语言与程序设计~~

从零构建大模型：算法、训练与微调

作者：梁楠字数：9万字出版社：清华大学出版社

价格：6732阅饼

免费试读购买

这是一本系统且实用的大模型构建指南，旨在引领读者从基础知识起步，逐步深入探索大模型的算法原理、训练方法及微调技术。本书共12章，涵盖了Transformer模型的基础理论，如Seq2Seq模型、分词、嵌入层和自注意力机制等关键概念；并深入剖析了GPT模型的核心实现与文本生成过程，以及BERT模型的预训练和微调技术。同时，也对ViT（视觉Transformer）模型的架构、训练方法，以及高阶微调策略如Adapter Tuning和P-Tuning进行了详尽讲解。此外，还系统地介绍了数据处理、数据增强、模型性能优化（包括混合精度训练和分布式训练）、对比学习、对抗训练、自适应优化器、动态学习率调度，以及模型蒸馏与剪枝技术等多个方面。最后，通过应用案例，展示了模型训练和微调的完整流程，助力读者将理论知识转化为实践技能。全书注重理论与实践的结合，适合希望系统掌握大模型构建、训练和优化的研发人员、高校学生，也适合对自然语言处理、计算机视觉等领域的大模型开发有兴趣的读者。还可作为培训机构和高校相关课程的教学用书。"

展开

书圈

我来说两句

快来说两句，抢沙发

看过的人还看

开端（白敬亭、赵今麦主演同名影视剧原著）

祈祷君
5
百年孤独

马尔克斯
173
活着

余华
284
蛤蟆先生去看心理医生

罗伯特·戴博德
113

正在处理。。。

即刻使用手机阅读

从零构建大模型：算法、训练与微调

获取掌阅iReader