×

正在处理。。。

即刻使用手机阅读

编程语言与程序设计 从零构建大模型:算法、训练与微调

作者:梁楠 字数:9万字 出版社:清华大学出版社

价格:6732阅饼

免费试读 购买
扫一扫 扫一扫

这是一本系统且实用的大模型构建指南,旨在引领读者从基础知识起步,逐步深入探索大模型的算法原理、训练方法及微调技术。本书共12章,涵盖了Transformer模型的基础理论,如Seq2Seq模型、分词、嵌入层和自注意力机制等关键概念;并深入剖析了GPT模型的核心实现与文本生成过程,以及BERT模型的预训练和微调技术。同时,也对ViT(视觉Transformer)模型的架构、训练方法,以及高阶微调策略如Adapter Tuning和P-Tuning进行了详尽讲解。此外,还系统地介绍了数据处理、数据增强、模型性能优化(包括混合精度训练和分布式训练)、对比学习、对抗训练、自适应优化器、动态学习率调度,以及模型蒸馏与剪枝技术等多个方面。最后,通过应用案例,展示了模型训练和微调的完整流程,助力读者将理论知识转化为实践技能。 全书注重理论与实践的结合,适合希望系统掌握大模型构建、训练和优化的研发人员、高校学生,也适合对自然语言处理、计算机视觉等领域的大模型开发有兴趣的读者。还可作为培训机构和高校相关课程的教学用书。"

快来抢沙发~

快来说两句,抢沙发

看过的人还看

获取掌阅iReader

京ICP备11008516号 (署)网出证(京)字第143号 京ICP证090653号 京公网安备11010502030452 营业执照 广播电视节目制作经营许可证 网络文化经营许可证 电子出版物制作许可证 出版物经营许可证

2015 All Rights Reserved 掌阅科技股份有限公司 版权所有

不良信息举报:jubao@zhangyue.com 举报电话:010-59845699