- 【摘要】 本课程将深入探讨DeepSeek大模型的本地部署与API调用,帮助开发者从入门到实践,掌握这一强大工具的核心技能。课程包含四个主要部分:概述、模型本地部署、模型API调用和总结。 【摘要】 本课程将深入探讨DeepSeek大模型的本地部署与API调用,帮助开发者从入门到实践,掌握这一强大工具的核心技能。课程包含四个主要部分:概述、模型本地部署、模型API调用和总结。
- 所以,下次听到“Transformer”这个词,你可以这样理解:它不是擎天柱,但它确实是 AI 史上的一次大变形——让计算机从“文盲”进化成了“读书破万卷”的超级学霸! 🚀 所以,下次听到“Transformer”这个词,你可以这样理解:它不是擎天柱,但它确实是 AI 史上的一次大变形——让计算机从“文盲”进化成了“读书破万卷”的超级学霸! 🚀
- 所以,下次听到“模型蒸馏”时,你可以这样理解:这不是简单的“瘦身”,而是一场AI智慧的民主化运动——让技术的辉煌,不止停留在云端,更照耀到人间每一个角落。 所以,下次听到“模型蒸馏”时,你可以这样理解:这不是简单的“瘦身”,而是一场AI智慧的民主化运动——让技术的辉煌,不止停留在云端,更照耀到人间每一个角落。
- 这就像是一个传送带,Token 就是传送带上的货物: 货物太多,传送带会超载,AI 处理不过来。 货物太少,信息不完整,AI 理解会出错。 所以,Token 的合理设计,就是大模型高效运转的关键! 这就像是一个传送带,Token 就是传送带上的货物: 货物太多,传送带会超载,AI 处理不过来。 货物太少,信息不完整,AI 理解会出错。 所以,Token 的合理设计,就是大模型高效运转的关键!
- 所以,下次听到“Prompt 工程师年薪百万”时,你可以这样理解:他们其实是 AI 时代的“高级翻译官”,专门负责把人类模糊的需求,“翻译”成模型能听懂的语言。而每个人学会设计 Prompt,就等于拿到了与 AI 高效协作的“对话密码”。 所以,下次听到“Prompt 工程师年薪百万”时,你可以这样理解:他们其实是 AI 时代的“高级翻译官”,专门负责把人类模糊的需求,“翻译”成模型能听懂的语言。而每个人学会设计 Prompt,就等于拿到了与 AI 高效协作的“对话密码”。
- 所以,下次听到“大模型有几千亿个参数”时,你可以想象:这就像是一张巨大的网格,每个网格里都存储着一个数,而这些数共同描述了现实世界的复杂规律。 所以,下次听到“大模型有几千亿个参数”时,你可以想象:这就像是一张巨大的网格,每个网格里都存储着一个数,而这些数共同描述了现实世界的复杂规律。
- RFT强化微调是一种新型LLM微调方法,通过强化学习与传统微调结合,少量数据即可显著增强领域场景的模型能力。近期,华为云ModelArts Studio大模型开发平台上线强化微调RFT功能,并支持对盘古大模型进行强化微调训练。本文实验通过仅800条医疗辅诊数据训练,模型领域效果提升达10.5%,显著优于DeepSeek-R1等优质通用推理大模型,为大模型的行业领域快速落地提供全新方案。 RFT强化微调是一种新型LLM微调方法,通过强化学习与传统微调结合,少量数据即可显著增强领域场景的模型能力。近期,华为云ModelArts Studio大模型开发平台上线强化微调RFT功能,并支持对盘古大模型进行强化微调训练。本文实验通过仅800条医疗辅诊数据训练,模型领域效果提升达10.5%,显著优于DeepSeek-R1等优质通用推理大模型,为大模型的行业领域快速落地提供全新方案。
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢
2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考
2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本
2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签