- 大模型API调用会用,但不理解背后原理?微调训练无从下手?本文从底层架构到工程实践,拆解完整技术路径。 大模型技术体系全景:从原理到工程实践随着ChatGPT引发的AI浪潮,大模型技术已成为开发者必备技能。但从API调用到深入理解架构原理,再到企业级应用落地,中间存在明显的知识断层。本文整理了一套完整的学习资源,帮助开发者系统掌握大模型技术栈。 技术栈覆盖范围基础理论层内容涵盖必要的数学基础... 大模型API调用会用,但不理解背后原理?微调训练无从下手?本文从底层架构到工程实践,拆解完整技术路径。 大模型技术体系全景:从原理到工程实践随着ChatGPT引发的AI浪潮,大模型技术已成为开发者必备技能。但从API调用到深入理解架构原理,再到企业级应用落地,中间存在明显的知识断层。本文整理了一套完整的学习资源,帮助开发者系统掌握大模型技术栈。 技术栈覆盖范围基础理论层内容涵盖必要的数学基础...
- 本文详解通过火山方舟平台为博客接入DeepSeek-V3智能摘要功能的完整流程。开发者可快速实现2000字文章→3句精华摘要+关键词提取,显著提升用户体验。转载链接: https://woolyun.com/deepseek-ai-summary/ 本文详解通过火山方舟平台为博客接入DeepSeek-V3智能摘要功能的完整流程。开发者可快速实现2000字文章→3句精华摘要+关键词提取,显著提升用户体验。转载链接: https://woolyun.com/deepseek-ai-summary/
- 为什么我说现阶段的AI不懂推理,只是一个大规模的规则引擎,通俗一点讲就是大力出奇迹,通过大量的GPU,TPU的算力,暴力计算。或者像DeepSeek这样做一些算法的优化,即所谓的“蒸馏模型”,减少算力,来提升回答的效果。 为什么我说现阶段的AI不懂推理,只是一个大规模的规则引擎,通俗一点讲就是大力出奇迹,通过大量的GPU,TPU的算力,暴力计算。或者像DeepSeek这样做一些算法的优化,即所谓的“蒸馏模型”,减少算力,来提升回答的效果。
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签