- 把诗意留给诗人,把难题留给盘古。共建智能世界云底座。 把诗意留给诗人,把难题留给盘古。共建智能世界云底座。
- 杭州深度求索人工智能基础技术研究有限公司发布 DeepSeek-V3 大模型。官方宣称:(1)基于自研的 MoE 模型和 671B 参数,在 14.8T token 上进行了预训练;(2)多项评测成绩超越了 Qwen2.5 - 72B 和 Llama - 3.1 - 405B 等其他开源模型 杭州深度求索人工智能基础技术研究有限公司发布 DeepSeek-V3 大模型。官方宣称:(1)基于自研的 MoE 模型和 671B 参数,在 14.8T token 上进行了预训练;(2)多项评测成绩超越了 Qwen2.5 - 72B 和 Llama - 3.1 - 405B 等其他开源模型
- 探秘SuperCLUE-Safety:为中文大模型打造的多轮对抗安全新框架 探秘SuperCLUE-Safety:为中文大模型打造的多轮对抗安全新框架
- LLMs最近非常火,例如OpenAI的ChatGPT、华为的盘古语言大模型、百度的文心一言、阿里的通义千问等。 实际生产生活中,可以基于LLMs构建个人助手、聊天机器人、信息提取工具等应用。Langchain是一种为简化使用LLM创建应用程序的框架,它本身并不实现LLMs,而是提供把LLMs相关的组件“链接”在一起的能力,以便于简化LLMs应用开发过程的难度。 LLMs最近非常火,例如OpenAI的ChatGPT、华为的盘古语言大模型、百度的文心一言、阿里的通义千问等。 实际生产生活中,可以基于LLMs构建个人助手、聊天机器人、信息提取工具等应用。Langchain是一种为简化使用LLM创建应用程序的框架,它本身并不实现LLMs,而是提供把LLMs相关的组件“链接”在一起的能力,以便于简化LLMs应用开发过程的难度。
- 数字化转型将成为推动生产方式、生活方式和治理方式变革的关键力量,那么未来5-10年数字化转型趋势有哪些? 数字化转型将成为推动生产方式、生活方式和治理方式变革的关键力量,那么未来5-10年数字化转型趋势有哪些?
- 【摘要】 本课程将深入探讨DeepSeek大模型的本地部署与API调用,帮助开发者从入门到实践,掌握这一强大工具的核心技能。课程包含四个主要部分:概述、模型本地部署、模型API调用和总结。 【摘要】 本课程将深入探讨DeepSeek大模型的本地部署与API调用,帮助开发者从入门到实践,掌握这一强大工具的核心技能。课程包含四个主要部分:概述、模型本地部署、模型API调用和总结。
- 所以,下次听到“Transformer”这个词,你可以这样理解:它不是擎天柱,但它确实是 AI 史上的一次大变形——让计算机从“文盲”进化成了“读书破万卷”的超级学霸! 🚀 所以,下次听到“Transformer”这个词,你可以这样理解:它不是擎天柱,但它确实是 AI 史上的一次大变形——让计算机从“文盲”进化成了“读书破万卷”的超级学霸! 🚀
- 所以,下次听到“模型蒸馏”时,你可以这样理解:这不是简单的“瘦身”,而是一场AI智慧的民主化运动——让技术的辉煌,不止停留在云端,更照耀到人间每一个角落。 所以,下次听到“模型蒸馏”时,你可以这样理解:这不是简单的“瘦身”,而是一场AI智慧的民主化运动——让技术的辉煌,不止停留在云端,更照耀到人间每一个角落。
- 这就像是一个传送带,Token 就是传送带上的货物: 货物太多,传送带会超载,AI 处理不过来。 货物太少,信息不完整,AI 理解会出错。 所以,Token 的合理设计,就是大模型高效运转的关键! 这就像是一个传送带,Token 就是传送带上的货物: 货物太多,传送带会超载,AI 处理不过来。 货物太少,信息不完整,AI 理解会出错。 所以,Token 的合理设计,就是大模型高效运转的关键!
- 所以,下次听到“Prompt 工程师年薪百万”时,你可以这样理解:他们其实是 AI 时代的“高级翻译官”,专门负责把人类模糊的需求,“翻译”成模型能听懂的语言。而每个人学会设计 Prompt,就等于拿到了与 AI 高效协作的“对话密码”。 所以,下次听到“Prompt 工程师年薪百万”时,你可以这样理解:他们其实是 AI 时代的“高级翻译官”,专门负责把人类模糊的需求,“翻译”成模型能听懂的语言。而每个人学会设计 Prompt,就等于拿到了与 AI 高效协作的“对话密码”。
- 所以,下次听到“大模型有几千亿个参数”时,你可以想象:这就像是一张巨大的网格,每个网格里都存储着一个数,而这些数共同描述了现实世界的复杂规律。 所以,下次听到“大模型有几千亿个参数”时,你可以想象:这就像是一张巨大的网格,每个网格里都存储着一个数,而这些数共同描述了现实世界的复杂规律。
- RFT强化微调是一种新型LLM微调方法,通过强化学习与传统微调结合,少量数据即可显著增强领域场景的模型能力。近期,华为云ModelArts Studio大模型开发平台上线强化微调RFT功能,并支持对盘古大模型进行强化微调训练。本文实验通过仅800条医疗辅诊数据训练,模型领域效果提升达10.5%,显著优于DeepSeek-R1等优质通用推理大模型,为大模型的行业领域快速落地提供全新方案。 RFT强化微调是一种新型LLM微调方法,通过强化学习与传统微调结合,少量数据即可显著增强领域场景的模型能力。近期,华为云ModelArts Studio大模型开发平台上线强化微调RFT功能,并支持对盘古大模型进行强化微调训练。本文实验通过仅800条医疗辅诊数据训练,模型领域效果提升达10.5%,显著优于DeepSeek-R1等优质通用推理大模型,为大模型的行业领域快速落地提供全新方案。
上滑加载中
推荐直播
-
华为云软件开发生产线(CodeArts)1月&2月新特性解读
2025/03/18 周二 19:00-20:00
阿星 华为云高级产品经理
不知道产品的最新特性?没法和产品团队建立直接的沟通?本期直播产品经理将为您解读华为云软件开发生产线1月&2月发布的新特性,并在直播过程中为您答疑解惑。
回顾中 -
基于能力图谱的openGauss项目闯关
2025/03/20 周四 19:00-20:30
华为开发者布道师
想成为顶级数据库开发者吗?本次直播将从银行业务系统的数据库设计出发,带你逐步掌握openGauss的建库表、数据封装、密态技术、性能调优及AI应用。通过实战案例,全面展示openGauss的强大功能,助你提升技能,为未来的职业发展打下坚实基础。立即报名,开启你的数据库进阶之旅!
回顾中 -
基于开源鸿蒙+海思星闪开发板:嵌入式系统开发实战(Day1)
2025/03/29 周六 09:00-18:00
华为开发者布道师
本次为期两天的课程将深入讲解OpenHarmony操作系统及其与星闪技术的结合应用,涵盖WS63E星闪开发板的详细介绍、“OpenHarmony+星闪”的创新实践、实验环境搭建以及编写首个“Hello World”程序等内容,旨在帮助学员全面掌握相关技术并进行实际操作
回顾中
热门标签