- 本节书摘来自华章计算机《TensorFlow自然语言处理》一书中的第1章,第1.7节,[澳] 图珊·加内格达拉(Thushan Ganegedara) 著 马恩驰 陆 健 译。 本节书摘来自华章计算机《TensorFlow自然语言处理》一书中的第1章,第1.7节,[澳] 图珊·加内格达拉(Thushan Ganegedara) 著 马恩驰 陆 健 译。
- DeepSeek 绝非仅局限于 NLP 问题,其在 CV 和预测类问题领域已展现出实质性突破。通过与华为云的深度协同,更实现了从技术能力到行业应用的完整闭环。对于开发者而言,可通过华为云 ModelArts Studio 快速接入模型,探索多模态场景下的创新应用;对于企业用户,建议优先在智能质检、供应链优化、智能客服等场景进行试点,逐步释放 AI 生产力。 DeepSeek 绝非仅局限于 NLP 问题,其在 CV 和预测类问题领域已展现出实质性突破。通过与华为云的深度协同,更实现了从技术能力到行业应用的完整闭环。对于开发者而言,可通过华为云 ModelArts Studio 快速接入模型,探索多模态场景下的创新应用;对于企业用户,建议优先在智能质检、供应链优化、智能客服等场景进行试点,逐步释放 AI 生产力。
- 智能体通信协议深度解析:A2A、ANP 与 MCP 的技术架构与生态演进 智能体通信协议深度解析:A2A、ANP 与 MCP 的技术架构与生态演进
- NLP 项目的系统性验收标准与评测方案,结合行业规范、技术特性与实际案例,覆盖核心技术指标、业务适配指标、合规与安全指标三大维度,并附分阶段验收流程与工具推荐: NLP 项目的系统性验收标准与评测方案,结合行业规范、技术特性与实际案例,覆盖核心技术指标、业务适配指标、合规与安全指标三大维度,并附分阶段验收流程与工具推荐:
- 通过系统化的指标设计与合同条款约束,可确保 NLP、CV、预测项目在技术、业务和合规层面全面达标。例如,某三甲医院 AI 影像诊断系统通过 “mIoU≥95% + 误诊率≤0.3% + DICOM 合规认证” 三重验收,最终通过国家医疗质量认证;某供应链金融平台通过 “MAE≤5% + 库存周转率提升 15% + 巴塞尔协议合规审计”,实现风险控制与效率优化的双重目标。 通过系统化的指标设计与合同条款约束,可确保 NLP、CV、预测项目在技术、业务和合规层面全面达标。例如,某三甲医院 AI 影像诊断系统通过 “mIoU≥95% + 误诊率≤0.3% + DICOM 合规认证” 三重验收,最终通过国家医疗质量认证;某供应链金融平台通过 “MAE≤5% + 库存周转率提升 15% + 巴塞尔协议合规审计”,实现风险控制与效率优化的双重目标。
- 在大模型领域,我们常常会看到诸如 7B、32B、671B 这样的表述,这里的 “B” 是 “billion” 的缩写,意为 “十亿” ,用于量化大模型所包含的参数数量。参数是模型在训练过程中学习和调整的数值,参数规模在一定程度上影响着模型的性能、理解能力与生成能力。通常,参数越多,模型能够学习到的知识和模式就越丰富,理论上在处理复杂任务时表现也会更出色。接下来,为你详细梳理当前主流大模型的参数规模 在大模型领域,我们常常会看到诸如 7B、32B、671B 这样的表述,这里的 “B” 是 “billion” 的缩写,意为 “十亿” ,用于量化大模型所包含的参数数量。参数是模型在训练过程中学习和调整的数值,参数规模在一定程度上影响着模型的性能、理解能力与生成能力。通常,参数越多,模型能够学习到的知识和模式就越丰富,理论上在处理复杂任务时表现也会更出色。接下来,为你详细梳理当前主流大模型的参数规模
- NLP 并非 “唯一的大模型”,而是大模型在语言模态的典型体现;CV 大模型的 “大”,则是视觉智能从 “感知” 迈向 “认知” 的必经之路。 NLP 并非 “唯一的大模型”,而是大模型在语言模态的典型体现;CV 大模型的 “大”,则是视觉智能从 “感知” 迈向 “认知” 的必经之路。
- 在 NLP 技术快速演进的当下,Function Call(函数调用)、MCP(多模态内容处理)、Agent(智能体)与智能体系统已成为突破传统模型能力边界的关键技术。本文在原有基模、RAG 等方案基础上,深入解析这些新兴技术的适用场景,帮助开发者构建更完整的技术选型框架。 在 NLP 技术快速演进的当下,Function Call(函数调用)、MCP(多模态内容处理)、Agent(智能体)与智能体系统已成为突破传统模型能力边界的关键技术。本文在原有基模、RAG 等方案基础上,深入解析这些新兴技术的适用场景,帮助开发者构建更完整的技术选型框架。
- 在 NLP 项目落地中,技术方案的选择往往决定了开发效率与最终效果。基模(基础模型)、提示词工程、RAG(检索增强生成)、知识图谱、微调、模型增训、模型融合等技术并非 “非此即彼”,而是需要根据项目目标、数据特性、算力资源和场景约束进行组合。本文从实战角度出发,解析不同方案的适用边界与选型逻辑,帮助开发者建立系统化决策框架。 在 NLP 项目落地中,技术方案的选择往往决定了开发效率与最终效果。基模(基础模型)、提示词工程、RAG(检索增强生成)、知识图谱、微调、模型增训、模型融合等技术并非 “非此即彼”,而是需要根据项目目标、数据特性、算力资源和场景约束进行组合。本文从实战角度出发,解析不同方案的适用边界与选型逻辑,帮助开发者建立系统化决策框架。
- 1P 算力的核心价值在于将 “不可能的计算” 变为 “瞬间的现实”:在 CV 中,它让机器视觉追上甚至超越人类的感知速度;在 NLP 中,它让语言理解突破文化与逻辑的壁垒;在预测领域,它让 “未来” 以数据的形式提前呈现。这种算力规模已接近部分超级计算机的水平(如中国的 “天河” 系列),正在推动 AI 从实验室走向产业落地的关键突破 —— 例如,自动驾驶汽车的实时决策、精准医疗的基因测序分析、智 1P 算力的核心价值在于将 “不可能的计算” 变为 “瞬间的现实”:在 CV 中,它让机器视觉追上甚至超越人类的感知速度;在 NLP 中,它让语言理解突破文化与逻辑的壁垒;在预测领域,它让 “未来” 以数据的形式提前呈现。这种算力规模已接近部分超级计算机的水平(如中国的 “天河” 系列),正在推动 AI 从实验室走向产业落地的关键突破 —— 例如,自动驾驶汽车的实时决策、精准医疗的基因测序分析、智
- 结合RAG系统在实际场景中的技术挑战及客户交流高频问题,以下是基于全网检索和行业实践的整理,涵盖新旧文档查询、权限管理、数据查询与报表生成等核心场景,以及提示词设计、知识图谱、微调和复杂数据处理的具体问题: 结合RAG系统在实际场景中的技术挑战及客户交流高频问题,以下是基于全网检索和行业实践的整理,涵盖新旧文档查询、权限管理、数据查询与报表生成等核心场景,以及提示词设计、知识图谱、微调和复杂数据处理的具体问题:
- 命名实体识别(NER)是自然语言处理中的关键任务,而Stanford NLP工具包作为Java环境下的强大工具,为开发者提供了词性标注、句法分析和NER等功能。针对特定领域(如金融、医疗),默认模型可能无法满足需求,因此优化至关重要。优化方法包括数据预处理(文本清洗、分词、词性标注)、模型定制(微调CRF模型或融合多模型)、特征工程(上下文特征、领域词典)及性能提升(模型压缩、并行计算)。 命名实体识别(NER)是自然语言处理中的关键任务,而Stanford NLP工具包作为Java环境下的强大工具,为开发者提供了词性标注、句法分析和NER等功能。针对特定领域(如金融、医疗),默认模型可能无法满足需求,因此优化至关重要。优化方法包括数据预处理(文本清洗、分词、词性标注)、模型定制(微调CRF模型或融合多模型)、特征工程(上下文特征、领域词典)及性能提升(模型压缩、并行计算)。
- Java与人工智能:自然语言处理与图像识别的Java应用人工智能(AI)已经成为当今科技领域的热门话题,而Java作为一门历史悠久、生态丰富的编程语言,在AI领域也发挥着重要作用。本文将重点探讨Java在自然语言处理(NLP)和图像识别两大AI核心领域的应用,并提供详细的代码示例。 一、Java在自然语言处理中的应用自然语言处理是AI的一个重要分支,它使计算机能够理解、解释和生成人类语言。... Java与人工智能:自然语言处理与图像识别的Java应用人工智能(AI)已经成为当今科技领域的热门话题,而Java作为一门历史悠久、生态丰富的编程语言,在AI领域也发挥着重要作用。本文将重点探讨Java在自然语言处理(NLP)和图像识别两大AI核心领域的应用,并提供详细的代码示例。 一、Java在自然语言处理中的应用自然语言处理是AI的一个重要分支,它使计算机能够理解、解释和生成人类语言。...
- 引言在现代自然语言处理(NLP)领域,HuggingFace Transformers 库已经成为了不可或缺的基础工具。作为一个开源项目,它不仅提供了数千个预训练模型,还大大简化了最先进NLP模型的使用和微调过程。因此,掌握这个库的深度使用还是极为重要的。本指南将采用以下学习路径:按照基础环境搭建、核心API使用、实战案例应用、高级优化技巧来帮助各位读者渐进式地掌握它的使用。💡阅读本指南... 引言在现代自然语言处理(NLP)领域,HuggingFace Transformers 库已经成为了不可或缺的基础工具。作为一个开源项目,它不仅提供了数千个预训练模型,还大大简化了最先进NLP模型的使用和微调过程。因此,掌握这个库的深度使用还是极为重要的。本指南将采用以下学习路径:按照基础环境搭建、核心API使用、实战案例应用、高级优化技巧来帮助各位读者渐进式地掌握它的使用。💡阅读本指南...
- 从零开始用Pytorch实现LLaMA 4的混合专家(MoE)模型 介绍混合专家模型(Mixture of Experts, MoE)是深度学习中一种动态路由策略,旨在通过激活部分专家模块以减少计算量。这种模型可以根据输入数据选择最合适的专家,从而提高模型效率和准确性。LLaMA(Large Language Model Meta AI)4是一个大型语言模型,它可以与MoE结合以提升性能。... 从零开始用Pytorch实现LLaMA 4的混合专家(MoE)模型 介绍混合专家模型(Mixture of Experts, MoE)是深度学习中一种动态路由策略,旨在通过激活部分专家模块以减少计算量。这种模型可以根据输入数据选择最合适的专家,从而提高模型效率和准确性。LLaMA(Large Language Model Meta AI)4是一个大型语言模型,它可以与MoE结合以提升性能。...
上滑加载中
推荐直播
-
仓颉编程语言开源创新人才培养经验分享
2025/08/06 周三 19:00-20:00
张引 -华为开发者布道师-高校教师
热情而富有活力的仓颉社区为学生的学习提供了一个充满机遇和挑战的平台。本次直播探讨如何运用社区的力量帮助同学们变身为开源开发者,从而完成从学生到工程师身份的转变。
回顾中 -
“全域洞察·智控未来” ——云资源监控实战
2025/08/08 周五 15:00-16:00
星璇 华为云监控产品经理,霄图 华为云监控体验设计师,云枢 华为云可观测产品经理
本期直播深度解析全栈监控技术实践,揭秘华为云、头部企业如何通过智能监控实现业务零中断,分享高可用系统背后的“鹰眼系统”。即刻预约,解锁数字化转型的运维密码!
即将直播
热门标签