- 本文阐述了AI时代测试工程师的能力模型转型。AI测试的核心不是验证功能,而是保障不确定系统的确定性,重点关注输出稳定性、行为可预测性和风险兜底能力。测试人员需具备看懂模型、以数据为用例、构建智能化自动化平台三大核心能力,形成完整工程闭环,从功能执行者转变为保障AI系统可靠的工程架构师,这正是新时代测试工程师的核心价值。 本文阐述了AI时代测试工程师的能力模型转型。AI测试的核心不是验证功能,而是保障不确定系统的确定性,重点关注输出稳定性、行为可预测性和风险兜底能力。测试人员需具备看懂模型、以数据为用例、构建智能化自动化平台三大核心能力,形成完整工程闭环,从功能执行者转变为保障AI系统可靠的工程架构师,这正是新时代测试工程师的核心价值。
- RAG实战指南:三招突破“幻觉”瓶颈,让你的LLM比ChatGPT更懂你的业务数据摘要(198字)作为拥有10年NLP经验的AI架构师,我上周在某大型商业银行项目中遭遇了35.7%的LLM幻觉率危机——系统竟将"贷款利率"错误生成为"存款利率"。本文基于真实企业级落地经验,深度剖析RAG技术中"幻觉"问题的三大根源,并提出三招突破性解决方案:混合检索增强、上下文感知重构和动态验证机制。通过... RAG实战指南:三招突破“幻觉”瓶颈,让你的LLM比ChatGPT更懂你的业务数据摘要(198字)作为拥有10年NLP经验的AI架构师,我上周在某大型商业银行项目中遭遇了35.7%的LLM幻觉率危机——系统竟将"贷款利率"错误生成为"存款利率"。本文基于真实企业级落地经验,深度剖析RAG技术中"幻觉"问题的三大根源,并提出三招突破性解决方案:混合检索增强、上下文感知重构和动态验证机制。通过...
- 厌倦了冗长又主观的MBTI选择题?我们开发了一个只需回答8个问题的AI模型,通过自然对话分析你的语言风格与思维模式,即可判断你的真实MBTI人格类型,准确率达99%。无需自我评价、不受情绪干扰,在轻松聊天中就能看清你的性格底色。 厌倦了冗长又主观的MBTI选择题?我们开发了一个只需回答8个问题的AI模型,通过自然对话分析你的语言风格与思维模式,即可判断你的真实MBTI人格类型,准确率达99%。无需自我评价、不受情绪干扰,在轻松聊天中就能看清你的性格底色。
- 1. 项目介绍 ProPainter是一个去掉视频里的静止和移动水印图像的AI项目。ProPainter项目地址:https://github.com/sczhou/ProPainter。 经过改写的资源包propainter_ascend20251029.zip支持使用昇腾910B显卡训练ProPainter,里面包含改写后的代码,已标注的训练数据(包括训练集和验证集)。 2. 安装训练环... 1. 项目介绍 ProPainter是一个去掉视频里的静止和移动水印图像的AI项目。ProPainter项目地址:https://github.com/sczhou/ProPainter。 经过改写的资源包propainter_ascend20251029.zip支持使用昇腾910B显卡训练ProPainter,里面包含改写后的代码,已标注的训练数据(包括训练集和验证集)。 2. 安装训练环...
- 检查环境1、SSH登录机器后,检查NPU设备状态。运行如下命令,返回NPU设备信息。npu-smi info # 在每个实例节点上运行此命令可以看到NPU卡状态npu-smi info -l | grep Total # 在每个实例节点上运行此命令可以看到总卡数,用来确认对应卡数已经挂载npu-smi info -t board -i 1 | eg... 检查环境1、SSH登录机器后,检查NPU设备状态。运行如下命令,返回NPU设备信息。npu-smi info # 在每个实例节点上运行此命令可以看到NPU卡状态npu-smi info -l | grep Total # 在每个实例节点上运行此命令可以看到总卡数,用来确认对应卡数已经挂载npu-smi info -t board -i 1 | eg...
- 如果我要学习大模型技术,按照原来的学习方式,我需要先读谷歌的论文《Attention is all you need》,然后学习Transformer原理,然后上网搜demo,运行,到最后理解,整个过程大约需要2周,前提是还得懂得机器学习、深度学习的基本原理和实操代码。 我尝试用AI来学习大模型,大约前后用了两天时间。首先直接问通义千问,让其中英文对照并详细解释论文《Attenti... 如果我要学习大模型技术,按照原来的学习方式,我需要先读谷歌的论文《Attention is all you need》,然后学习Transformer原理,然后上网搜demo,运行,到最后理解,整个过程大约需要2周,前提是还得懂得机器学习、深度学习的基本原理和实操代码。 我尝试用AI来学习大模型,大约前后用了两天时间。首先直接问通义千问,让其中英文对照并详细解释论文《Attenti...
- 基于 YOLOv8 的学生课堂行为检测-完整项目源码 一、问题背景:为什么要做“课堂行为识别”在智慧校园和数字化教学逐步落地的过程中,课堂行为数据正在从“不可量化”走向“可分析、可追溯、可评估”。在真实教学场景中,教师和管理者往往关注以下问题:学生是否专注听讲?是否存在频繁低头、趴桌、玩手机等行为?课堂互动(举手、回答问题)是否足够积极?不同时间段、不同课程的学习状态差异如何?传统方式主要... 基于 YOLOv8 的学生课堂行为检测-完整项目源码 一、问题背景:为什么要做“课堂行为识别”在智慧校园和数字化教学逐步落地的过程中,课堂行为数据正在从“不可量化”走向“可分析、可追溯、可评估”。在真实教学场景中,教师和管理者往往关注以下问题:学生是否专注听讲?是否存在频繁低头、趴桌、玩手机等行为?课堂互动(举手、回答问题)是否足够积极?不同时间段、不同课程的学习状态差异如何?传统方式主要...
- 实现 千人千面 功能的过程中,涉及到多种机器学习算法,这些算法可以根据用户的历史行为、偏好、社交网络等多维度数据来预测用户可能感兴趣的内容或商品。以下是一些常见的机器学习算法,它们在构建个性化推荐系统中扮演重要角色: 1. 协同过滤(Collaborative Filtering)协同过滤是推荐系统中最常用的技术之一,主要分为两类:用户基于(User-Based)和物品基于(Item-Bas... 实现 千人千面 功能的过程中,涉及到多种机器学习算法,这些算法可以根据用户的历史行为、偏好、社交网络等多维度数据来预测用户可能感兴趣的内容或商品。以下是一些常见的机器学习算法,它们在构建个性化推荐系统中扮演重要角色: 1. 协同过滤(Collaborative Filtering)协同过滤是推荐系统中最常用的技术之一,主要分为两类:用户基于(User-Based)和物品基于(Item-Bas...
- NPP Temperate Forest: Humboldt Redwoods State Park, California, USA, 1972-2001, R1简介该数据集包含加利福尼亚州洪堡红杉州立公园布尔溪一片老龄红杉林的立地特征、林分描述符,以及实测和计算的地上生物量、地上净初级生产力(ANPP)和木质碎屑输入数据。该数据集包含一个数据文件(.csv 格式)。通过树木重测(19... NPP Temperate Forest: Humboldt Redwoods State Park, California, USA, 1972-2001, R1简介该数据集包含加利福尼亚州洪堡红杉州立公园布尔溪一片老龄红杉林的立地特征、林分描述符,以及实测和计算的地上生物量、地上净初级生产力(ANPP)和木质碎屑输入数据。该数据集包含一个数据文件(.csv 格式)。通过树木重测(19...
- NPP Grassland: Pampa De Leman, Argentina, 1980-1982, R1简介该数据集包含两个 ASCII 文件(.txt 格式)。一个文件包含 1980 年 8 月至 1982 年 3 月在阿根廷巴塔哥尼亚北部干旱矮灌木草原上测量的月度生产力数据。第二个文件包含在 NPP 研究期间,在现场设立的气象站记录的气候数据。在潘帕德莱曼(南纬 45.43 度... NPP Grassland: Pampa De Leman, Argentina, 1980-1982, R1简介该数据集包含两个 ASCII 文件(.txt 格式)。一个文件包含 1980 年 8 月至 1982 年 3 月在阿根廷巴塔哥尼亚北部干旱矮灌木草原上测量的月度生产力数据。第二个文件包含在 NPP 研究期间,在现场设立的气象站记录的气候数据。在潘帕德莱曼(南纬 45.43 度...
- 很多程序员觉得机器学习 “难”,是因为把它当作全新的技术来学,却忽略了它的数学根基 —— 线性回归的本质是 “线性代数的超定方程组求解”,逻辑回归的核心是 “概率统计的分类概率建模”,模型评估用到 “排列组合的分类计数”。掌握这些数学思维,就能从 “调用 API” 升级为 “理解模型本质”。 很多程序员觉得机器学习 “难”,是因为把它当作全新的技术来学,却忽略了它的数学根基 —— 线性回归的本质是 “线性代数的超定方程组求解”,逻辑回归的核心是 “概率统计的分类概率建模”,模型评估用到 “排列组合的分类计数”。掌握这些数学思维,就能从 “调用 API” 升级为 “理解模型本质”。
- 基于 YOLOv8 的共享单车乱停放智能识别系统— 从数据集构建到可视化部署的完整项目 一、项目背景:为什么要做“乱停放识别”?随着共享单车在城市中的高密度投放,“最后一公里”出行问题得到了极大缓解,但随之而来的随意停放、占道堆积、盲道阻塞等问题,也成为城市治理中的一大痛点。在实际城市管理中,传统处理方式主要依赖以下手段:人工巡查(成本高、效率低)群众举报(滞后、不可控)简单规则检测(误报... 基于 YOLOv8 的共享单车乱停放智能识别系统— 从数据集构建到可视化部署的完整项目 一、项目背景:为什么要做“乱停放识别”?随着共享单车在城市中的高密度投放,“最后一公里”出行问题得到了极大缓解,但随之而来的随意停放、占道堆积、盲道阻塞等问题,也成为城市治理中的一大痛点。在实际城市管理中,传统处理方式主要依赖以下手段:人工巡查(成本高、效率低)群众举报(滞后、不可控)简单规则检测(误报...
- 微调技术简介 指令微调模型微调也被称为指令微调(Instruction Tuning)或者有监督微调(Supervised Fine-tuning, SFT),该方法利用成对的任务输入与预期输出数据,训练模型学会以问答的形式解答问题,从而解锁其任务解决潜能。经过指令微调后,大语言模型能够展现出较强的指令遵循能力,可以通过零样本学习的方式解决多种下游任务。然而,值得注意的是,指令微调并非无中... 微调技术简介 指令微调模型微调也被称为指令微调(Instruction Tuning)或者有监督微调(Supervised Fine-tuning, SFT),该方法利用成对的任务输入与预期输出数据,训练模型学会以问答的形式解答问题,从而解锁其任务解决潜能。经过指令微调后,大语言模型能够展现出较强的指令遵循能力,可以通过零样本学习的方式解决多种下游任务。然而,值得注意的是,指令微调并非无中...
- 某心理类App上线AI打卡引导功能后,第二天就接到投诉:用户历史记录明明是“坚持跑步”,AI却鼓励他“今天的冥想也要加油”。听起来像个小Bug,背后却是大模型应用测试的典型挑战。曾经测试某银行智能客服大模型时,我们按传统测试思路覆盖了所有功能点,上线后却收到大量投诉。用户问“我的信用卡为啥没提额”,模型要么答非所问,要么给出错误条件。我们这才意识到:AI大模型应用的测试,和传统软件测试的核心... 某心理类App上线AI打卡引导功能后,第二天就接到投诉:用户历史记录明明是“坚持跑步”,AI却鼓励他“今天的冥想也要加油”。听起来像个小Bug,背后却是大模型应用测试的典型挑战。曾经测试某银行智能客服大模型时,我们按传统测试思路覆盖了所有功能点,上线后却收到大量投诉。用户问“我的信用卡为啥没提额”,模型要么答非所问,要么给出错误条件。我们这才意识到:AI大模型应用的测试,和传统软件测试的核心...
- 过去一周,技术社区被一个名字反复刷屏:GLM-4.7。不是发布会造势,也不是营销话术,而是实打实地在 Coding、Agent、前端审美、工程稳定性 等多个维度,把一堆榜单和开发者的预期同时点燃。更关键的是—— 这一次,智谱 并不只是“发了个更强的模型”,而是把一整套「如何把模型练成能干活的工程体系」摊在了台面上。一、不是“参数变大”,而是模型真的更会做事了GLM-4.7 的核心变化,不在于... 过去一周,技术社区被一个名字反复刷屏:GLM-4.7。不是发布会造势,也不是营销话术,而是实打实地在 Coding、Agent、前端审美、工程稳定性 等多个维度,把一堆榜单和开发者的预期同时点燃。更关键的是—— 这一次,智谱 并不只是“发了个更强的模型”,而是把一整套「如何把模型练成能干活的工程体系」摊在了台面上。一、不是“参数变大”,而是模型真的更会做事了GLM-4.7 的核心变化,不在于...
上滑加载中
推荐直播
-
华为云码道-AI时代应用开发利器2026/03/18 周三 19:00-20:00
童得力,华为云开发者生态运营总监/姚圣伟,华为云HCDE开发者专家
本次直播由华为专家带你实战应用开发,看华为云码道(CodeArts)代码智能体如何在AI时代让你的创意应用快速落地。更有华为云HCDE开发者专家带你用码道玩转JiuwenClaw,让小艺成为你的AI助理。
回顾中 -
Skill 构建 × 智能创作:基于华为云码道的 AI 内容生产提效方案2026/03/25 周三 19:00-20:00
余伟,华为云软件研发工程师/万邵业(万少),华为云HCDE开发者专家
本次直播带来两大实战:华为云码道 Skill-Creator 手把手搭建专属知识库 Skill;如何用码道提效 OpenClaw 小说文本,打造从大纲到成稿的 AI 原创小说全链路。技术干货 + OPC创作思路,一次讲透!
回顾中 -
码道新技能,AI 新生产力——从自动视频生成到开源项目解析2026/04/08 周三 19:00-21:00
童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人
本次华为云码道 Skill 实战活动,聚焦两大 AI 开发场景:通过实战教学,带你打造 AI 编程自动生成视频 Skill,并实现对 GitHub 热门开源项目的智能知识抽取,手把手掌握 Skill 开发全流程,用 AI 提升研发效率与内容生产力。
回顾中
热门标签