- 大模型中的“自组织临界性”:智能涌现的统计物理机制 摘要随着大规模语言模型的参数量突破千亿级别,研究者们开始从复杂系统的视角审视智能涌现现象。本文探讨了大模型训练动态与“自组织临界性”理论之间的深刻联系,提出了智能涌现可能遵循类似沙堆崩塌的统计物理机制。我们将通过理论分析和代码实验,揭示大模型如何通过简单的梯度下降达到临界状态,从而产生突现能力。 一、自组织临界性:从沙堆模型到神经网络 1... 大模型中的“自组织临界性”:智能涌现的统计物理机制 摘要随着大规模语言模型的参数量突破千亿级别,研究者们开始从复杂系统的视角审视智能涌现现象。本文探讨了大模型训练动态与“自组织临界性”理论之间的深刻联系,提出了智能涌现可能遵循类似沙堆崩塌的统计物理机制。我们将通过理论分析和代码实验,揭示大模型如何通过简单的梯度下降达到临界状态,从而产生突现能力。 一、自组织临界性:从沙堆模型到神经网络 1...
- 当算力变成“新石油”:AI 芯片的战争、底层逻辑与未来爆点 当算力变成“新石油”:AI 芯片的战争、底层逻辑与未来爆点
- 一、引言:当观测不等于真实——测量误差的幽灵在因果推断的理想世界中,我们假设能够精确观测所有变量。然而,真实业务与科研场景充斥着测量误差:医疗场景:患者自我报告的"每日吸烟量"与实际生化指标存在30-50%偏差经济研究:企业申报的"研发投入"与真实支出因会计准则差异偏离20%用户行为:APP记录的"使用时长"因后台运行、统计口径问题虚高40%临床试验:血压测量因"白大褂效应"单次读数波动达... 一、引言:当观测不等于真实——测量误差的幽灵在因果推断的理想世界中,我们假设能够精确观测所有变量。然而,真实业务与科研场景充斥着测量误差:医疗场景:患者自我报告的"每日吸烟量"与实际生化指标存在30-50%偏差经济研究:企业申报的"研发投入"与真实支出因会计准则差异偏离20%用户行为:APP记录的"使用时长"因后台运行、统计口径问题虚高40%临床试验:血压测量因"白大褂效应"单次读数波动达...
- Ascend CANN 深度算子开发实践:以 Conv2D 为例解析架构原理与实战【华为根技术】卷积运算(Conv2D)是计算机视觉与深度学习模型中最具代表性、计算最密集的核心算子之一。从经典的 ResNet 到前沿的 Vision Transformer,卷积层始终是模型效率和性能的关键决定因素。在 GPU 上,你可以依赖 cuDNN;在 CPU 上,可以调用 OneDNN。但在昇腾(A... Ascend CANN 深度算子开发实践:以 Conv2D 为例解析架构原理与实战【华为根技术】卷积运算(Conv2D)是计算机视觉与深度学习模型中最具代表性、计算最密集的核心算子之一。从经典的 ResNet 到前沿的 Vision Transformer,卷积层始终是模型效率和性能的关键决定因素。在 GPU 上,你可以依赖 cuDNN;在 CPU 上,可以调用 OneDNN。但在昇腾(A...
- 神经符号混合架构:破解大模型“黑箱”的新思路 引言:大模型的“黑箱”困境当前的大型语言模型在感知和生成能力上取得了令人瞩目的成就,但它们的推理过程仍然是一个不透明的“黑箱”。这种黑箱特性带来了三大关键问题:可解释性缺失、逻辑推理薄弱和事实一致性差。神经符号混合架构(Neural-Symbolic AI)正在成为破解这一困境的突破性方向,它将神经网络的感知能力与符号系统的推理能力相结合,开辟... 神经符号混合架构:破解大模型“黑箱”的新思路 引言:大模型的“黑箱”困境当前的大型语言模型在感知和生成能力上取得了令人瞩目的成就,但它们的推理过程仍然是一个不透明的“黑箱”。这种黑箱特性带来了三大关键问题:可解释性缺失、逻辑推理薄弱和事实一致性差。神经符号混合架构(Neural-Symbolic AI)正在成为破解这一困境的突破性方向,它将神经网络的感知能力与符号系统的推理能力相结合,开辟...
- 神经辐射场(NeRF)的逆渲染:可识别性与非凸优化landscape 引言:NeRF与逆渲染的交叉领域神经辐射场(Neural Radiance Fields, NeRF)自2020年提出以来,已成为三维场景表示与视图合成的革命性技术。其核心思想是使用多层感知机(MLP)将三维坐标和观察方向映射为体积密度和颜色值。然而,逆渲染(Inverse Rendering)视角下的NeRF提出了更深... 神经辐射场(NeRF)的逆渲染:可识别性与非凸优化landscape 引言:NeRF与逆渲染的交叉领域神经辐射场(Neural Radiance Fields, NeRF)自2020年提出以来,已成为三维场景表示与视图合成的革命性技术。其核心思想是使用多层感知机(MLP)将三维坐标和观察方向映射为体积密度和颜色值。然而,逆渲染(Inverse Rendering)视角下的NeRF提出了更深...
- 首先,自然语言处理(NLP)涉及文本分析、机器翻译、情感分析等,用户可能想知道最新的进展,比如Transformer模型和BERT、GPT等预训练模型的应用。计算机视觉方面,可能涉及图像识别、目标检测、生成对抗网络(GANs)等,用户可能对最新的CV技术如Vision Transformer感兴趣。强化学习则是关于智能体在环境中学习最优策略,可能涉及深度强化学习(DRL)在游戏、机器人控制等... 首先,自然语言处理(NLP)涉及文本分析、机器翻译、情感分析等,用户可能想知道最新的进展,比如Transformer模型和BERT、GPT等预训练模型的应用。计算机视觉方面,可能涉及图像识别、目标检测、生成对抗网络(GANs)等,用户可能对最新的CV技术如Vision Transformer感兴趣。强化学习则是关于智能体在环境中学习最优策略,可能涉及深度强化学习(DRL)在游戏、机器人控制等...
- 在探讨人工智能领域的神经网络之前,我们需要明确什么是人工智能(AI)。人工智能是计算机科学的一个分支,旨在创建能够执行通常需要人类智能的任务的机器。这些任务包括但不限于视觉感知、语言理解、决策和翻译之间的语言。神经网络,或称为人工神经网络(ANN),是人工智能中的一项关键技术,它受到生物神经网络的启发。生物神经网络是构成大脑的基础,由数十亿个神经元和突触组成,负责处理和传输神经信号。类似地,... 在探讨人工智能领域的神经网络之前,我们需要明确什么是人工智能(AI)。人工智能是计算机科学的一个分支,旨在创建能够执行通常需要人类智能的任务的机器。这些任务包括但不限于视觉感知、语言理解、决策和翻译之间的语言。神经网络,或称为人工神经网络(ANN),是人工智能中的一项关键技术,它受到生物神经网络的启发。生物神经网络是构成大脑的基础,由数十亿个神经元和突触组成,负责处理和传输神经信号。类似地,...
- I. 引言:高维因果推断的挑战与机遇在数字经济时代,因果推断正面临前所未有的维度爆炸。金融科技公司的用户行为数据包含数千维特征,医疗影像分析涉及百万级像素点,电商平台的推荐系统需处理数百个用户-商品交互变量。传统因果推断方法——无论是倾向得分匹配还是双重差分——均基于"低维可观测假设",即研究者能穷尽所有混淆因素。但当特征维度p超过样本量n(p>>n),或协变量存在高度多重共线性时,传统方... I. 引言:高维因果推断的挑战与机遇在数字经济时代,因果推断正面临前所未有的维度爆炸。金融科技公司的用户行为数据包含数千维特征,医疗影像分析涉及百万级像素点,电商平台的推荐系统需处理数百个用户-商品交互变量。传统因果推断方法——无论是倾向得分匹配还是双重差分——均基于"低维可观测假设",即研究者能穷尽所有混淆因素。但当特征维度p超过样本量n(p>>n),或协变量存在高度多重共线性时,传统方...
- KNN(K Near Neighbor):k个最近的邻居,即每个样本都可以用它最接近的k个邻居来代表。KNN算法属于监督学习方式的分类算法,我的理解就是计算某给点到每个点的距离作为相似度的反馈。简单来讲,KNN就是“近朱者赤,近墨者黑”的一种分类算法。KNN是一种基于实例的学习,属于懒惰学习,即没有显式学习过程。要区分一下聚类(如Kmeans等),KNN是监督学习分类,而Kmeans是无监督... KNN(K Near Neighbor):k个最近的邻居,即每个样本都可以用它最接近的k个邻居来代表。KNN算法属于监督学习方式的分类算法,我的理解就是计算某给点到每个点的距离作为相似度的反馈。简单来讲,KNN就是“近朱者赤,近墨者黑”的一种分类算法。KNN是一种基于实例的学习,属于懒惰学习,即没有显式学习过程。要区分一下聚类(如Kmeans等),KNN是监督学习分类,而Kmeans是无监督...
- 华为CANN算子开发全解析:从基础概念到高性能数据排布在深度学习领域,算子(Operator,简称OP)是模型计算的基本单元。每一个算子承载了特定的数学运算逻辑,例如卷积(Convolution)、池化(Pooling)、归一化(Softmax)、激活函数(ReLU)等。华为CANN(Compute Architecture for Neural Networks)框架提供了强大的算子支持... 华为CANN算子开发全解析:从基础概念到高性能数据排布在深度学习领域,算子(Operator,简称OP)是模型计算的基本单元。每一个算子承载了特定的数学运算逻辑,例如卷积(Convolution)、池化(Pooling)、归一化(Softmax)、激活函数(ReLU)等。华为CANN(Compute Architecture for Neural Networks)框架提供了强大的算子支持...
- 一、神经元的"心跳":激活函数在人工神经网络的世界里,每个节点都是一个虚拟神经元。就像人类大脑中神经元传递信号需要突触连接,机器学习中的神经元也需要某种"触发机制"。这就是激活函数的核心作用——它决定着信息是否继续向前传递。想象一下教室里的举手发言场景。如果把输入数据看作学生提出的问题,激活函数就是老师的判断标准。当问题的"强度"超过某个阈值(比如"这个问题值得讨论"),老师才会允许学生站... 一、神经元的"心跳":激活函数在人工神经网络的世界里,每个节点都是一个虚拟神经元。就像人类大脑中神经元传递信号需要突触连接,机器学习中的神经元也需要某种"触发机制"。这就是激活函数的核心作用——它决定着信息是否继续向前传递。想象一下教室里的举手发言场景。如果把输入数据看作学生提出的问题,激活函数就是老师的判断标准。当问题的"强度"超过某个阈值(比如"这个问题值得讨论"),老师才会允许学生站...
- 清晨拿起手机拍摄早餐,AI助手已悄然完成一系列复杂运算:识别出吐司边缘的焦黄纹理、咖啡杯上的品牌标志,甚至精准定位桌面上散落的钥匙位置。这场静默的技术革命中,特征提取与映射、目标检测与分割、图像识别与分类三大核心技术,正构建着数字世界的视觉认知体系。 一、特征提取与映射:开启数据的维度跃升在人工智能的世界里,原始数据如同未经雕琢的矿石,特征提取便是提炼精华的关键工序。通过手工设计的SIFT(... 清晨拿起手机拍摄早餐,AI助手已悄然完成一系列复杂运算:识别出吐司边缘的焦黄纹理、咖啡杯上的品牌标志,甚至精准定位桌面上散落的钥匙位置。这场静默的技术革命中,特征提取与映射、目标检测与分割、图像识别与分类三大核心技术,正构建着数字世界的视觉认知体系。 一、特征提取与映射:开启数据的维度跃升在人工智能的世界里,原始数据如同未经雕琢的矿石,特征提取便是提炼精华的关键工序。通过手工设计的SIFT(...
- 一、引言后处理效果(Post-Processing Effects)是游戏开发中提升画面表现力的核心技术之一。它通过对渲染完成的图像进行二次处理(如模糊、泛光、色彩调整等),模拟真实光学效果或艺术化风格。在Cocos2d-x中,原生引擎未内置复杂后处理功能,需通过扩展库(如cocos2d-x-extension、RenderTexture)实现。本文系统讲解后处理的核心原理、实现方法及实战... 一、引言后处理效果(Post-Processing Effects)是游戏开发中提升画面表现力的核心技术之一。它通过对渲染完成的图像进行二次处理(如模糊、泛光、色彩调整等),模拟真实光学效果或艺术化风格。在Cocos2d-x中,原生引擎未内置复杂后处理功能,需通过扩展库(如cocos2d-x-extension、RenderTexture)实现。本文系统讲解后处理的核心原理、实现方法及实战...
- 一、技术方案对比:UWB vs 蓝牙 AOA vs 混合定位UWB 技术:高精度但高成本精度:厘米级 (10-30cm),抗多径干扰强,适合金属环境成本:基站 (5000-20000 元 / 个)+ 标签 (数百元 / 个),部署成本高部署:需精确同步 (有线 / 无线时钟),至少 3-4 个基站实现三维定位,密度约每 50-100㎡一个结论:精度最佳但成本过高,适合高价值物资 (如医疗设备... 一、技术方案对比:UWB vs 蓝牙 AOA vs 混合定位UWB 技术:高精度但高成本精度:厘米级 (10-30cm),抗多径干扰强,适合金属环境成本:基站 (5000-20000 元 / 个)+ 标签 (数百元 / 个),部署成本高部署:需精确同步 (有线 / 无线时钟),至少 3-4 个基站实现三维定位,密度约每 50-100㎡一个结论:精度最佳但成本过高,适合高价值物资 (如医疗设备...
上滑加载中
推荐直播
-
华为云码道-AI时代应用开发利器2026/03/18 周三 19:00-20:00
童得力,华为云开发者生态运营总监/姚圣伟,华为云HCDE开发者专家
本次直播由华为专家带你实战应用开发,看华为云码道(CodeArts)代码智能体如何在AI时代让你的创意应用快速落地。更有华为云HCDE开发者专家带你用码道玩转JiuwenClaw,让小艺成为你的AI助理。
回顾中 -
Skill 构建 × 智能创作:基于华为云码道的 AI 内容生产提效方案2026/03/25 周三 19:00-20:00
余伟,华为云软件研发工程师/万邵业(万少),华为云HCDE开发者专家
本次直播带来两大实战:华为云码道 Skill-Creator 手把手搭建专属知识库 Skill;如何用码道提效 OpenClaw 小说文本,打造从大纲到成稿的 AI 原创小说全链路。技术干货 + OPC创作思路,一次讲透!
回顾中 -
码道新技能,AI 新生产力——从自动视频生成到开源项目解析2026/04/08 周三 19:00-21:00
童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人
本次华为云码道 Skill 实战活动,聚焦两大 AI 开发场景:通过实战教学,带你打造 AI 编程自动生成视频 Skill,并实现对 GitHub 热门开源项目的智能知识抽取,手把手掌握 Skill 开发全流程,用 AI 提升研发效率与内容生产力。
回顾中
热门标签