- 聚类模型的训练 聚类模型最重要的就是(K-means) KMeans算法的基本思想如下: 随机选择K个点作为初始质心 While 簇发生变化或小于最大迭代次数: 将每个点指派到最近的质心,形成K个簇 重新计算每个簇的质心 图中有3个初始质点,形成的3个簇,再计算每个簇的质心,比较差别 # 生成数据 make_blobs import numpy as ... 聚类模型的训练 聚类模型最重要的就是(K-means) KMeans算法的基本思想如下: 随机选择K个点作为初始质心 While 簇发生变化或小于最大迭代次数: 将每个点指派到最近的质心,形成K个簇 重新计算每个簇的质心 图中有3个初始质点,形成的3个簇,再计算每个簇的质心,比较差别 # 生成数据 make_blobs import numpy as ...
- 信道中的频域均衡器中,它是用可调滤波器的频域特性去补偿基带系统的频域特性,使系统总的传输函数满足无失真传输条件; 时域均衡器,使用均衡器产生的波形去补偿已经变形的波形,使总的输出波形满足无码间串扰的条件。 如何用波形去补偿波形呢? 比如说在基带传输中,接收到某一个脉冲信号,由于信道不理想,出现了拖尾, 这个拖尾可能会对抽样点上的其他码元产生干扰,现在用均衡器产生了一个补偿波... 信道中的频域均衡器中,它是用可调滤波器的频域特性去补偿基带系统的频域特性,使系统总的传输函数满足无失真传输条件; 时域均衡器,使用均衡器产生的波形去补偿已经变形的波形,使总的输出波形满足无码间串扰的条件。 如何用波形去补偿波形呢? 比如说在基带传输中,接收到某一个脉冲信号,由于信道不理想,出现了拖尾, 这个拖尾可能会对抽样点上的其他码元产生干扰,现在用均衡器产生了一个补偿波...
- 过拟合(高方差) 当我们的数据无法满足我们模型的复杂度时会过拟合,也就是我们的变量过多,模型很复杂,导致在我们的训练集中我们的将我们的训练样本拟合的非常好,但是在测试样本中测试的准确率比较低,模型的泛化能力差,就会出现过拟合的问题。 通俗一点地来说过拟合就是模型把数据学习的太彻底,以至于把噪声数据的特征也学习到了,这样就会导致在后期测试的时候不能够很好地识别数据,即... 过拟合(高方差) 当我们的数据无法满足我们模型的复杂度时会过拟合,也就是我们的变量过多,模型很复杂,导致在我们的训练集中我们的将我们的训练样本拟合的非常好,但是在测试样本中测试的准确率比较低,模型的泛化能力差,就会出现过拟合的问题。 通俗一点地来说过拟合就是模型把数据学习的太彻底,以至于把噪声数据的特征也学习到了,这样就会导致在后期测试的时候不能够很好地识别数据,即...
- 什么是Gensim Gensim是一款开源的第三方Python工具包,用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达。它支持包括TF-IDF,LSA,LDA,和word2vec在内的多种主题模型算法,支持流式训练,并提供了诸如相似度计算,信息检索等一些常用任务的API接口 补充一些概念: 语料(Corpus):一组原始文本的集合,用于无监督... 什么是Gensim Gensim是一款开源的第三方Python工具包,用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达。它支持包括TF-IDF,LSA,LDA,和word2vec在内的多种主题模型算法,支持流式训练,并提供了诸如相似度计算,信息检索等一些常用任务的API接口 补充一些概念: 语料(Corpus):一组原始文本的集合,用于无监督...
- 对于任何一个深度学习的框架,都能够训练文本数据,当然NLTK在自然语言处理也占有一定的名声和权重 任何东西都离不开你我 来源 github # 导入torch的模块 import torch import torch.nn as nn from torch.autograd import Variable import torch.optim as optim i... 对于任何一个深度学习的框架,都能够训练文本数据,当然NLTK在自然语言处理也占有一定的名声和权重 任何东西都离不开你我 来源 github # 导入torch的模块 import torch import torch.nn as nn from torch.autograd import Variable import torch.optim as optim i...
- 上篇通过实例了解了过拟合,那如何处理将是本文处理的问题 Dropout抑制过拟合 在每一次训练中,随机丢弃一部分隐藏单元,从而加强另一部分单元的学习 原理 取平均的作用:先回到标准的模型没有dropout,我们会用相同的训练数据去训练5个不同的神经网络,一般会得到5个不同的结果,此时我们可以采用“5个结果取均值”或者“对数取胜的投票策略”去决定最懂结果... 上篇通过实例了解了过拟合,那如何处理将是本文处理的问题 Dropout抑制过拟合 在每一次训练中,随机丢弃一部分隐藏单元,从而加强另一部分单元的学习 原理 取平均的作用:先回到标准的模型没有dropout,我们会用相同的训练数据去训练5个不同的神经网络,一般会得到5个不同的结果,此时我们可以采用“5个结果取均值”或者“对数取胜的投票策略”去决定最懂结果...
- 在讲內积空间之前,先提一下线性空间,这是內积空间的基础,也是我们学习任何一门理科所必备的常识。 线性空间介绍: 向量空间亦称向量空间。它是线性代数的中心内容和基本概念之一。设V是一个非空集合,P是一个域。若: 1.在V中定义了一种运算,称为加法,即对V中任意两个元素α与β都按... 在讲內积空间之前,先提一下线性空间,这是內积空间的基础,也是我们学习任何一门理科所必备的常识。 线性空间介绍: 向量空间亦称向量空间。它是线性代数的中心内容和基本概念之一。设V是一个非空集合,P是一个域。若: 1.在V中定义了一种运算,称为加法,即对V中任意两个元素α与β都按...
- 前些时间,可能是导师随口一提机器学习,再加上室友们都是人工智能学院的学生,对机器学习等耳濡目染。鉴于目前的趋势,人工智能的浪潮来袭,有必要了解乃至认真学习一番,于是就从寻找入门的博客开始学习,机缘巧合,让我遇到了这么一个系列,看了几篇后,受益匪浅,对人工智能竟然有了一丝的想法。 当然收益不仅于此,看到了博主将博客的内容以目录的形式展示出来,这个想法让我也想对自己的博客条理化... 前些时间,可能是导师随口一提机器学习,再加上室友们都是人工智能学院的学生,对机器学习等耳濡目染。鉴于目前的趋势,人工智能的浪潮来袭,有必要了解乃至认真学习一番,于是就从寻找入门的博客开始学习,机缘巧合,让我遇到了这么一个系列,看了几篇后,受益匪浅,对人工智能竟然有了一丝的想法。 当然收益不仅于此,看到了博主将博客的内容以目录的形式展示出来,这个想法让我也想对自己的博客条理化...
- 特征工程 数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上 限而已。根据特征使用方案,有计划地获取、处理和监控数据和特征的工作称之为特征工程,目的是 最大限度地从原始数据中提取特征以供算法和模型使用。 根据特征选择的形式又可以将特征选择方法分为3种: 用sklearn中的feature_selection库来进行特征选择 Filter: 过滤法... 特征工程 数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上 限而已。根据特征使用方案,有计划地获取、处理和监控数据和特征的工作称之为特征工程,目的是 最大限度地从原始数据中提取特征以供算法和模型使用。 根据特征选择的形式又可以将特征选择方法分为3种: 用sklearn中的feature_selection库来进行特征选择 Filter: 过滤法...
- 来源 kaggle Machine Learning Micro-Course Home Page import pandas as pd melbourne_file_path = 'melb_data.csv/melb_data.csv' melbourne_data = pd.read_csv(melbourne_file_path) print(len(... 来源 kaggle Machine Learning Micro-Course Home Page import pandas as pd melbourne_file_path = 'melb_data.csv/melb_data.csv' melbourne_data = pd.read_csv(melbourne_file_path) print(len(...
- 激活函数 PyTorch实现了常见的激活函数,其具体的接口信息可参见官方文档,这些激活函数可作为独立的layer使用。这里将介绍最常用的激活函数ReLU,其数学表达式为: R e L U ( x ) = m a x ( 0 , x ) ReLU(x)=max(0,x) R 激活函数 PyTorch实现了常见的激活函数,其具体的接口信息可参见官方文档,这些激活函数可作为独立的layer使用。这里将介绍最常用的激活函数ReLU,其数学表达式为: R e L U ( x ) = m a x ( 0 , x ) ReLU(x)=max(0,x) R
- 什么是回归分析 回归分析(regression analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因... 什么是回归分析 回归分析(regression analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因...
- 来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities 笔者,最近参加的贪心科技的机器学习训练营。。。。。。。。 学习本是一个反复的过程。 竟然要我写笔记交作业,还要写在知乎。。。。。。。。 我知乎没文章啊啊啊啊 我赶紧找下之前写的博文 从简单的一元回归分析入门机器学习 用多元线性回... 来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities 笔者,最近参加的贪心科技的机器学习训练营。。。。。。。。 学习本是一个反复的过程。 竟然要我写笔记交作业,还要写在知乎。。。。。。。。 我知乎没文章啊啊啊啊 我赶紧找下之前写的博文 从简单的一元回归分析入门机器学习 用多元线性回...
- 分类学习 输入:一组有标签的训练数据(也称观察和评估),标签表明了这些数 据(观察)的所署类别。 输出:分类模型根据这些训练数据,训练自己的模型参数,学习出一个 适合这组数据的分类器,当有新数据(非训练数据)需要进行类别判断,就 可以将这组新数据作为输入送给学好的分类器进行判断。 划分数据集 训练集(training set):顾名思义用来训练模型的已标注数据,... 分类学习 输入:一组有标签的训练数据(也称观察和评估),标签表明了这些数 据(观察)的所署类别。 输出:分类模型根据这些训练数据,训练自己的模型参数,学习出一个 适合这组数据的分类器,当有新数据(非训练数据)需要进行类别判断,就 可以将这组新数据作为输入送给学好的分类器进行判断。 划分数据集 训练集(training set):顾名思义用来训练模型的已标注数据,...
- 学习率是深度学习中的一个重要的超参,如何调整学习率是训练出好模型的关键要素之一。 关于学习率的大小 在训练过程中,一般根据训练轮数设置动态变化的学习率。 刚开始训练时:学习率以 0.01 ~ 0.001 为宜。 一定轮数过后:逐渐减缓。 接近训练结束:学习速率的衰减应该在100倍以上。 两种学习率衰减模式,一种为线性衰减,一种为指数衰减... 学习率是深度学习中的一个重要的超参,如何调整学习率是训练出好模型的关键要素之一。 关于学习率的大小 在训练过程中,一般根据训练轮数设置动态变化的学习率。 刚开始训练时:学习率以 0.01 ~ 0.001 为宜。 一定轮数过后:逐渐减缓。 接近训练结束:学习速率的衰减应该在100倍以上。 两种学习率衰减模式,一种为线性衰减,一种为指数衰减...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢
2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
“智能运维新视野”系列直播 —— 云监控技术深度实践
2025/08/29 周五 15:00-16:00
星璇 华为云监控产品经理
本期直播深度解析全栈监控技术实践,揭秘华为云、头部企业如何通过智能监控实现业务零中断,分享高可用系统背后的“鹰眼系统”。即刻预约,解锁数字化转型的运维密码!
回顾中
热门标签