- 谱聚类算法 该算法首先根据给定的样本数据集定义一个描述成对数据点相似度的亲合矩阵,并且计算矩阵的特征值和特征向量 , 然后选择合适 的特征向量聚类不同的数据点。谱聚类算法最初用于计算机视觉 、VLS I 设计等领域, 最近才开始用于机器学习中,并迅速成为国际上机器学习领域的研究热点。 谱聚类算法建立在图论中的谱图理论基础上,其本质是将聚类问题转化为图的最优划分问题,... 谱聚类算法 该算法首先根据给定的样本数据集定义一个描述成对数据点相似度的亲合矩阵,并且计算矩阵的特征值和特征向量 , 然后选择合适 的特征向量聚类不同的数据点。谱聚类算法最初用于计算机视觉 、VLS I 设计等领域, 最近才开始用于机器学习中,并迅速成为国际上机器学习领域的研究热点。 谱聚类算法建立在图论中的谱图理论基础上,其本质是将聚类问题转化为图的最优划分问题,...
- 使用二分类逻辑回归识别贷款违约风险 为了说明逻辑回归的应用场景,这里引入一个案例,该案例有关银行贷款违约,我们使用二分类逻辑回归来评估信用风险,如果您是银行的贷款人员,那么您希望能够识别那些指示可能违约贷款的人的特征,并使用这些特征来识别不良的贷款。 这里我们使用的数据集假设有850位以往客户的贷款信息,前700个案例是以前给予贷款的客户,这些客户的违约情况是已经知... 使用二分类逻辑回归识别贷款违约风险 为了说明逻辑回归的应用场景,这里引入一个案例,该案例有关银行贷款违约,我们使用二分类逻辑回归来评估信用风险,如果您是银行的贷款人员,那么您希望能够识别那些指示可能违约贷款的人的特征,并使用这些特征来识别不良的贷款。 这里我们使用的数据集假设有850位以往客户的贷款信息,前700个案例是以前给予贷款的客户,这些客户的违约情况是已经知...
- KFold模块 from sklearn.model_selection import KFold 为什么要使用交叉验证?交叉验证的介绍 交叉验证是在机器学习建立模型和验证模型参数时常用的办法。 交叉验证,顾名思义,就是重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。在此基础上可以得到多组不同... KFold模块 from sklearn.model_selection import KFold 为什么要使用交叉验证?交叉验证的介绍 交叉验证是在机器学习建立模型和验证模型参数时常用的办法。 交叉验证,顾名思义,就是重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。在此基础上可以得到多组不同...
- GAN 生成式对抗网络(GAN, Generative Adversarial Networks )是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中(至少)两个模块:生成模型(Generative Model)和判别模型(Discriminative Model)的互相博弈学习产生相当好的输出。原始 GAN 理论中,并不要求 G 和 ... GAN 生成式对抗网络(GAN, Generative Adversarial Networks )是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中(至少)两个模块:生成模型(Generative Model)和判别模型(Discriminative Model)的互相博弈学习产生相当好的输出。原始 GAN 理论中,并不要求 G 和 ...
- ELI5主要是用于处理文本分类的机器学习的库 MLI5是一个Python库,允许使用统一API可视化地调试各种机器学习模型。 它内置了对多个ML框架的支持,并提供了一种解释黑盒模型的方法。它有助于调试机器学习分类器并解释它们的预测。 scikit-learn。目前,ELI5允许解释scikit-learning线性分类器和回归量的权重和预测,将决策树打印为文本或... ELI5主要是用于处理文本分类的机器学习的库 MLI5是一个Python库,允许使用统一API可视化地调试各种机器学习模型。 它内置了对多个ML框架的支持,并提供了一种解释黑盒模型的方法。它有助于调试机器学习分类器并解释它们的预测。 scikit-learn。目前,ELI5允许解释scikit-learning线性分类器和回归量的权重和预测,将决策树打印为文本或...
- 在决策树中有一个很重要的概念就是深度 没错决策树很容易过拟合 从iris来看下所谓的过拟合 环境 jupyter notebook 导入包 import numpy as np import pandas as pd import matplotlib.pyplot as plt import matplotlib as mpl from sklea... 在决策树中有一个很重要的概念就是深度 没错决策树很容易过拟合 从iris来看下所谓的过拟合 环境 jupyter notebook 导入包 import numpy as np import pandas as pd import matplotlib.pyplot as plt import matplotlib as mpl from sklea...
- 先把来源写上 来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities 这次回归 之前写过关于平安股票的,竟然没想到是同一个案例 平安股票分析 说明下这个模型是没用的 import numpy as np # 数学计算 import pandas as pd # 数据处理, 读取 CSV... 先把来源写上 来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities 这次回归 之前写过关于平安股票的,竟然没想到是同一个案例 平安股票分析 说明下这个模型是没用的 import numpy as np # 数学计算 import pandas as pd # 数据处理, 读取 CSV...
- 一、首推:压缩感知“Hello World”代码初步学习 本文真的对我理解压感起到很大的帮助,特别在OMP(正交匹配追踪重构算法)算法的讲解中,尤为精彩,我从来没有见过哪个博主能如此认真的去一行一行地解释,解读代码,我对此十分感谢。 个人认为,能有超过70%注释的代码才是负责人的代码,当然也是好的代码。本文做到的不仅如此,简直优秀。为此,我一行一行的抄写了里面的代码。 精彩节... 一、首推:压缩感知“Hello World”代码初步学习 本文真的对我理解压感起到很大的帮助,特别在OMP(正交匹配追踪重构算法)算法的讲解中,尤为精彩,我从来没有见过哪个博主能如此认真的去一行一行地解释,解读代码,我对此十分感谢。 个人认为,能有超过70%注释的代码才是负责人的代码,当然也是好的代码。本文做到的不仅如此,简直优秀。为此,我一行一行的抄写了里面的代码。 精彩节...
- 先把来源写上 来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities 往期文章: K-means算法 k - means 是无监督学习的一种,主要用于分类 首先确定K值,就是类别数,我们想把数据分为几类。根据k值随机选取K个点,作为中心点,分别计算其余各个点到这K个点的距离。对于每一个非... 先把来源写上 来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities 往期文章: K-means算法 k - means 是无监督学习的一种,主要用于分类 首先确定K值,就是类别数,我们想把数据分为几类。根据k值随机选取K个点,作为中心点,分别计算其余各个点到这K个点的距离。对于每一个非...
- 朴素贝叶斯分类器的三个流程: 准备阶段: 在这个阶段我们需要确定特征属性,比如对于通过“身高”为高、“体重”为中等、“鞋码”为中等,这些特征 预测性别 问题中,对每个特征属性进行适当划分,然后由人工对一部分数据进行分类,形成训练样本。 训练阶段: 这个阶段就是生成分类器,主要工作是计算每个类别在训练样本中的出现频率及每个特征属性划分对每个类别的条件概率。输入是特... 朴素贝叶斯分类器的三个流程: 准备阶段: 在这个阶段我们需要确定特征属性,比如对于通过“身高”为高、“体重”为中等、“鞋码”为中等,这些特征 预测性别 问题中,对每个特征属性进行适当划分,然后由人工对一部分数据进行分类,形成训练样本。 训练阶段: 这个阶段就是生成分类器,主要工作是计算每个类别在训练样本中的出现频率及每个特征属性划分对每个类别的条件概率。输入是特...
- 滤波器原理:滤波器就是对特定的频率或者特定频率以外的频率进行消除的电路,被广泛用于通信系统和信号处理系统中。从功能角度,数字滤波器对输入离散信号的数字代码进行运算处理,以达到滤除频带外信号的目的。 有限冲激响应(FIR)滤波器就是一种常用的数字滤波器,采用对已输入样值的加权和来形成它的输出。其系统函数为: 其中表示延时一个时钟周期,表示延时两个周期。 传统的单速率 F... 滤波器原理:滤波器就是对特定的频率或者特定频率以外的频率进行消除的电路,被广泛用于通信系统和信号处理系统中。从功能角度,数字滤波器对输入离散信号的数字代码进行运算处理,以达到滤除频带外信号的目的。 有限冲激响应(FIR)滤波器就是一种常用的数字滤波器,采用对已输入样值的加权和来形成它的输出。其系统函数为: 其中表示延时一个时钟周期,表示延时两个周期。 传统的单速率 F...
- Adaboost算法: AdaBoost 算法 在数据挖掘中,分类算法可以说是核心算法,其与随机森林算法一样都属于 分类算法中的集成算法。 什么是集成? 集成用我们通俗的话来说就是“三个臭皮匠,顶个诸葛亮”。通过构建并结合多个机器学习器来完成学习任务,并且达到一个更好的结果。 为什么要集成? 因为臭皮匠好训练,诸葛亮却不好求。因此要打造一个诸葛亮,最好的方式就... Adaboost算法: AdaBoost 算法 在数据挖掘中,分类算法可以说是核心算法,其与随机森林算法一样都属于 分类算法中的集成算法。 什么是集成? 集成用我们通俗的话来说就是“三个臭皮匠,顶个诸葛亮”。通过构建并结合多个机器学习器来完成学习任务,并且达到一个更好的结果。 为什么要集成? 因为臭皮匠好训练,诸葛亮却不好求。因此要打造一个诸葛亮,最好的方式就...
- 回归:预测燃油效率 在一个回归问题中,我们的目标是预测一个连续值的输出,比如价格或概率。这与一个分类问题形成对比,我们的目标是从一系列类中选择一个类(例如,一张图片包含一个苹果或一个橘子,识别图片中的水果)。 本笔记本使用经典的[auto-mpg](https://archive.ics.uci.edu/ml/datasets/auto+mpg)数据集,建立了预... 回归:预测燃油效率 在一个回归问题中,我们的目标是预测一个连续值的输出,比如价格或概率。这与一个分类问题形成对比,我们的目标是从一系列类中选择一个类(例如,一张图片包含一个苹果或一个橘子,识别图片中的水果)。 本笔记本使用经典的[auto-mpg](https://archive.ics.uci.edu/ml/datasets/auto+mpg)数据集,建立了预...
- 上篇讲了概念的东西 实战使用 泰坦尼克数据集,之前对它进行数据预处理 可以阅读上几篇 import pandas as pd import keras import numpy as np data = pd.read_csv('./dataset/tt/train.csv') y = data.Survived x = data[['Pclass', 'Sex... 上篇讲了概念的东西 实战使用 泰坦尼克数据集,之前对它进行数据预处理 可以阅读上几篇 import pandas as pd import keras import numpy as np data = pd.read_csv('./dataset/tt/train.csv') y = data.Survived x = data[['Pclass', 'Sex...
- 以前的老文,回顾回顾 在机器学习中,随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele Cutler发展出推论出随机森林的算法。许多估计量中的多数票最终可能比进行投票的任何单个估计量都要好! 学习算法 用N来表示训练用例(样本)的个数,M表示特征数目。 输入特征... 以前的老文,回顾回顾 在机器学习中,随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele Cutler发展出推论出随机森林的算法。许多估计量中的多数票最终可能比进行投票的任何单个估计量都要好! 学习算法 用N来表示训练用例(样本)的个数,M表示特征数目。 输入特征...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢
2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
“智能运维新视野”系列直播 —— 云监控技术深度实践
2025/08/29 周五 15:00-16:00
星璇 华为云监控产品经理
本期直播深度解析全栈监控技术实践,揭秘华为云、头部企业如何通过智能监控实现业务零中断,分享高可用系统背后的“鹰眼系统”。即刻预约,解锁数字化转型的运维密码!
回顾中
热门标签