- 大家都知道sklearn这玩意,听说过xlearn 吗? xLearn 是一款高性能的,易用的,并且可扩展的机器学习算法库,你可以用它来解决大规模机器学习问题,尤其是大规模稀疏数据机器学习问题。 官方文档 https://xlearn-doc-cn.readthedocs.io/en/latest/python_api/ 在近年来,大规模稀疏数据机器学习算法被广泛... 大家都知道sklearn这玩意,听说过xlearn 吗? xLearn 是一款高性能的,易用的,并且可扩展的机器学习算法库,你可以用它来解决大规模机器学习问题,尤其是大规模稀疏数据机器学习问题。 官方文档 https://xlearn-doc-cn.readthedocs.io/en/latest/python_api/ 在近年来,大规模稀疏数据机器学习算法被广泛...
- 先把来源写上 来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities 使用决策树预测糖尿病 分类任务 数据源: https://www.kaggle.com/uciml/pima-indians-diabetes-database#diabetes.csv 注意: 需要使用如下命令安装额外两... 先把来源写上 来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities 使用决策树预测糖尿病 分类任务 数据源: https://www.kaggle.com/uciml/pima-indians-diabetes-database#diabetes.csv 注意: 需要使用如下命令安装额外两...
- 谱聚类算法 该算法首先根据给定的样本数据集定义一个描述成对数据点相似度的亲合矩阵,并且计算矩阵的特征值和特征向量 , 然后选择合适 的特征向量聚类不同的数据点。谱聚类算法最初用于计算机视觉 、VLS I 设计等领域, 最近才开始用于机器学习中,并迅速成为国际上机器学习领域的研究热点。 谱聚类算法建立在图论中的谱图理论基础上,其本质是将聚类问题转化为图的最优划分问题,... 谱聚类算法 该算法首先根据给定的样本数据集定义一个描述成对数据点相似度的亲合矩阵,并且计算矩阵的特征值和特征向量 , 然后选择合适 的特征向量聚类不同的数据点。谱聚类算法最初用于计算机视觉 、VLS I 设计等领域, 最近才开始用于机器学习中,并迅速成为国际上机器学习领域的研究热点。 谱聚类算法建立在图论中的谱图理论基础上,其本质是将聚类问题转化为图的最优划分问题,...
- 使用二分类逻辑回归识别贷款违约风险 为了说明逻辑回归的应用场景,这里引入一个案例,该案例有关银行贷款违约,我们使用二分类逻辑回归来评估信用风险,如果您是银行的贷款人员,那么您希望能够识别那些指示可能违约贷款的人的特征,并使用这些特征来识别不良的贷款。 这里我们使用的数据集假设有850位以往客户的贷款信息,前700个案例是以前给予贷款的客户,这些客户的违约情况是已经知... 使用二分类逻辑回归识别贷款违约风险 为了说明逻辑回归的应用场景,这里引入一个案例,该案例有关银行贷款违约,我们使用二分类逻辑回归来评估信用风险,如果您是银行的贷款人员,那么您希望能够识别那些指示可能违约贷款的人的特征,并使用这些特征来识别不良的贷款。 这里我们使用的数据集假设有850位以往客户的贷款信息,前700个案例是以前给予贷款的客户,这些客户的违约情况是已经知...
- KFold模块 from sklearn.model_selection import KFold 为什么要使用交叉验证?交叉验证的介绍 交叉验证是在机器学习建立模型和验证模型参数时常用的办法。 交叉验证,顾名思义,就是重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。在此基础上可以得到多组不同... KFold模块 from sklearn.model_selection import KFold 为什么要使用交叉验证?交叉验证的介绍 交叉验证是在机器学习建立模型和验证模型参数时常用的办法。 交叉验证,顾名思义,就是重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。在此基础上可以得到多组不同...
- GAN 生成式对抗网络(GAN, Generative Adversarial Networks )是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中(至少)两个模块:生成模型(Generative Model)和判别模型(Discriminative Model)的互相博弈学习产生相当好的输出。原始 GAN 理论中,并不要求 G 和 ... GAN 生成式对抗网络(GAN, Generative Adversarial Networks )是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中(至少)两个模块:生成模型(Generative Model)和判别模型(Discriminative Model)的互相博弈学习产生相当好的输出。原始 GAN 理论中,并不要求 G 和 ...
- ELI5主要是用于处理文本分类的机器学习的库 MLI5是一个Python库,允许使用统一API可视化地调试各种机器学习模型。 它内置了对多个ML框架的支持,并提供了一种解释黑盒模型的方法。它有助于调试机器学习分类器并解释它们的预测。 scikit-learn。目前,ELI5允许解释scikit-learning线性分类器和回归量的权重和预测,将决策树打印为文本或... ELI5主要是用于处理文本分类的机器学习的库 MLI5是一个Python库,允许使用统一API可视化地调试各种机器学习模型。 它内置了对多个ML框架的支持,并提供了一种解释黑盒模型的方法。它有助于调试机器学习分类器并解释它们的预测。 scikit-learn。目前,ELI5允许解释scikit-learning线性分类器和回归量的权重和预测,将决策树打印为文本或...
- 在决策树中有一个很重要的概念就是深度 没错决策树很容易过拟合 从iris来看下所谓的过拟合 环境 jupyter notebook 导入包 import numpy as np import pandas as pd import matplotlib.pyplot as plt import matplotlib as mpl from sklea... 在决策树中有一个很重要的概念就是深度 没错决策树很容易过拟合 从iris来看下所谓的过拟合 环境 jupyter notebook 导入包 import numpy as np import pandas as pd import matplotlib.pyplot as plt import matplotlib as mpl from sklea...
- 先把来源写上 来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities 这次回归 之前写过关于平安股票的,竟然没想到是同一个案例 平安股票分析 说明下这个模型是没用的 import numpy as np # 数学计算 import pandas as pd # 数据处理, 读取 CSV... 先把来源写上 来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities 这次回归 之前写过关于平安股票的,竟然没想到是同一个案例 平安股票分析 说明下这个模型是没用的 import numpy as np # 数学计算 import pandas as pd # 数据处理, 读取 CSV...
- 一、首推:压缩感知“Hello World”代码初步学习 本文真的对我理解压感起到很大的帮助,特别在OMP(正交匹配追踪重构算法)算法的讲解中,尤为精彩,我从来没有见过哪个博主能如此认真的去一行一行地解释,解读代码,我对此十分感谢。 个人认为,能有超过70%注释的代码才是负责人的代码,当然也是好的代码。本文做到的不仅如此,简直优秀。为此,我一行一行的抄写了里面的代码。 精彩节... 一、首推:压缩感知“Hello World”代码初步学习 本文真的对我理解压感起到很大的帮助,特别在OMP(正交匹配追踪重构算法)算法的讲解中,尤为精彩,我从来没有见过哪个博主能如此认真的去一行一行地解释,解读代码,我对此十分感谢。 个人认为,能有超过70%注释的代码才是负责人的代码,当然也是好的代码。本文做到的不仅如此,简直优秀。为此,我一行一行的抄写了里面的代码。 精彩节...
- 先把来源写上 来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities 往期文章: K-means算法 k - means 是无监督学习的一种,主要用于分类 首先确定K值,就是类别数,我们想把数据分为几类。根据k值随机选取K个点,作为中心点,分别计算其余各个点到这K个点的距离。对于每一个非... 先把来源写上 来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities 往期文章: K-means算法 k - means 是无监督学习的一种,主要用于分类 首先确定K值,就是类别数,我们想把数据分为几类。根据k值随机选取K个点,作为中心点,分别计算其余各个点到这K个点的距离。对于每一个非...
- 朴素贝叶斯分类器的三个流程: 准备阶段: 在这个阶段我们需要确定特征属性,比如对于通过“身高”为高、“体重”为中等、“鞋码”为中等,这些特征 预测性别 问题中,对每个特征属性进行适当划分,然后由人工对一部分数据进行分类,形成训练样本。 训练阶段: 这个阶段就是生成分类器,主要工作是计算每个类别在训练样本中的出现频率及每个特征属性划分对每个类别的条件概率。输入是特... 朴素贝叶斯分类器的三个流程: 准备阶段: 在这个阶段我们需要确定特征属性,比如对于通过“身高”为高、“体重”为中等、“鞋码”为中等,这些特征 预测性别 问题中,对每个特征属性进行适当划分,然后由人工对一部分数据进行分类,形成训练样本。 训练阶段: 这个阶段就是生成分类器,主要工作是计算每个类别在训练样本中的出现频率及每个特征属性划分对每个类别的条件概率。输入是特...
- 滤波器原理:滤波器就是对特定的频率或者特定频率以外的频率进行消除的电路,被广泛用于通信系统和信号处理系统中。从功能角度,数字滤波器对输入离散信号的数字代码进行运算处理,以达到滤除频带外信号的目的。 有限冲激响应(FIR)滤波器就是一种常用的数字滤波器,采用对已输入样值的加权和来形成它的输出。其系统函数为: 其中表示延时一个时钟周期,表示延时两个周期。 传统的单速率 F... 滤波器原理:滤波器就是对特定的频率或者特定频率以外的频率进行消除的电路,被广泛用于通信系统和信号处理系统中。从功能角度,数字滤波器对输入离散信号的数字代码进行运算处理,以达到滤除频带外信号的目的。 有限冲激响应(FIR)滤波器就是一种常用的数字滤波器,采用对已输入样值的加权和来形成它的输出。其系统函数为: 其中表示延时一个时钟周期,表示延时两个周期。 传统的单速率 F...
- Adaboost算法: AdaBoost 算法 在数据挖掘中,分类算法可以说是核心算法,其与随机森林算法一样都属于 分类算法中的集成算法。 什么是集成? 集成用我们通俗的话来说就是“三个臭皮匠,顶个诸葛亮”。通过构建并结合多个机器学习器来完成学习任务,并且达到一个更好的结果。 为什么要集成? 因为臭皮匠好训练,诸葛亮却不好求。因此要打造一个诸葛亮,最好的方式就... Adaboost算法: AdaBoost 算法 在数据挖掘中,分类算法可以说是核心算法,其与随机森林算法一样都属于 分类算法中的集成算法。 什么是集成? 集成用我们通俗的话来说就是“三个臭皮匠,顶个诸葛亮”。通过构建并结合多个机器学习器来完成学习任务,并且达到一个更好的结果。 为什么要集成? 因为臭皮匠好训练,诸葛亮却不好求。因此要打造一个诸葛亮,最好的方式就...
- 回归:预测燃油效率 在一个回归问题中,我们的目标是预测一个连续值的输出,比如价格或概率。这与一个分类问题形成对比,我们的目标是从一系列类中选择一个类(例如,一张图片包含一个苹果或一个橘子,识别图片中的水果)。 本笔记本使用经典的[auto-mpg](https://archive.ics.uci.edu/ml/datasets/auto+mpg)数据集,建立了预... 回归:预测燃油效率 在一个回归问题中,我们的目标是预测一个连续值的输出,比如价格或概率。这与一个分类问题形成对比,我们的目标是从一系列类中选择一个类(例如,一张图片包含一个苹果或一个橘子,识别图片中的水果)。 本笔记本使用经典的[auto-mpg](https://archive.ics.uci.edu/ml/datasets/auto+mpg)数据集,建立了预...
上滑加载中
推荐直播
-
码道新技能,AI 新生产力——从自动视频生成到开源项目解析2026/04/08 周三 19:00-21:00
童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人
本次华为云码道 Skill 实战活动,聚焦两大 AI 开发场景:通过实战教学,带你打造 AI 编程自动生成视频 Skill,并实现对 GitHub 热门开源项目的智能知识抽取,手把手掌握 Skill 开发全流程,用 AI 提升研发效率与内容生产力。
回顾中 -
华为云码道:零代码股票智能决策平台全功能实战2026/04/18 周六 10:00-12:00
秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家
利用Tushare接口获取实时行情数据,采用Transformer算法进行时序预测与涨跌分析,并集成DeepSeek API提供智能解读。同时,项目深度结合华为云CodeArts(码道)的代码智能体能力,实现代码一键推送至云端代码仓库,建立起高效、可协作的团队开发新范式。开发者可快速上手,从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中 -
华为云码道全新升级,多会话并行与多智能体协作2026/05/08 周五 19:00-21:00
王一男-华为云码道产品专家;张嘉冉-华为云码道工程师;胡琦-华为云HCDE;程诗杰-华为云HCDG
华为云码道4月份版本全新升级,此次直播深度解读4月份产品特性,通过“特性解读+实操演示+实战案例+设计创新”的组合,全方位展现码道在多会话并行与多智能体协作方面的能力,赋能开发者提升效率
正在直播
热门标签