- python-pandas之DataFrame数据分析(五) '''DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。• DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引) 可以输入给DataFrame构造器的数据... python-pandas之DataFrame数据分析(五) '''DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。• DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引) 可以输入给DataFrame构造器的数据...
- groupby扩展操作 In [3]: ... groupby扩展操作 In [3]: ...
- 分类算法有很多,贝叶斯、决策树、支持向量积、KNN等,神经网络也可以用于分类。这篇文章主要介绍一下KNN分类算法。 1、介绍 KNN是k nearest neighbor 的简称,即K最邻近,就是找K个最近的实例投票决定新实例的类标。KNN是一种基于实例的学习算法,它不同于贝叶斯、决策树等算法,KNN不需要训练,当有新的实例... 分类算法有很多,贝叶斯、决策树、支持向量积、KNN等,神经网络也可以用于分类。这篇文章主要介绍一下KNN分类算法。 1、介绍 KNN是k nearest neighbor 的简称,即K最邻近,就是找K个最近的实例投票决定新实例的类标。KNN是一种基于实例的学习算法,它不同于贝叶斯、决策树等算法,KNN不需要训练,当有新的实例...
- 赛题详情 在出行问题上,中国市场人数多、人口密度大,总体的出行频率远高于其他国家,这种情况在大城市尤为明显。然而,截至目前中国拥有汽车的人口只有不到10%,这意味着在中国人们的出行更加依赖于出租车、公共交通等市场提供的服务。另一方面,滴滴出行占领了国内绝大部分的网络呼叫出行市场,面对着巨大的数据量以及与日俱增的数据处理需求。截... 赛题详情 在出行问题上,中国市场人数多、人口密度大,总体的出行频率远高于其他国家,这种情况在大城市尤为明显。然而,截至目前中国拥有汽车的人口只有不到10%,这意味着在中国人们的出行更加依赖于出租车、公共交通等市场提供的服务。另一方面,滴滴出行占领了国内绝大部分的网络呼叫出行市场,面对着巨大的数据量以及与日俱增的数据处理需求。截...
- 上一篇介绍了关联规则挖掘的一些基本概念和经典的Apriori算法,Aprori算法利用频繁集的两个特性,过滤了很多无关的集合,效率提高不少,但是我们发现Apriori算法是一个候选消除算法,每一次消除都需要扫描一次所有数据记录,造成整个算法在面临大数据集时显得无能为力。今天我们介绍一个新的算法挖掘频繁项集,效率比Aprori算法高很多... 上一篇介绍了关联规则挖掘的一些基本概念和经典的Apriori算法,Aprori算法利用频繁集的两个特性,过滤了很多无关的集合,效率提高不少,但是我们发现Apriori算法是一个候选消除算法,每一次消除都需要扫描一次所有数据记录,造成整个算法在面临大数据集时显得无能为力。今天我们介绍一个新的算法挖掘频繁项集,效率比Aprori算法高很多...
- 3-Groupby分组统计 In [2]: ... 3-Groupby分组统计 In [2]: ...
- 上一篇介绍了用开源数据挖掘软件weka做关联规则挖掘,weka方便实用,但不能处理大数据集,因为内存放不下,给它再多的时间也是无用,因此需要进行分布式计算,mahout是一个基于hadoop的分布式数据挖掘开源项目(mahout本来是指一个骑在大象上的人)。掌握了关联规则的基本算法和使用,加上分布式关联规则挖掘后,就可以处理基本的关联... 上一篇介绍了用开源数据挖掘软件weka做关联规则挖掘,weka方便实用,但不能处理大数据集,因为内存放不下,给它再多的时间也是无用,因此需要进行分布式计算,mahout是一个基于hadoop的分布式数据挖掘开源项目(mahout本来是指一个骑在大象上的人)。掌握了关联规则的基本算法和使用,加上分布式关联规则挖掘后,就可以处理基本的关联...
- 聚类分析 什么是聚类分析? 聚类 (Clustering) 就是将数据对象分组成为多个类或者簇 (Cluster),它的目标是:在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。所以,在很多应用中,一个簇中的数据对象可以被作为一个整体来对待,从而减少计算量或者提高计算质量。 其实聚类是一个人们日常生活的常见行为... 聚类分析 什么是聚类分析? 聚类 (Clustering) 就是将数据对象分组成为多个类或者簇 (Cluster),它的目标是:在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。所以,在很多应用中,一个簇中的数据对象可以被作为一个整体来对待,从而减少计算量或者提高计算质量。 其实聚类是一个人们日常生活的常见行为...
- Pandas数据分析 import pandas as pd df = pd.read_csv('C:/JupyterWork/data/titanic.csv') dfPassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked0 1 ... Pandas数据分析 import pandas as pd df = pd.read_csv('C:/JupyterWork/data/titanic.csv') dfPassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked0 1 ...
- 第三章 numpy的常用函数 1.savetxt 2.loadtxt (converters): datetime.datetime.strptime [p46] 3.average 4.mean 5.max 6.min 7.ptp 8.median 9.msort/sort 10.var 11.diff 12.std 13.wh... 第三章 numpy的常用函数 1.savetxt 2.loadtxt (converters): datetime.datetime.strptime [p46] 3.average 4.mean 5.max 6.min 7.ptp 8.median 9.msort/sort 10.var 11.diff 12.std 13.wh...
- 创建DataFrame格式数据,指定他的行索引名称和列索引名称 In [3]: ... 创建DataFrame格式数据,指定他的行索引名称和列索引名称 In [3]: ...
- 不同的产品要给不同的人员使用,一份完整的用户画像不仅包含整整个用户的信息,也包含用户的媒体属相和用户的标签化语义。今天AAA教育小编就来带大家看看,产品经理应该如何获得用户画像。其实,「用户画像」这个词,其实在国内的互联网大概率是错用的。这里有两个英文词,第一个叫「PERSONA」,这是Allen Cooper提出来的一种通过调研和问卷... 不同的产品要给不同的人员使用,一份完整的用户画像不仅包含整整个用户的信息,也包含用户的媒体属相和用户的标签化语义。今天AAA教育小编就来带大家看看,产品经理应该如何获得用户画像。其实,「用户画像」这个词,其实在国内的互联网大概率是错用的。这里有两个英文词,第一个叫「PERSONA」,这是Allen Cooper提出来的一种通过调研和问卷...
- 从这篇开始,我将介绍分类问题,主要介绍决策树算法、朴素贝叶斯、支持向量机、BP神经网络、懒惰学习算法、随机森林与自适应增强算法、分类模型选择和结果评价。总共7篇,欢迎关注和交流。 这篇先介绍分类问题的一些基本知识,然后主要讲述决策树算法的原理、实现,最后利用决策树算法做一个泰坦尼克号船员生存预测应用。 ... 从这篇开始,我将介绍分类问题,主要介绍决策树算法、朴素贝叶斯、支持向量机、BP神经网络、懒惰学习算法、随机森林与自适应增强算法、分类模型选择和结果评价。总共7篇,欢迎关注和交流。 这篇先介绍分类问题的一些基本知识,然后主要讲述决策树算法的原理、实现,最后利用决策树算法做一个泰坦尼克号船员生存预测应用。 ...
- python-pandas之Index数据分析(六) 索引对象 '''数据结构 索引对象• pandas的索引对象负责管理轴标签和其他元数据(比如轴名称等)。构建Series或DataFrame时,所用到的任何数组或其他序列的标签都会被转换成一个Index。• Index对象是不可修改的(immutable),因此用户不能对其进行修... python-pandas之Index数据分析(六) 索引对象 '''数据结构 索引对象• pandas的索引对象负责管理轴标签和其他元数据(比如轴名称等)。构建Series或DataFrame时,所用到的任何数组或其他序列的标签都会被转换成一个Index。• Index对象是不可修改的(immutable),因此用户不能对其进行修...
- python-Numpy数据分析-数组的保存与读取(三) 1. 数组以二进制格式保存 np.save和np.load是读写磁盘数组数据的两个主要函数。默认情况下,数组以未压缩的原始二进制格式保存在扩展名为npy的文件中,以数组a为例 np.save("filename.npy",a)b = np.load("fil... python-Numpy数据分析-数组的保存与读取(三) 1. 数组以二进制格式保存 np.save和np.load是读写磁盘数组数据的两个主要函数。默认情况下,数组以未压缩的原始二进制格式保存在扩展名为npy的文件中,以数组a为例 np.save("filename.npy",a)b = np.load("fil...
上滑加载中
推荐直播
-
香橙派AIpro的远程推理框架与实验案例
2025/07/04 周五 19:00-20:00
郝家胜 -华为开发者布道师-高校教师
AiR推理框架创新采用将模型推理与模型应用相分离的机制,把香橙派封装为AI推理黑盒服务,构建了分布式远程推理框架,并提供多种输入模态、多种输出方式以及多线程支持的高度复用框架,解决了开发板环境配置复杂上手困难、缺乏可视化体验和资源稀缺课程受限等痛点问题,真正做到开箱即用,并支持多种笔记本电脑环境、多种不同编程语言,10行代码即可体验图像分割迁移案例。
回顾中 -
鸿蒙端云一体化应用开发
2025/07/10 周四 19:00-20:00
倪红军 华为开发者布道师-高校教师
基于鸿蒙平台终端设备的应用场景越来越多、使用范围越来越广。本课程以云数据库服务为例,介绍云侧项目应用的创建、新建对象类型、新增存储区及向对象类型中添加数据对象的方法,端侧(HarmonyOS平台)一体化工程项目的创建、云数据资源的关联方法及对云侧数据的增删改查等操作方法,为开发端云一体化应用打下坚实基础。
即将直播
热门标签