数据挖掘_标签_开发者_华为云

博客(1.5k)
视频(0)
论坛(0)
云声(0)
代码示例(0)

白话Elasticsearch50-深入聚合数据分析之doc values机制
文章目录概述官网doc value原理（1）index-time生成（2）核心原理与倒排索引类似（3）性能问题：给jvm更少内存，64g服务器，给jvm最多16g column压缩（1）所有...

小工匠
发表于2021-09-10 22:39:26
3103 0 0

3.1k 0 0

文章目录概述官网doc value原理（1）index-time生成（2）核心原理与倒排索引类似（3）性能问题：给jvm更少内存，64g服务器，给jvm最多16g column压缩（1）所有...
Elasticsearch 数据挖掘
数据分析——常见数据指标汇总
数据分析——常见数据指标汇总数据分类用户数据指标行为数据指标产品数据指标推广付费指标数据分类用户数据：反映用户的基本信息等。行为数据：做过什么，如页面停留时间，购买等。...

Python新视野
发表于2021-09-09 23:11:26
4580 0 0

4.5k 0 0

数据分析——常见数据指标汇总数据分类用户数据指标行为数据指标产品数据指标推广付费指标数据分类用户数据：反映用户的基本信息等。行为数据：做过什么，如页面停留时间，购买等。...
数据挖掘
Python数据分析与展示：matplotlib绘图简单示例-7
图形的适用场景关注分类变量各分类的比例，用饼图关注变量的频率分布，用直方图关注变量的变化趋势，用折线图关注两个变量的相关，用散点图展示一个变量的集中趋势和离散趋势，用箱图 123456789 导入库 # -*- coding: utf-8 -*- # @File : pylot_demo.py # @Date : 2018-05-14 imp...

彭世瑜
发表于2021-08-14 01:42:54
2957 0 0

2.9k 0 0

图形的适用场景关注分类变量各分类的比例，用饼图关注变量的频率分布，用直方图关注变量的变化趋势，用折线图关注两个变量的相关，用散点图展示一个变量的集中趋势和离散趋势，用箱图 123456789 导入库 # -*- coding: utf-8 -*- # @File : pylot_demo.py # @Date : 2018-05-14 imp...
Python 数据挖掘
Python数据分析与展示：pandas库的数据排序-12
基本统计（含排序）分布/累计统计数据特征相关性、周期性等数据挖掘（形成知识）一组数据表达一个或多个含义摘要 - 数据形成有损特征的过程 pandas库的数据排序 .sort_index()方法在指定轴上根据索引进行排序，默认升序 .sort_index(axis=0, ascending=True) .sort_values()方法在指定轴上根据...

彭世瑜
发表于2021-08-14 01:18:15
3054 0 0

3.0k 0 0

基本统计（含排序）分布/累计统计数据特征相关性、周期性等数据挖掘（形成知识）一组数据表达一个或多个含义摘要 - 数据形成有损特征的过程 pandas库的数据排序 .sort_index()方法在指定轴上根据索引进行排序，默认升序 .sort_index(axis=0, ascending=True) .sort_values()方法在指定轴上根据...
Python 数据挖掘
Python数据分析与展示：pandas库统计分析函数-13
基本的统计分析函数适用于Series和DataFrame类型方法说明.sum()计算数据的总和，按0轴计算，下同.count()非NaN值的数量.mean() .median()计算数据的算术平均值、算术中位数.var() .std()计算数据的方差、标准差.min().max()计算数据的最小值、最大值.describe()针对0轴（各列）的统计汇总适用于...

彭世瑜
发表于2021-08-14 00:18:17
4169 0 0

4.1k 0 0

基本的统计分析函数适用于Series和DataFrame类型方法说明.sum()计算数据的总和，按0轴计算，下同.count()非NaN值的数量.mean() .median()计算数据的算术平均值、算术中位数.var() .std()计算数据的方差、标准差.min().max()计算数据的最小值、最大值.describe()针对0轴（各列）的统计汇总适用于...
Python 应用与数据集成平台 ROMA Connect 数据挖掘
Python数据分析与展示：Series类型简单操作-8
Pandas是Python第三方库，提供高性能易用数据类型和分析工具官网文档：http://pandas.pydata.org/pandas-docs/stable/10min.html 引入： import pandas as pd 1 Pandas基于NumPy实现，常与NumPy和Matplotlib一同使用两个数据类型：Series, DataFr...

彭世瑜
发表于2021-08-13 23:49:34
2980 0 0

2.9k 0 0

Pandas是Python第三方库，提供高性能易用数据类型和分析工具官网文档：http://pandas.pydata.org/pandas-docs/stable/10min.html 引入： import pandas as pd 1 Pandas基于NumPy实现，常与NumPy和Matplotlib一同使用两个数据类型：Series, DataFr...
Python 数据挖掘
Python数据分析与展示：pandas算术和比较运算-11
算术运算法则算术运算根据行列索引，补齐后运算，运算默认产生浮点数补齐时缺项填充NaN(空值) 二维和一维、一维和零维间为广播运算采用+ ‐* /符号进行的二元运算产生新的对象方法形式的运算方法说明.add(d, **argws)类型间加法运算，可选参数.sub(d, **argws)类型间减法运算，可选参数.mul(d, **argws)类型间...

彭世瑜
发表于2021-08-13 23:47:30
2959 0 0

2.9k 0 0

算术运算法则算术运算根据行列索引，补齐后运算，运算默认产生浮点数补齐时缺项填充NaN(空值) 二维和一维、一维和零维间为广播运算采用+ ‐* /符号进行的二元运算产生新的对象方法形式的运算方法说明.add(d, **argws)类型间加法运算，可选参数.sub(d, **argws)类型间减法运算，可选参数.mul(d, **argws)类型间...
Python 数据挖掘
Python数据分析与展示：科学计算基础库numpy-1
numpy 科学计算基础库官方文档：https://docs.scipy.org/doc/numpy/user/quickstart.html 列表和数组区别列表：数据类型可以不同数组：数据类型相同 12 N维数组对象 ndarray dimension 维度：一组数据的组织形式轴axis 数据维度秩rank 轴的数量 ndarray数组一般要求所...

彭世瑜
发表于2021-08-13 23:44:25
3601 0 0

3.6k 0 0

numpy 科学计算基础库官方文档：https://docs.scipy.org/doc/numpy/user/quickstart.html 列表和数组区别列表：数据类型可以不同数组：数据类型相同 12 N维数组对象 ndarray dimension 维度：一组数据的组织形式轴axis 数据维度秩rank 轴的数量 ndarray数组一般要求所...
Numpy Python 数据挖掘数据结构
Python数据分析与展示：DataFrame类型索引操作-10
DataFrame对象操作重新索引 .reindex()能够改变或重排Series和DataFrame索引 .reindex(index=None, columns=None,…)的参数参数说明index, columns新的行列自定义索引fill_value重新索引中，用于填充缺失位置的值method填充方法, ffill当前值向前填充，bfill向后填充...

彭世瑜
发表于2021-08-13 23:40:44
2939 0 0

2.9k 0 0

DataFrame对象操作重新索引 .reindex()能够改变或重排Series和DataFrame索引 .reindex(index=None, columns=None,…)的参数参数说明index, columns新的行列自定义索引fill_value重新索引中，用于填充缺失位置的值method填充方法, ffill当前值向前填充，bfill向后填充...
Python 数据挖掘
Python数据科学：Numpy库基础
argsort函数返回的是数组值的索引值 import numpy as np x = np.array([3, 1, 4, 2, 5]) # 从小到大 np.argsort(x) Out[4]: array([1, 3, 0, 2, 4]) # 从大到小 np.argsort(-x) Out[5]: array([4, 2, 0, 3, 1])123456...

彭世瑜
发表于2021-08-13 23:20:18
3472 0 0

3.4k 0 0

argsort函数返回的是数组值的索引值 import numpy as np x = np.array([3, 1, 4, 2, 5]) # 从小到大 np.argsort(x) Out[4]: array([1, 3, 0, 2, 4]) # 从大到小 np.argsort(-x) Out[5]: array([4, 2, 0, 3, 1])123456...
Numpy Python 数据挖掘
Python数据分析与展示：DataFrame类型简单操作-9
DataFrame类型 DataFrame类型由共用相同索引的一组列组成 DataFrame是一个表格型的数据类型，每列值类型可以不同 DataFrame既有行索引、也有列索引 index axis=0 axis=1 column DataFrame常用于表达二维数据，但可以表达多维数据 DataFrame类型可以由如下类型创建：二维ndarray对象...

彭世瑜
发表于2021-08-13 23:17:59
3243 0 0

3.2k 0 0

DataFrame类型 DataFrame类型由共用相同索引的一组列组成 DataFrame是一个表格型的数据类型，每列值类型可以不同 DataFrame既有行索引、也有列索引 index axis=0 axis=1 column DataFrame常用于表达二维数据，但可以表达多维数据 DataFrame类型可以由如下类型创建：二维ndarray对象...
Python 数据挖掘
Python数据分析与展示：numpy.random随机函数-3
numpy.random随机函数 rand(d0, d1,...dn) 随机数组, 浮点数，[0, 1)均匀分布 randn(d0, d1,...dn) 随机数组，正态分布 randint(low, high, shape) 指定随机范围 seed(s) 随机种子 shuffle(a) 随机排列第一轴，改变数组a permutation(a) 根据第一轴返回乱序数组...

彭世瑜
发表于2021-08-13 23:05:48
3560 0 0

3.5k 0 0

numpy.random随机函数 rand(d0, d1,...dn) 随机数组, 浮点数，[0, 1)均匀分布 randn(d0, d1,...dn) 随机数组，正态分布 randint(low, high, shape) 指定随机范围 seed(s) 随机种子 shuffle(a) 随机排列第一轴，改变数组a permutation(a) 根据第一轴返回乱序数组...
Numpy Python 数据挖掘
Python数据科学：Pandas Cheat Sheet
Key and Imports In this cheat sheet, we use the following shorthand: df | Any pandas DataFrame object s | Any pandas Series object You’ll also need to perform the following imports t...

彭世瑜
发表于2021-08-13 23:05:18
2936 0 0

2.9k 0 0

Key and Imports In this cheat sheet, we use the following shorthand: df | Any pandas DataFrame object s | Any pandas Series object You’ll also need to perform the following imports t...
Python 数据挖掘
Python数据科学：NumPy Cheat Sheet
Key and Imports In this cheat sheet, we use the following shorthand: arr | A NumPy Array object You’ll also need to import numpy to get started: import numpy as np Importing/exporti...

彭世瑜
发表于2021-08-13 22:55:52
3762 0 0

3.7k 0 0

Key and Imports In this cheat sheet, we use the following shorthand: arr | A NumPy Array object You’ll also need to import numpy to get started: import numpy as np Importing/exporti...
Numpy Python 数据挖掘
时序数据分析——异常检测
时序数据的异常点是指序列中存在模式不一致的点（如时序数据超出正常范围的上/下界，突然的上升或下降，趋势改变）。时序数据的异常检测旨在快速准确的找到这些异常点。代码块导入在NAIE训练平台的JupyterLab界面操作，不需要手动添加这一部分，因为在新创建的特征工程下已经包含了导入代码。import os os.chdir("/home/ma-user/work/test_ano...

就挺突然
发表于2021-07-29 22:03:11
11227 0 0

11.2k 0 0

时序数据的异常点是指序列中存在模式不一致的点（如时序数据超出正常范围的上/下界，突然的上升或下降，趋势改变）。时序数据的异常检测旨在快速准确的找到这些异常点。代码块导入在NAIE训练平台的JupyterLab界面操作，不需要手动添加这一部分，因为在新创建的特征工程下已经包含了导入代码。import os os.chdir("/home/ma-user/work/test_ano...
数据挖掘

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript