- 文章目录 概述官网doc value原理(1)index-time生成(2)核心原理与倒排索引类似(3)性能问题:给jvm更少内存,64g服务器,给jvm最多16g column压缩(1)所有... 文章目录 概述官网doc value原理(1)index-time生成(2)核心原理与倒排索引类似(3)性能问题:给jvm更少内存,64g服务器,给jvm最多16g column压缩(1)所有...
- 数据分析——常见数据指标汇总 数据分类用户数据指标行为数据指标产品数据指标推广付费指标 数据分类 用户数据:反映用户的基本信息等。 行为数据:做过什么,如页面停留时间,购买等。... 数据分析——常见数据指标汇总 数据分类用户数据指标行为数据指标产品数据指标推广付费指标 数据分类 用户数据:反映用户的基本信息等。 行为数据:做过什么,如页面停留时间,购买等。...
- 图形的适用场景 关注分类变量各分类的比例,用饼图 关注变量的频率分布,用直方图 关注变量的变化趋势,用折线图 关注两个变量的相关,用散点图 展示一个变量的集中趋势和离散趋势,用箱图 123456789 导入库 # -*- coding: utf-8 -*- # @File : pylot_demo.py # @Date : 2018-05-14 imp... 图形的适用场景 关注分类变量各分类的比例,用饼图 关注变量的频率分布,用直方图 关注变量的变化趋势,用折线图 关注两个变量的相关,用散点图 展示一个变量的集中趋势和离散趋势,用箱图 123456789 导入库 # -*- coding: utf-8 -*- # @File : pylot_demo.py # @Date : 2018-05-14 imp...
- 基本统计(含排序) 分布/累计统计 数据特征 相关性、周期性等 数据挖掘(形成知识) 一组数据表达一个或多个含义 摘要 - 数据形成有损特征的过程 pandas库的数据排序 .sort_index()方法在指定轴上根据索引进行排序,默认升序 .sort_index(axis=0, ascending=True) .sort_values()方法在指定轴上根据... 基本统计(含排序) 分布/累计统计 数据特征 相关性、周期性等 数据挖掘(形成知识) 一组数据表达一个或多个含义 摘要 - 数据形成有损特征的过程 pandas库的数据排序 .sort_index()方法在指定轴上根据索引进行排序,默认升序 .sort_index(axis=0, ascending=True) .sort_values()方法在指定轴上根据...
- 基本的统计分析函数 适用于Series和DataFrame类型 方法说明.sum()计算数据的总和,按0轴计算,下同.count()非NaN值的数量.mean() .median()计算数据的算术平均值、算术中位数.var() .std()计算数据的方差、标准差.min().max()计算数据的最小值、最大值.describe()针对0轴(各列)的统计汇总 适用于... 基本的统计分析函数 适用于Series和DataFrame类型 方法说明.sum()计算数据的总和,按0轴计算,下同.count()非NaN值的数量.mean() .median()计算数据的算术平均值、算术中位数.var() .std()计算数据的方差、标准差.min().max()计算数据的最小值、最大值.describe()针对0轴(各列)的统计汇总 适用于...
- Pandas是Python第三方库,提供高性能易用数据类型和分析工具 官网文档:http://pandas.pydata.org/pandas-docs/stable/10min.html 引入: import pandas as pd 1 Pandas基于NumPy实现,常与NumPy和Matplotlib一同使用 两个数据类型:Series, DataFr... Pandas是Python第三方库,提供高性能易用数据类型和分析工具 官网文档:http://pandas.pydata.org/pandas-docs/stable/10min.html 引入: import pandas as pd 1 Pandas基于NumPy实现,常与NumPy和Matplotlib一同使用 两个数据类型:Series, DataFr...
- 算术运算法则 算术运算根据行列索引,补齐后运算, 运算默认产生浮点数 补齐时缺项填充NaN(空值) 二维和一维、一维和零维间为广播运算 采用+ ‐* /符号进行的二元运算产生新的对象 方法形式的运算 方法说明.add(d, **argws)类型间加法运算,可选参数.sub(d, **argws)类型间减法运算,可选参数.mul(d, **argws)类型间... 算术运算法则 算术运算根据行列索引,补齐后运算, 运算默认产生浮点数 补齐时缺项填充NaN(空值) 二维和一维、一维和零维间为广播运算 采用+ ‐* /符号进行的二元运算产生新的对象 方法形式的运算 方法说明.add(d, **argws)类型间加法运算,可选参数.sub(d, **argws)类型间减法运算,可选参数.mul(d, **argws)类型间...
- numpy 科学计算基础库 官方文档:https://docs.scipy.org/doc/numpy/user/quickstart.html 列表和数组区别 列表:数据类型可以不同 数组:数据类型相同 12 N维数组对象 ndarray dimension 维度: 一组数据的组织形式 轴axis 数据维度 秩rank 轴的数量 ndarray数组一般要求所... numpy 科学计算基础库 官方文档:https://docs.scipy.org/doc/numpy/user/quickstart.html 列表和数组区别 列表:数据类型可以不同 数组:数据类型相同 12 N维数组对象 ndarray dimension 维度: 一组数据的组织形式 轴axis 数据维度 秩rank 轴的数量 ndarray数组一般要求所...
- DataFrame对象操作 重新索引 .reindex()能够改变或重排Series和DataFrame索引 .reindex(index=None, columns=None,…)的参数 参数说明index, columns新的行列自定义索引fill_value重新索引中,用于填充缺失位置的值method填充方法, ffill当前值向前填充,bfill向后填充... DataFrame对象操作 重新索引 .reindex()能够改变或重排Series和DataFrame索引 .reindex(index=None, columns=None,…)的参数 参数说明index, columns新的行列自定义索引fill_value重新索引中,用于填充缺失位置的值method填充方法, ffill当前值向前填充,bfill向后填充...
- argsort函数 返回的是数组值的索引值 import numpy as np x = np.array([3, 1, 4, 2, 5]) # 从小到大 np.argsort(x) Out[4]: array([1, 3, 0, 2, 4]) # 从大到小 np.argsort(-x) Out[5]: array([4, 2, 0, 3, 1])123456... argsort函数 返回的是数组值的索引值 import numpy as np x = np.array([3, 1, 4, 2, 5]) # 从小到大 np.argsort(x) Out[4]: array([1, 3, 0, 2, 4]) # 从大到小 np.argsort(-x) Out[5]: array([4, 2, 0, 3, 1])123456...
- DataFrame类型 DataFrame类型由共用相同索引的一组列组成 DataFrame是一个表格型的数据类型,每列值类型可以不同 DataFrame既有行索引、也有列索引 index axis=0 axis=1 column DataFrame常用于表达二维数据,但可以表达多维数据 DataFrame类型可以由如下类型创建: 二维ndarray对象... DataFrame类型 DataFrame类型由共用相同索引的一组列组成 DataFrame是一个表格型的数据类型,每列值类型可以不同 DataFrame既有行索引、也有列索引 index axis=0 axis=1 column DataFrame常用于表达二维数据,但可以表达多维数据 DataFrame类型可以由如下类型创建: 二维ndarray对象...
- numpy.random随机函数 rand(d0, d1,...dn) 随机数组, 浮点数,[0, 1)均匀分布 randn(d0, d1,...dn) 随机数组,正态分布 randint(low, high, shape) 指定随机范围 seed(s) 随机种子 shuffle(a) 随机排列第一轴, 改变数组a permutation(a) 根据第一轴返回乱序数组... numpy.random随机函数 rand(d0, d1,...dn) 随机数组, 浮点数,[0, 1)均匀分布 randn(d0, d1,...dn) 随机数组,正态分布 randint(low, high, shape) 指定随机范围 seed(s) 随机种子 shuffle(a) 随机排列第一轴, 改变数组a permutation(a) 根据第一轴返回乱序数组...
- Key and Imports In this cheat sheet, we use the following shorthand: df | Any pandas DataFrame object s | Any pandas Series object You’ll also need to perform the following imports t... Key and Imports In this cheat sheet, we use the following shorthand: df | Any pandas DataFrame object s | Any pandas Series object You’ll also need to perform the following imports t...
- Key and Imports In this cheat sheet, we use the following shorthand: arr | A NumPy Array object You’ll also need to import numpy to get started: import numpy as np Importing/exporti... Key and Imports In this cheat sheet, we use the following shorthand: arr | A NumPy Array object You’ll also need to import numpy to get started: import numpy as np Importing/exporti...
- 时序数据的异常点是指序列中存在模式不一致的点(如时序数据超出正常范围的上/下界,突然的上升或下降,趋势改变)。时序数据的异常检测旨在快速准确的找到这些异常点。代码块导入在NAIE训练平台的JupyterLab界面操作,不需要手动添加这一部分,因为在新创建的特征工程下已经包含了导入代码。import os os.chdir("/home/ma-user/work/test_ano... 时序数据的异常点是指序列中存在模式不一致的点(如时序数据超出正常范围的上/下界,突然的上升或下降,趋势改变)。时序数据的异常检测旨在快速准确的找到这些异常点。代码块导入在NAIE训练平台的JupyterLab界面操作,不需要手动添加这一部分,因为在新创建的特征工程下已经包含了导入代码。import os os.chdir("/home/ma-user/work/test_ano...
上滑加载中
推荐直播
-
华为云码道 × 仓颉编程:工程化AI编码探索2026/05/27 周三 19:00-21:00
刘俊杰-华为云仓颉语言专家/李炎-华为云码道技术专家/王智鹏-OpenCangjie开源社区发起人
本场直播围绕华为云仓颉语言与华为云码道的深度结合,展示华为云智能编程从零基础到高效落地的完整生态能力。以华为云码道为引擎,仓颉语言为载体,带给大家日常提效、趣味创新到极速量产的开发体验。
回顾中 -
一个AI团队帮你写代码:华为云码道Agent Space实战2026/06/25 周四 19:00-21:00
张翰文-华为云码道工程师/郭英旭-青软创新科技集团股份有限公司 软件架构师
本场直播聚焦华为云码道Agent Space两大模式:研发办公、代码开发,亲身体验从需求到代码的AI自动化能力。实操演示基于华为 CodeArts CLI,依托 OpenSpec 规格体系从零搭建业务项目。
回顾中
热门标签