- 字符串操作 In [1]: ... 字符串操作 In [1]: ...
- 2、分类 1、过分拟合问题: 造成原因有:(1)噪声造成的过分拟合(因为它拟合了误标记的训练记录,导致了对检验集中记录的误分类);(2)根据少量训练记录做出分类决策的模型也容易受过分拟合的影响。(由于训练数据缺乏具有代表性的样本,在没有多少训练记录的情况下,学习算法仍然继续细化模型就会产生这样的模型,当决策树的叶节点没有足够的代表性... 2、分类 1、过分拟合问题: 造成原因有:(1)噪声造成的过分拟合(因为它拟合了误标记的训练记录,导致了对检验集中记录的误分类);(2)根据少量训练记录做出分类决策的模型也容易受过分拟合的影响。(由于训练数据缺乏具有代表性的样本,在没有多少训练记录的情况下,学习算法仍然继续细化模型就会产生这样的模型,当决策树的叶节点没有足够的代表性...
- python-pandas之Series数据分析(四) '''Series的定义:Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。Series对象本质上是一个NumPy的数组,因此NumPy的数组处理函数可以直接对Series进行处理。但是Seri... python-pandas之Series数据分析(四) '''Series的定义:Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。Series对象本质上是一个NumPy的数组,因此NumPy的数组处理函数可以直接对Series进行处理。但是Seri...
- 数据表的时间类型操作 In [59]: ... 数据表的时间类型操作 In [59]: ...
- Pandas索引 import pandas as pddf = pd.read_csv('C:/JupyterWork/data/titanic.csv') :5df['Age'][:5]0 22.01 38.02 26.03 35.04 35.0Name: Age, dtype: float641、指... Pandas索引 import pandas as pddf = pd.read_csv('C:/JupyterWork/data/titanic.csv') :5df['Age'][:5]0 22.01 38.02 26.03 35.04 35.0Name: Age, dtype: float641、指...
- 最近参与了了一个日志和告警的数据挖掘项目,里面用到的一些思路在这里和大家做一个分享。 项目的需求是收集的客户系统一个月300G左右的的日志和告警数据做一个整理,主要是归类(Grouping)和关联(Correlation),从而得到告警和日志的一些统计关系,这些统计结果可以给一线支持人员参考。 得到的数据主要分为... 最近参与了了一个日志和告警的数据挖掘项目,里面用到的一些思路在这里和大家做一个分享。 项目的需求是收集的客户系统一个月300G左右的的日志和告警数据做一个整理,主要是归类(Grouping)和关联(Correlation),从而得到告警和日志的一些统计关系,这些统计结果可以给一线支持人员参考。 得到的数据主要分为...
- python-Numpy数据分析(一) 使用numpy创建数据 import numpy as np print('将普通的一维列表生成Numpy一维数组')data = [1,23,45,5,4]arr = np.array(data)print(arr)print('打印数组元素类型')print(arr.dty... python-Numpy数据分析(一) 使用numpy创建数据 import numpy as np print('将普通的一维列表生成Numpy一维数组')data = [1,23,45,5,4]arr = np.array(data)print(arr)print('打印数组元素类型')print(arr.dty...
- pandas常用操作 In [3]: ... pandas常用操作 In [3]: ...
- python-Numpy数据分析(二) 利用数组进行数据处理 将条件逻辑表述为数组运算 '''利用数组进行数据处理 将条件逻辑表述为数组运算• 列表推导的局限性• 纯Python代码,速度不够快。• 无法应用于高维数组• where和where的嵌套'''import numpy as npimport numpy.... python-Numpy数据分析(二) 利用数组进行数据处理 将条件逻辑表述为数组运算 '''利用数组进行数据处理 将条件逻辑表述为数组运算• 列表推导的局限性• 纯Python代码,速度不够快。• 无法应用于高维数组• where和where的嵌套'''import numpy as npimport numpy....
- 导读:随着大数据时代浪潮的到来,数据科学家这一新兴职业也越来越受到人们的关注。本文作者Alexandru Nedelcu就将数学挖掘算法与大数据有机的结合起来,并无缝的应用在面临大数据浪潮的网站之中。 数据科学家需要具备专业领域知识并研究相应的算法以分析对应的问题,而数据挖掘是其必须掌握的重要技术。(相关文章:《数据科学家:未来至... 导读:随着大数据时代浪潮的到来,数据科学家这一新兴职业也越来越受到人们的关注。本文作者Alexandru Nedelcu就将数学挖掘算法与大数据有机的结合起来,并无缝的应用在面临大数据浪潮的网站之中。 数据科学家需要具备专业领域知识并研究相应的算法以分析对应的问题,而数据挖掘是其必须掌握的重要技术。(相关文章:《数据科学家:未来至...
- 说到BI工具和数据中台,不得不先说数据。数据是由企业在日常管理、经营活动、行业信息和外界的市场动态等产生的综合信息。这些信息经过分析,得出的数据决定了企业能够就产品、服务、员工、战略等做出正确决策的关键。那么如何将企业内外的信息进行归纳,并分析呢?这就是BI工具和数据中台来实现的。 BI工具和数据中台有什么区别呢? 一、标准定位不同... 说到BI工具和数据中台,不得不先说数据。数据是由企业在日常管理、经营活动、行业信息和外界的市场动态等产生的综合信息。这些信息经过分析,得出的数据决定了企业能够就产品、服务、员工、战略等做出正确决策的关键。那么如何将企业内外的信息进行归纳,并分析呢?这就是BI工具和数据中台来实现的。 BI工具和数据中台有什么区别呢? 一、标准定位不同...
- 索引扩展 In [2]: ... 索引扩展 In [2]: ...
- 我计划整理数据挖掘的基本概念和算法,包括关联规则挖掘、分类、聚类的常用算法,敬请期待。今天讲的是关联规则挖掘的最基本的知识。 关联规则挖掘在电商、零售、大气物理、生物医学已经有了广泛的应用,本篇文章将介绍一些基本知识和Aprori算法。 我计划整理数据挖掘的基本概念和算法,包括关联规则挖掘、分类、聚类的常用算法,敬请期待。今天讲的是关联规则挖掘的最基本的知识。 关联规则挖掘在电商、零售、大气物理、生物医学已经有了广泛的应用,本篇文章将介绍一些基本知识和Aprori算法。
- 博主说明: 1、原文献非最新文章,只是本人向来对算法比较敏感、感兴趣,便把原文细看了下, 翻译过程中,有参考一些网友翻译的文章,但个人认为,阐述皆不够精准,且都是泛泛而谈, 故此,做了此份翻译,希望,为读者提供一个较权威而详细的文档资料。 2、同时,也可于闲余之际择其一二好好研究、剖析下此数据挖掘领域的十大经典算法。 文... 博主说明: 1、原文献非最新文章,只是本人向来对算法比较敏感、感兴趣,便把原文细看了下, 翻译过程中,有参考一些网友翻译的文章,但个人认为,阐述皆不够精准,且都是泛泛而谈, 故此,做了此份翻译,希望,为读者提供一个较权威而详细的文档资料。 2、同时,也可于闲余之际择其一二好好研究、剖析下此数据挖掘领域的十大经典算法。 文...
- Series对象的增删改查 In [1]: ... Series对象的增删改查 In [1]: ...
上滑加载中
推荐直播
-
香橙派AIpro的远程推理框架与实验案例
2025/07/04 周五 19:00-20:00
郝家胜 -华为开发者布道师-高校教师
AiR推理框架创新采用将模型推理与模型应用相分离的机制,把香橙派封装为AI推理黑盒服务,构建了分布式远程推理框架,并提供多种输入模态、多种输出方式以及多线程支持的高度复用框架,解决了开发板环境配置复杂上手困难、缺乏可视化体验和资源稀缺课程受限等痛点问题,真正做到开箱即用,并支持多种笔记本电脑环境、多种不同编程语言,10行代码即可体验图像分割迁移案例。
回顾中 -
鸿蒙端云一体化应用开发
2025/07/10 周四 19:00-20:00
倪红军 华为开发者布道师-高校教师
基于鸿蒙平台终端设备的应用场景越来越多、使用范围越来越广。本课程以云数据库服务为例,介绍云侧项目应用的创建、新建对象类型、新增存储区及向对象类型中添加数据对象的方法,端侧(HarmonyOS平台)一体化工程项目的创建、云数据资源的关联方法及对云侧数据的增删改查等操作方法,为开发端云一体化应用打下坚实基础。
即将直播
热门标签