- 机器学习可以说是高级分析的典型代表。机器学习领域汇集了众多技术,这些技术用于让计算机基于大量数据来学习数据的倾向并作出某些判断。机器学习的算法可以根据输入的数据类型分为“监督学习”和“非监督学习”两种。 监督学习和非监督学习 当用机器学习的算法让计算机学习数据倾向时,算法会根据用于学习的数据中是否含有“正确答案”的数据而有所不同。打... 机器学习可以说是高级分析的典型代表。机器学习领域汇集了众多技术,这些技术用于让计算机基于大量数据来学习数据的倾向并作出某些判断。机器学习的算法可以根据输入的数据类型分为“监督学习”和“非监督学习”两种。 监督学习和非监督学习 当用机器学习的算法让计算机学习数据倾向时,算法会根据用于学习的数据中是否含有“正确答案”的数据而有所不同。打...
- Python数据分析学习笔记:计算向量夹角 通过计算两个向量夹角了解两个向量之间的相关性。 # 计算向量夹角 import numpy as np def included_angle(a, b): a_norm = np.sqrt(np.sum(a * a)) b_norm = np.sqrt(np.sum(b *... Python数据分析学习笔记:计算向量夹角 通过计算两个向量夹角了解两个向量之间的相关性。 # 计算向量夹角 import numpy as np def included_angle(a, b): a_norm = np.sqrt(np.sum(a * a)) b_norm = np.sqrt(np.sum(b *...
- 文章目录 一、数据结构:Series和DataFrame 1、Series(序列——一维序列结构) 2、DataFrame(数据帧——二维表结构) 文章目录 一、数据结构:Series和DataFrame 1、Series(序列——一维序列结构) 2、DataFrame(数据帧——二维表结构)
- 文章目录 一、数据文件 1、下载数据文件 2、json文件行结构 二、数据清洗与分析任务 三、准备工作 1、启动h... 文章目录 一、数据文件 1、下载数据文件 2、json文件行结构 二、数据清洗与分析任务 三、准备工作 1、启动h...
- Python数据分析学习笔记:使用SciKit-Learn进行数据规范化 数据规范化是数据挖掘的一项基础工作。不同评价指标往往具有不同的量纲,数值见的差别可能很大,不进行处理可能会影响到数据分析的结果。为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化处理,将数据按照比例进行缩放,使之落入一个特定的区域,比如[0, 1],便于... Python数据分析学习笔记:使用SciKit-Learn进行数据规范化 数据规范化是数据挖掘的一项基础工作。不同评价指标往往具有不同的量纲,数值见的差别可能很大,不进行处理可能会影响到数据分析的结果。为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化处理,将数据按照比例进行缩放,使之落入一个特定的区域,比如[0, 1],便于...
- 关于正态分布 正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution)。正态分布是统计学中一个重要的概率分布方法,在数学、物理及工程等多领域有着广泛的应用场景。 日常分析工作中,我们对企业业务进行数据分析时,常常需要监测数据的分布... 关于正态分布 正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution)。正态分布是统计学中一个重要的概率分布方法,在数学、物理及工程等多领域有着广泛的应用场景。 日常分析工作中,我们对企业业务进行数据分析时,常常需要监测数据的分布...
- 产品经理无论是在进行需求澄清,还是进行产品版本迭代的时候,都会面对领导,研发,测试,设计等人员无数个为什么。比如:为什么要把这个楼层放在另一个楼层的上面?页面为什么要这么设计? 这个时候如果仅仅凭感觉、道理是无法有力说服对方的,长而久之会降低自己的影响力。同时,也无法形成正确的产品方法论,对自己的职业发展也颇为不利。 刚进公司,我所... 产品经理无论是在进行需求澄清,还是进行产品版本迭代的时候,都会面对领导,研发,测试,设计等人员无数个为什么。比如:为什么要把这个楼层放在另一个楼层的上面?页面为什么要这么设计? 这个时候如果仅仅凭感觉、道理是无法有力说服对方的,长而久之会降低自己的影响力。同时,也无法形成正确的产品方法论,对自己的职业发展也颇为不利。 刚进公司,我所...
- 关于tableau可视化相关专栏,可参见tableau可视化数据分析高级教程,感兴趣的小伙伴请自行订阅! 1、自定义“发现”窗格 Tableau2020.2版本后,可以自定义显示在 Tableau Desktop 中的“开始”页面上的“发现”窗格,以显示自定义 内容,而不是默认情况下显示的链接、博客文章和 Tableau 新闻。只需... 关于tableau可视化相关专栏,可参见tableau可视化数据分析高级教程,感兴趣的小伙伴请自行订阅! 1、自定义“发现”窗格 Tableau2020.2版本后,可以自定义显示在 Tableau Desktop 中的“开始”页面上的“发现”窗格,以显示自定义 内容,而不是默认情况下显示的链接、博客文章和 Tableau 新闻。只需...
- 从 Series 说起 Series 是一种类似于 一维 数组的对象,由一组数据(数据类型可以是整数、浮点数、字符串和其他 Python 对象)和与之同长度的索引(或称标签)组成。举个例子: import pandas as pd # 标签 1&n... 从 Series 说起 Series 是一种类似于 一维 数组的对象,由一组数据(数据类型可以是整数、浮点数、字符串和其他 Python 对象)和与之同长度的索引(或称标签)组成。举个例子: import pandas as pd # 标签 1&n...
- 前言 许多刚入门数据分析的小伙伴对一些数据指标或者数据本身的概念很模糊,尤其是当跟运营、数据分析师扯需求的时候,会被这些密密麻麻的指标给弄糊涂。 作为互联网从业人员,目前看来对数据指标、指标的运用还是需要再深入学习下。终于挤出一些时间重新梳理了关于数据指标相关的一些知识,先梳理下数据指标基础知识... 前言 许多刚入门数据分析的小伙伴对一些数据指标或者数据本身的概念很模糊,尤其是当跟运营、数据分析师扯需求的时候,会被这些密密麻麻的指标给弄糊涂。 作为互联网从业人员,目前看来对数据指标、指标的运用还是需要再深入学习下。终于挤出一些时间重新梳理了关于数据指标相关的一些知识,先梳理下数据指标基础知识...
- 前言 数据中台是中国本土诞生的一个名词,很多企业在“什么是数据中台”和“我要上XX中台”徘徊。其炒作程度跟当年的“大数据” 一词有一拼,如果用Gartner的炒作周期图来看,数据中台目前已经逼近炒作的顶峰。 与其不断地讨论什么是数据中台,企业更应该了解建设数据中台的目的是让企业高效的数据驱动,减少... 前言 数据中台是中国本土诞生的一个名词,很多企业在“什么是数据中台”和“我要上XX中台”徘徊。其炒作程度跟当年的“大数据” 一词有一拼,如果用Gartner的炒作周期图来看,数据中台目前已经逼近炒作的顶峰。 与其不断地讨论什么是数据中台,企业更应该了解建设数据中台的目的是让企业高效的数据驱动,减少...
- 目录 什么是商业智能BI? 什么是Tableau? 如何安装Tableau? 如何使用Tableau? 实操案例 1.什么是商业智能BI? 商业智能(Business Intelligence,简称:BI),又称商业智慧或商务智能,指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。 ... 目录 什么是商业智能BI? 什么是Tableau? 如何安装Tableau? 如何使用Tableau? 实操案例 1.什么是商业智能BI? 商业智能(Business Intelligence,简称:BI),又称商业智慧或商务智能,指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。 ...
- 前言 如何基于 Flink 搭建大规模准实时数据分析平台?在 Flink Forward Asia 2019 上,来自 Lyft 公司实时数据平台的徐赢博士和计算数据平台的高立博士分享了 Lyft 基于 Apache Flink 的大规模准实时数据分析平台的建设实践。 本次分享主要分为四个方面: L... 前言 如何基于 Flink 搭建大规模准实时数据分析平台?在 Flink Forward Asia 2019 上,来自 Lyft 公司实时数据平台的徐赢博士和计算数据平台的高立博士分享了 Lyft 基于 Apache Flink 的大规模准实时数据分析平台的建设实践。 本次分享主要分为四个方面: L...
- 如果你想使用最少的时间相对客观的了解一样事物,那么最好的方式就是快速收集大量的关于它的评价,然后迅速地找出这些评价中的关键信息。 而这道题目,有两个特别大的难点:1.如何快速收集大量的评论;2.如何迅速的从大量评论中抽取关键信息。 基于python语言的爬虫技术和文本分析技术刚好可以克服这两大困难,帮助我们更快更客观的了解某样事物。... 如果你想使用最少的时间相对客观的了解一样事物,那么最好的方式就是快速收集大量的关于它的评价,然后迅速地找出这些评价中的关键信息。 而这道题目,有两个特别大的难点:1.如何快速收集大量的评论;2.如何迅速的从大量评论中抽取关键信息。 基于python语言的爬虫技术和文本分析技术刚好可以克服这两大困难,帮助我们更快更客观的了解某样事物。...
- 前言 金三银四跳槽季,你准备好了吗?希望各位小伙伴能够苦练技术,早日达成自己心仪的offer。 在这里给自己打个广告,需要的小伙伴请自行订阅。 Spring系列面试题129道(附答案解析)Redis,快看看这40道面试题MyBatis的27道面试题 73道Java面试题合集-多线程与进程28道ZooKeeper面试题 &nbs... 前言 金三银四跳槽季,你准备好了吗?希望各位小伙伴能够苦练技术,早日达成自己心仪的offer。 在这里给自己打个广告,需要的小伙伴请自行订阅。 Spring系列面试题129道(附答案解析)Redis,快看看这40道面试题MyBatis的27道面试题 73道Java面试题合集-多线程与进程28道ZooKeeper面试题 &nbs...
上滑加载中
推荐直播
-
华为云码道 × 仓颉编程:工程化AI编码探索2026/05/27 周三 19:00-21:00
刘俊杰-华为云仓颉语言专家/李炎-华为云码道技术专家/王智鹏-OpenCangjie开源社区发起人
本场直播围绕华为云仓颉语言与华为云码道的深度结合,展示华为云智能编程从零基础到高效落地的完整生态能力。以华为云码道为引擎,仓颉语言为载体,带给大家日常提效、趣味创新到极速量产的开发体验。
回顾中 -
一个AI团队帮你写代码:华为云码道Agent Space实战2026/06/25 周四 19:00-21:00
张翰文-华为云码道工程师/郭英旭-青软创新科技集团股份有限公司 软件架构师
本场直播聚焦华为云码道Agent Space两大模式:研发办公、代码开发,亲身体验从需求到代码的AI自动化能力。实操演示基于华为 CodeArts CLI,依托 OpenSpec 规格体系从零搭建业务项目。
回顾中
热门标签