- 文章目录 一、数据文件 1、下载数据文件 2、json文件行结构 二、数据清洗与分析任务 三、准备工作 1、启动h... 文章目录 一、数据文件 1、下载数据文件 2、json文件行结构 二、数据清洗与分析任务 三、准备工作 1、启动h...
- Python数据分析学习笔记:使用SciKit-Learn进行数据规范化 数据规范化是数据挖掘的一项基础工作。不同评价指标往往具有不同的量纲,数值见的差别可能很大,不进行处理可能会影响到数据分析的结果。为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化处理,将数据按照比例进行缩放,使之落入一个特定的区域,比如[0, 1],便于... Python数据分析学习笔记:使用SciKit-Learn进行数据规范化 数据规范化是数据挖掘的一项基础工作。不同评价指标往往具有不同的量纲,数值见的差别可能很大,不进行处理可能会影响到数据分析的结果。为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化处理,将数据按照比例进行缩放,使之落入一个特定的区域,比如[0, 1],便于...
- 关于正态分布 正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution)。正态分布是统计学中一个重要的概率分布方法,在数学、物理及工程等多领域有着广泛的应用场景。 日常分析工作中,我们对企业业务进行数据分析时,常常需要监测数据的分布... 关于正态分布 正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution)。正态分布是统计学中一个重要的概率分布方法,在数学、物理及工程等多领域有着广泛的应用场景。 日常分析工作中,我们对企业业务进行数据分析时,常常需要监测数据的分布...
- 产品经理无论是在进行需求澄清,还是进行产品版本迭代的时候,都会面对领导,研发,测试,设计等人员无数个为什么。比如:为什么要把这个楼层放在另一个楼层的上面?页面为什么要这么设计? 这个时候如果仅仅凭感觉、道理是无法有力说服对方的,长而久之会降低自己的影响力。同时,也无法形成正确的产品方法论,对自己的职业发展也颇为不利。 刚进公司,我所... 产品经理无论是在进行需求澄清,还是进行产品版本迭代的时候,都会面对领导,研发,测试,设计等人员无数个为什么。比如:为什么要把这个楼层放在另一个楼层的上面?页面为什么要这么设计? 这个时候如果仅仅凭感觉、道理是无法有力说服对方的,长而久之会降低自己的影响力。同时,也无法形成正确的产品方法论,对自己的职业发展也颇为不利。 刚进公司,我所...
- 关于tableau可视化相关专栏,可参见tableau可视化数据分析高级教程,感兴趣的小伙伴请自行订阅! 1、自定义“发现”窗格 Tableau2020.2版本后,可以自定义显示在 Tableau Desktop 中的“开始”页面上的“发现”窗格,以显示自定义 内容,而不是默认情况下显示的链接、博客文章和 Tableau 新闻。只需... 关于tableau可视化相关专栏,可参见tableau可视化数据分析高级教程,感兴趣的小伙伴请自行订阅! 1、自定义“发现”窗格 Tableau2020.2版本后,可以自定义显示在 Tableau Desktop 中的“开始”页面上的“发现”窗格,以显示自定义 内容,而不是默认情况下显示的链接、博客文章和 Tableau 新闻。只需...
- 从 Series 说起 Series 是一种类似于 一维 数组的对象,由一组数据(数据类型可以是整数、浮点数、字符串和其他 Python 对象)和与之同长度的索引(或称标签)组成。举个例子: import pandas as pd # 标签 1&n... 从 Series 说起 Series 是一种类似于 一维 数组的对象,由一组数据(数据类型可以是整数、浮点数、字符串和其他 Python 对象)和与之同长度的索引(或称标签)组成。举个例子: import pandas as pd # 标签 1&n...
- 前言 许多刚入门数据分析的小伙伴对一些数据指标或者数据本身的概念很模糊,尤其是当跟运营、数据分析师扯需求的时候,会被这些密密麻麻的指标给弄糊涂。 作为互联网从业人员,目前看来对数据指标、指标的运用还是需要再深入学习下。终于挤出一些时间重新梳理了关于数据指标相关的一些知识,先梳理下数据指标基础知识... 前言 许多刚入门数据分析的小伙伴对一些数据指标或者数据本身的概念很模糊,尤其是当跟运营、数据分析师扯需求的时候,会被这些密密麻麻的指标给弄糊涂。 作为互联网从业人员,目前看来对数据指标、指标的运用还是需要再深入学习下。终于挤出一些时间重新梳理了关于数据指标相关的一些知识,先梳理下数据指标基础知识...
- 前言 数据中台是中国本土诞生的一个名词,很多企业在“什么是数据中台”和“我要上XX中台”徘徊。其炒作程度跟当年的“大数据” 一词有一拼,如果用Gartner的炒作周期图来看,数据中台目前已经逼近炒作的顶峰。 与其不断地讨论什么是数据中台,企业更应该了解建设数据中台的目的是让企业高效的数据驱动,减少... 前言 数据中台是中国本土诞生的一个名词,很多企业在“什么是数据中台”和“我要上XX中台”徘徊。其炒作程度跟当年的“大数据” 一词有一拼,如果用Gartner的炒作周期图来看,数据中台目前已经逼近炒作的顶峰。 与其不断地讨论什么是数据中台,企业更应该了解建设数据中台的目的是让企业高效的数据驱动,减少...
- 目录 什么是商业智能BI? 什么是Tableau? 如何安装Tableau? 如何使用Tableau? 实操案例 1.什么是商业智能BI? 商业智能(Business Intelligence,简称:BI),又称商业智慧或商务智能,指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。 ... 目录 什么是商业智能BI? 什么是Tableau? 如何安装Tableau? 如何使用Tableau? 实操案例 1.什么是商业智能BI? 商业智能(Business Intelligence,简称:BI),又称商业智慧或商务智能,指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。 ...
- 前言 如何基于 Flink 搭建大规模准实时数据分析平台?在 Flink Forward Asia 2019 上,来自 Lyft 公司实时数据平台的徐赢博士和计算数据平台的高立博士分享了 Lyft 基于 Apache Flink 的大规模准实时数据分析平台的建设实践。 本次分享主要分为四个方面: L... 前言 如何基于 Flink 搭建大规模准实时数据分析平台?在 Flink Forward Asia 2019 上,来自 Lyft 公司实时数据平台的徐赢博士和计算数据平台的高立博士分享了 Lyft 基于 Apache Flink 的大规模准实时数据分析平台的建设实践。 本次分享主要分为四个方面: L...
- 如果你想使用最少的时间相对客观的了解一样事物,那么最好的方式就是快速收集大量的关于它的评价,然后迅速地找出这些评价中的关键信息。 而这道题目,有两个特别大的难点:1.如何快速收集大量的评论;2.如何迅速的从大量评论中抽取关键信息。 基于python语言的爬虫技术和文本分析技术刚好可以克服这两大困难,帮助我们更快更客观的了解某样事物。... 如果你想使用最少的时间相对客观的了解一样事物,那么最好的方式就是快速收集大量的关于它的评价,然后迅速地找出这些评价中的关键信息。 而这道题目,有两个特别大的难点:1.如何快速收集大量的评论;2.如何迅速的从大量评论中抽取关键信息。 基于python语言的爬虫技术和文本分析技术刚好可以克服这两大困难,帮助我们更快更客观的了解某样事物。...
- 前言 金三银四跳槽季,你准备好了吗?希望各位小伙伴能够苦练技术,早日达成自己心仪的offer。 在这里给自己打个广告,需要的小伙伴请自行订阅。 Spring系列面试题129道(附答案解析)Redis,快看看这40道面试题MyBatis的27道面试题 73道Java面试题合集-多线程与进程28道ZooKeeper面试题 &nbs... 前言 金三银四跳槽季,你准备好了吗?希望各位小伙伴能够苦练技术,早日达成自己心仪的offer。 在这里给自己打个广告,需要的小伙伴请自行订阅。 Spring系列面试题129道(附答案解析)Redis,快看看这40道面试题MyBatis的27道面试题 73道Java面试题合集-多线程与进程28道ZooKeeper面试题 &nbs...
- 实战一:中国大学排名 前言 由于上一篇文章中教会了大家如何存储数据,但是由于篇幅过大,就没有加入实战篇。想必大家也等着急了吧,所以今天就为大家带来两篇实战内容,希望可以帮助到各位更好的认识到爬虫与MySQL数据库结合的知识。 每年的6月都是高考的大日子,所有的学子都为自己的目标大学努力着,拼搏着,所以今天的第一篇实战就是为你们带来... 实战一:中国大学排名 前言 由于上一篇文章中教会了大家如何存储数据,但是由于篇幅过大,就没有加入实战篇。想必大家也等着急了吧,所以今天就为大家带来两篇实战内容,希望可以帮助到各位更好的认识到爬虫与MySQL数据库结合的知识。 每年的6月都是高考的大日子,所有的学子都为自己的目标大学努力着,拼搏着,所以今天的第一篇实战就是为你们带来...
- 有时面试时,考官会冷不防地提出一个应试者意想不到的问题,目的是想试试应试者的应变能力和处事能力。这时,你需要的是稳定情绪,千万不可乱了方寸。 随着大数据概念的火热,数据科学家这一职位应时而出,那么成为数据科学家要满足什么条件?或许我们可以从国外的数据科学家面试问题中得到一些参考,下面是77个关于数据分析或者数据科学家招聘的时候会常... 有时面试时,考官会冷不防地提出一个应试者意想不到的问题,目的是想试试应试者的应变能力和处事能力。这时,你需要的是稳定情绪,千万不可乱了方寸。 随着大数据概念的火热,数据科学家这一职位应时而出,那么成为数据科学家要满足什么条件?或许我们可以从国外的数据科学家面试问题中得到一些参考,下面是77个关于数据分析或者数据科学家招聘的时候会常...
- 01 结构规范及写作 报告常用结构: 1. 架构清晰、主次分明 数据分析报告要有一个清晰的架构,层次分明能降低阅读成本,有助于信息的传达。虽然不同类型的分析报告有其适用的呈现方式,但总的来说作为议论文的一种,大部分的分析报告还是适用总-分-(总) 的结构。 以下是我为大家准备的几个精品专栏... 01 结构规范及写作 报告常用结构: 1. 架构清晰、主次分明 数据分析报告要有一个清晰的架构,层次分明能降低阅读成本,有助于信息的传达。虽然不同类型的分析报告有其适用的呈现方式,但总的来说作为议论文的一种,大部分的分析报告还是适用总-分-(总) 的结构。 以下是我为大家准备的几个精品专栏...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签