- 6 模块开发——ETL 该项目的数据分析过程在hadoop集群上实现,主要应用hive数据仓库工具,因此,采集并经过预处理后的数据,需要加载到hive数据仓库中,以进行后续的挖掘分析。 6.1创建原始数据表 --在hive仓库中建贴源数据表 drop table if exists ods_weblog_origin;create table... 6 模块开发——ETL 该项目的数据分析过程在hadoop集群上实现,主要应用hive数据仓库工具,因此,采集并经过预处理后的数据,需要加载到hive数据仓库中,以进行后续的挖掘分析。 6.1创建原始数据表 --在hive仓库中建贴源数据表 drop table if exists ods_weblog_origin;create table...
- 本文为不同阶段的Python学习者从不同角度量身定制了49个学习资源。 初学者 Welcome to Python.org https://www.python.org/官方Python站点提供了一个开始使用Python生态系统和学习Python的好方法,包括官方文档。 Learning Python The Hard Way https://lear... 本文为不同阶段的Python学习者从不同角度量身定制了49个学习资源。 初学者 Welcome to Python.org https://www.python.org/官方Python站点提供了一个开始使用Python生态系统和学习Python的好方法,包括官方文档。 Learning Python The Hard Way https://lear...
- 今天强烈推荐一些与数据相关的优质公众号,数据ers大部分都关注了,在工作、生活节奏超快的今天,想要不断提升自我,利用碎片化阅读学习是你最佳选择,这些号在行业里深耕已久,会给你带来事半功倍的效果。 下面这几个精心挑选的数据公众号,里面有很多优质内容,相信大家一定能从中有所收获! 数学加油吧 ▲长按图片识别二维码关注 数... 今天强烈推荐一些与数据相关的优质公众号,数据ers大部分都关注了,在工作、生活节奏超快的今天,想要不断提升自我,利用碎片化阅读学习是你最佳选择,这些号在行业里深耕已久,会给你带来事半功倍的效果。 下面这几个精心挑选的数据公众号,里面有很多优质内容,相信大家一定能从中有所收获! 数学加油吧 ▲长按图片识别二维码关注 数...
- 这篇文章讲述的是数据存储方式和数据类型等基本概念、数据清洗的必要性和质量评价的关键点。希望这篇数据清洗的文章对您有所帮助!如果您有想学习的知识或建议,可以给作者留言~ Chapter01 | 数据清洗概况 一、什么是数据1、数据的类型2、表格数据3、属性类别 二、数据清洗1、什么是数据清洗2、为什么要进行数据清洗3、数据存在的问题 三、数据质量评估四、数... 这篇文章讲述的是数据存储方式和数据类型等基本概念、数据清洗的必要性和质量评价的关键点。希望这篇数据清洗的文章对您有所帮助!如果您有想学习的知识或建议,可以给作者留言~ Chapter01 | 数据清洗概况 一、什么是数据1、数据的类型2、表格数据3、属性类别 二、数据清洗1、什么是数据清洗2、为什么要进行数据清洗3、数据存在的问题 三、数据质量评估四、数...
- 大家好,我是不温卜火,是一名计算机学院大数据专业大二的学生,昵称来源于成语—不温不火,本意是希望自己性情温和。作为一名互联网行业的小白,博主写博客一方面是为了记录自己的学习过程,另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样处于起步阶段的萌新。但由于水平有限,博客中难免会有一些错误出现,有纰漏之处恳请各位大佬不吝赐教!暂时只有csdn这一个平台,博客... 大家好,我是不温卜火,是一名计算机学院大数据专业大二的学生,昵称来源于成语—不温不火,本意是希望自己性情温和。作为一名互联网行业的小白,博主写博客一方面是为了记录自己的学习过程,另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样处于起步阶段的萌新。但由于水平有限,博客中难免会有一些错误出现,有纰漏之处恳请各位大佬不吝赐教!暂时只有csdn这一个平台,博客...
- 当数据科学家需要使用某些软件时,其中一部分我们已经在之前的章节中做过介绍,这些软件涵盖了数据科学家所需要的基础专业内容。实际的工作范畴可能会超越求职时候的工作描述,这也是IT工作的常态之一。这在某种程度上是好的,因为它提供了学习新技能的机会,而这也是数据科学领域最引人入胜的方面之一。 在这一章中,我们会探索数据科学环境中常用的软件。不是所有在这里提到的软件都会在你的工作中用到,但了解... 当数据科学家需要使用某些软件时,其中一部分我们已经在之前的章节中做过介绍,这些软件涵盖了数据科学家所需要的基础专业内容。实际的工作范畴可能会超越求职时候的工作描述,这也是IT工作的常态之一。这在某种程度上是好的,因为它提供了学习新技能的机会,而这也是数据科学领域最引人入胜的方面之一。 在这一章中,我们会探索数据科学环境中常用的软件。不是所有在这里提到的软件都会在你的工作中用到,但了解...
- 我们构建一个分类器,输入为运动员的身高、体重,输出为其从事的体育项目—体操、田径或篮球。 我们构建一个分类器,输入为运动员的身高、体重,输出为其从事的体育项目—体操、田径或篮球。
- 2017年1月24日晚8点半,乐逗游戏挖掘团队负责人、资深R语言用户谢佳标带来了主题为“数据分析利器:R语言快速入门”的Chat交流。以下是主持人孙莫默整理的实录,记录了谢佳标与读者之间交流的精彩问答。问:常用的数据分析工具有哪些?为什么选择R语言作为分析工具?答: 常用的数据分析工具有很多,包括大家平时一直在用的excel,这就是个不错的分析工具,我们可以实现常用的数据分析、绘图功能。但是... 2017年1月24日晚8点半,乐逗游戏挖掘团队负责人、资深R语言用户谢佳标带来了主题为“数据分析利器:R语言快速入门”的Chat交流。以下是主持人孙莫默整理的实录,记录了谢佳标与读者之间交流的精彩问答。问:常用的数据分析工具有哪些?为什么选择R语言作为分析工具?答: 常用的数据分析工具有很多,包括大家平时一直在用的excel,这就是个不错的分析工具,我们可以实现常用的数据分析、绘图功能。但是...
- 为了能更好地理解数据科学,我们即将翻开历史,检视它所包含的新规则,以及它所带来的新思维,同样,还有它所带来的新变化。数据科学领域的历史“数据科学”这一术语的流行要早于“大数据”的出现(就像“数据”一词要早于“计算机(computer)”400年出现)。1962年,当John W. Tukey写了《数据分析的未来》(The Future of Data Analysis),他预见了数据分析的新... 为了能更好地理解数据科学,我们即将翻开历史,检视它所包含的新规则,以及它所带来的新思维,同样,还有它所带来的新变化。数据科学领域的历史“数据科学”这一术语的流行要早于“大数据”的出现(就像“数据”一词要早于“计算机(computer)”400年出现)。1962年,当John W. Tukey写了《数据分析的未来》(The Future of Data Analysis),他预见了数据分析的新...
- Citi Bike是纽约市在2013年5月27日启动的一项自行车共享计划,由“花旗银行”(Citi Bank)赞助并取名为“花旗单车”(Citi Bike)。在曼哈顿,布鲁克林,皇后区和泽西市有8,000辆自行车和500个车站。为纽约的居民和游客提供一种方便快捷,并且省钱的出行方式。人们随处都能借到Citi Bank,并在他们的目的地归还。使用Citi Bank的方法很简单,购买会员资格,然... Citi Bike是纽约市在2013年5月27日启动的一项自行车共享计划,由“花旗银行”(Citi Bank)赞助并取名为“花旗单车”(Citi Bike)。在曼哈顿,布鲁克林,皇后区和泽西市有8,000辆自行车和500个车站。为纽约的居民和游客提供一种方便快捷,并且省钱的出行方式。人们随处都能借到Citi Bank,并在他们的目的地归还。使用Citi Bank的方法很简单,购买会员资格,然...
- 作者 | 张溪梦,GrowingIO 创始人 & CEO,美国 Data Science Central 评选其为“世界前十位前沿数据科学家”,前 LinkedIn 美国商业分析部高级总监,《首席增长官》一书作者。来源 | GrowingIO 2017 增长大会大家好,今天我跟大家分享的是首席增长官这个职务背后的故事。可口可乐是一家拥有 100 多年历史的老牌企业,基于顶级的行研报告,可口可... 作者 | 张溪梦,GrowingIO 创始人 & CEO,美国 Data Science Central 评选其为“世界前十位前沿数据科学家”,前 LinkedIn 美国商业分析部高级总监,《首席增长官》一书作者。来源 | GrowingIO 2017 增长大会大家好,今天我跟大家分享的是首席增长官这个职务背后的故事。可口可乐是一家拥有 100 多年历史的老牌企业,基于顶级的行研报告,可口可...
- 一、本书内容的介绍《数据科学家访谈录》是一本对当前全球最知名的25位数据科学家的深度采访,然后汇聚成册的访谈录,读者可以从中学习到这25位数据科学领域的大师的个人经历及其成长过程,以及在各自的职业生涯所面临的各种选项时所做出的选择,具有很高的参考价值。这25位数据科学家大都拥有国外名校的博士学历文凭,但是大都不想继续从事科研工作,而是希望能够将自己的科学研究成果应用到现实生活当中,从而让人们... 一、本书内容的介绍《数据科学家访谈录》是一本对当前全球最知名的25位数据科学家的深度采访,然后汇聚成册的访谈录,读者可以从中学习到这25位数据科学领域的大师的个人经历及其成长过程,以及在各自的职业生涯所面临的各种选项时所做出的选择,具有很高的参考价值。这25位数据科学家大都拥有国外名校的博士学历文凭,但是大都不想继续从事科研工作,而是希望能够将自己的科学研究成果应用到现实生活当中,从而让人们...
- 本节书摘来自华章计算机《Spark数据分析:基于Python语言(英文版)》一作者是[澳]杰夫瑞·艾文(Jeffrey Aven)。 本节书摘来自华章计算机《Spark数据分析:基于Python语言(英文版)》一作者是[澳]杰夫瑞·艾文(Jeffrey Aven)。
- 2018-2019年,互联网寒冬突如其来,许多IT从业者遭遇降薪、裁员、找工作难等问题。程序员作为曾经备受羡慕的高薪群体,如今也面临着“保饭碗”的巨大压力,许多想要入坑的新人也处于观望态势。几年前,只要有一定编程能力,就能顺利找到工作,而且每跳槽一次,工资就能飞涨。然而今时不同往日,除了编程能力外,行业资历、项目实战经验、新技术的掌握等,也成为制约程序员等技术人跳槽加薪、稳固根基的门槛,人才... 2018-2019年,互联网寒冬突如其来,许多IT从业者遭遇降薪、裁员、找工作难等问题。程序员作为曾经备受羡慕的高薪群体,如今也面临着“保饭碗”的巨大压力,许多想要入坑的新人也处于观望态势。几年前,只要有一定编程能力,就能顺利找到工作,而且每跳槽一次,工资就能飞涨。然而今时不同往日,除了编程能力外,行业资历、项目实战经验、新技术的掌握等,也成为制约程序员等技术人跳槽加薪、稳固根基的门槛,人才...
- 本节书摘来自华章计算机《R数据科学实战:工具详解与案例分析》 一书中第二章,第2.5.4节,作者刘 健 邬书豪 。 本节书摘来自华章计算机《R数据科学实战:工具详解与案例分析》 一书中第二章,第2.5.4节,作者刘 健 邬书豪 。
上滑加载中
推荐直播
-
香橙派AIpro的远程推理框架与实验案例
2025/07/04 周五 19:00-20:00
郝家胜 -华为开发者布道师-高校教师
AiR推理框架创新采用将模型推理与模型应用相分离的机制,把香橙派封装为AI推理黑盒服务,构建了分布式远程推理框架,并提供多种输入模态、多种输出方式以及多线程支持的高度复用框架,解决了开发板环境配置复杂上手困难、缺乏可视化体验和资源稀缺课程受限等痛点问题,真正做到开箱即用,并支持多种笔记本电脑环境、多种不同编程语言,10行代码即可体验图像分割迁移案例。
即将直播 -
鸿蒙端云一体化应用开发
2025/07/10 周四 19:00-20:00
倪红军 华为开发者布道师-高校教师
基于鸿蒙平台终端设备的应用场景越来越多、使用范围越来越广。本课程以云数据库服务为例,介绍云侧项目应用的创建、新建对象类型、新增存储区及向对象类型中添加数据对象的方法,端侧(HarmonyOS平台)一体化工程项目的创建、云数据资源的关联方法及对云侧数据的增删改查等操作方法,为开发端云一体化应用打下坚实基础。
即将直播
热门标签