- 非监督学习 概述 概述 从本书开始, 将正式进入到监督学习 (Unsupervised Learning) 部分. 无监督学习, 顾名思义, 就是不受监督学习, 一种自由的学习方式. 该学... 非监督学习 概述 概述 从本书开始, 将正式进入到监督学习 (Unsupervised Learning) 部分. 无监督学习, 顾名思义, 就是不受监督学习, 一种自由的学习方式. 该学...
- [toc] 练习三 假设现在我们有一组从 2006 年到 2016 年 1000 部最流行的电影数据, 我们想知道这些电影中评分的平均分, 导演的人数等信息, 我们应该怎么获取? 执行结果: [toc] 练习三 假设现在我们有一组从 2006 年到 2016 年 1000 部最流行的电影数据, 我们想知道这些电影中评分的平均分, 导演的人数等信息, 我们应该怎么获取? 执行结果:
- [toc] Numpy 中的 nan 和 inf nan ( NAN, Nan ): not a number 表示不是一个数字 inf ( -inf, inf ): infinity, inf 表示正无穷, -inf 表示浮无穷 什么时候 numpy 中会出现 nan 当我们读取本地的文件为 float 的时候, 如果有缺失... [toc] Numpy 中的 nan 和 inf nan ( NAN, Nan ): not a number 表示不是一个数字 inf ( -inf, inf ): infinity, inf 表示正无穷, -inf 表示浮无穷 什么时候 numpy 中会出现 nan 当我们读取本地的文件为 float 的时候, 如果有缺失...
- [toc] Pandas 重采样 重采样: 指的是将时间序列从一个频率转化为另一个频率进行处理的过程, 将高频率数据数据转化为低频数据为降采样, 低频转化为高频率为升采样. pandas 提供了一个 resample 的方法来帮助我们实现频率转化. 执行结果: [toc] Pandas 重采样 重采样: 指的是将时间序列从一个频率转化为另一个频率进行处理的过程, 将高频率数据数据转化为低频数据为降采样, 低频转化为高频率为升采样. pandas 提供了一个 resample 的方法来帮助我们实现频率转化. 执行结果:
- [toc] CONDA 环境安装 conda: data science package & enviornment manager 创建环境: conda create--name python3 python=3 切换环境: windows: activat... [toc] CONDA 环境安装 conda: data science package & enviornment manager 创建环境: conda create--name python3 python=3 切换环境: windows: activat...
- 推荐系统评测 概述推荐系统的实验方法离线实验用户调查在线试验 评测指标用户满意度预测准确度评分预测TopN 推荐 概述 什么才是好的推荐系统? 这是推荐系统需要解决的首要问题... 推荐系统评测 概述推荐系统的实验方法离线实验用户调查在线试验 评测指标用户满意度预测准确度评分预测TopN 推荐 概述 什么才是好的推荐系统? 这是推荐系统需要解决的首要问题...
- [toc] Pandas 之 DataFrame DataFrame 对象既有行索引, 又有列索引 行索引, 表面不同行, 横向索引, 叫 index, 0 轴, axis= 0 列索引, 表名不同列, 纵向索引, 叫 columns, 1 轴, axis= 1 执行结果: 执行结果: 执行结果: ... [toc] Pandas 之 DataFrame DataFrame 对象既有行索引, 又有列索引 行索引, 表面不同行, 横向索引, 叫 index, 0 轴, axis= 0 列索引, 表名不同列, 纵向索引, 叫 columns, 1 轴, axis= 1 执行结果: 执行结果: 执行结果: ...
- [toc] Pandas 为什么要学习 pandas numpy 已经能够帮助我们处理数据, 能够结合 matplotlib 解决我们数据分析的问题, 那么 pandas 学习的目的在什么地方呢? numpy 能够帮助我们处理数值型数据, 但是这还不够. 很多时候, 我们的数据除了数值之外, 还有字符串, 时间序列等. 比如... [toc] Pandas 为什么要学习 pandas numpy 已经能够帮助我们处理数据, 能够结合 matplotlib 解决我们数据分析的问题, 那么 pandas 学习的目的在什么地方呢? numpy 能够帮助我们处理数值型数据, 但是这还不够. 很多时候, 我们的数据除了数值之外, 还有字符串, 时间序列等. 比如...
- [toc] 总结 在第一节的内容中, 我们都做了些什么 1. 绘制了折线图 ( plt.plot ) 2. 设置了图片的大小和分辨率 ( plt.figure ) 3. 实现了图片的保存 ( plt.savefig ) 4. 设置了 xy 轴上的刻度和字符串 ( xticks ) 5. 解决了刻度稀疏和密集... [toc] 总结 在第一节的内容中, 我们都做了些什么 1. 绘制了折线图 ( plt.plot ) 2. 设置了图片的大小和分辨率 ( plt.figure ) 3. 实现了图片的保存 ( plt.savefig ) 4. 设置了 xy 轴上的刻度和字符串 ( xticks ) 5. 解决了刻度稀疏和密集...
- [toc] Numpy 生成随机数 代码实现 执行结果: 分布的补充 均匀分布 在相同的大小范围内的出现概率是等可能的 正态分布 呈种型, 两头低,中间高, 左右对称 [toc] Numpy 生成随机数 代码实现 执行结果: 分布的补充 均匀分布 在相同的大小范围内的出现概率是等可能的 正态分布 呈种型, 两头低,中间高, 左右对称
- [toc] 练习一 假设大家在 30 岁的时候, 根据自己的实际情况, 统计出来了从 11 岁到 30 岁每年交的男 ( 女 ) 朋友数量如列表 a, 请绘制出该数据的折线图. 一遍分析自己每年交男 ( 女 ) 朋友的数量走势 a = [ 1, 0, 1, 1, 2, 4, 3, 2, 3, 4, 4, 5, 6, 5, 4, 3... [toc] 练习一 假设大家在 30 岁的时候, 根据自己的实际情况, 统计出来了从 11 岁到 30 岁每年交的男 ( 女 ) 朋友数量如列表 a, 请绘制出该数据的折线图. 一遍分析自己每年交男 ( 女 ) 朋友的数量走势 a = [ 1, 0, 1, 1, 2, 4, 3, 2, 3, 4, 4, 5, 6, 5, 4, 3...
- [toc] 思考 对于这一组电影数据, 如果我们希望统计电影分类 ( genre ) 的情况, 应该如何处理数据? 思路: 重新构造一个全为 0 的数组, 类名为分类, 如果某一条数据中分类出现过, 就让 0 变为 1. 执行结果: [toc] 思考 对于这一组电影数据, 如果我们希望统计电影分类 ( genre ) 的情况, 应该如何处理数据? 思路: 重新构造一个全为 0 的数组, 类名为分类, 如果某一条数据中分类出现过, 就让 0 变为 1. 执行结果:
- 回归算法之回归 概述sklearn.linear_model.Ridge方法属性 概述 具有 L2 正则化的线性最小二乘法. 岭回归是一种专用于共线数据分析的有便估计回归方法, 实质上是一... 回归算法之回归 概述sklearn.linear_model.Ridge方法属性 概述 具有 L2 正则化的线性最小二乘法. 岭回归是一种专用于共线数据分析的有便估计回归方法, 实质上是一...
- 【NLP】⚠️学不会打我! 半小时学会基本操作 4⚠️词向量模型 概述词向量词向量维度Word2VecCBOW 模型Skip-Gram 模型 负采样模型词向量的训练过程1. 初始化词向量矩阵2... 【NLP】⚠️学不会打我! 半小时学会基本操作 4⚠️词向量模型 概述词向量词向量维度Word2VecCBOW 模型Skip-Gram 模型 负采样模型词向量的训练过程1. 初始化词向量矩阵2...
- 基于协同过滤的推荐系统 概述用户行为数据简介用户行为分析基于物品的协同过滤算法计算物品相似度计算被推荐物品的兴趣 概述 为了让推荐结果符合用户口味, 我们需要深入了解用户和物品. 用户... 基于协同过滤的推荐系统 概述用户行为数据简介用户行为分析基于物品的协同过滤算法计算物品相似度计算被推荐物品的兴趣 概述 为了让推荐结果符合用户口味, 我们需要深入了解用户和物品. 用户...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢
2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
【仓颉社区】第36期WORKSHOP
2025/09/02 周二 15:05-16:00
华为讲师团
本期仓颉编程语言社区技术沙龙即将开启,我们特邀三位资深专家,为大家带来硬核技术分享与实践经验解析!无论你是仓颉语言的初学者,还是资深开发者,本次直播都将为你带来新的启发和收获!
回顾中 -
关于RISC-V生态发展的思考
2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中
热门标签