- 一般情况将K折交叉验证用于模型调优,找到使得模型泛化性能最优的超参值。找到后,在全部训练集上重新训练模型,并使用独立测试集对模型性能做出最终评价。 K折交叉验证使用了无重复抽样技术的好处:每次迭代过程中每个样本点只有一次被划入训练集或测试集的机会。 K折交叉验证图: 如果训练数据集相对较小,则增大k值。 增大k值,在每次迭代过程中将会有更多的数据用于模型训练,能够... 一般情况将K折交叉验证用于模型调优,找到使得模型泛化性能最优的超参值。找到后,在全部训练集上重新训练模型,并使用独立测试集对模型性能做出最终评价。 K折交叉验证使用了无重复抽样技术的好处:每次迭代过程中每个样本点只有一次被划入训练集或测试集的机会。 K折交叉验证图: 如果训练数据集相对较小,则增大k值。 增大k值,在每次迭代过程中将会有更多的数据用于模型训练,能够...
- 机器学习是人工智能AI研究发展到一定阶段的必然产物! 二十世纪五十年代~七十年代初,“推理期”:机器的只能体现在具有逻辑推理能力。 二十世纪七十年代中期开始,AI进入“知识期”,希望机器能够自己学习! 其实,图灵1950年就曾提到过机器学习的可能 五十年代中后期,基于神经网络的“连接主义”学习开始,比如:感知机 六七十年代,基于逻辑表示的“ ”符号主义学习发展, ... 机器学习是人工智能AI研究发展到一定阶段的必然产物! 二十世纪五十年代~七十年代初,“推理期”:机器的只能体现在具有逻辑推理能力。 二十世纪七十年代中期开始,AI进入“知识期”,希望机器能够自己学习! 其实,图灵1950年就曾提到过机器学习的可能 五十年代中后期,基于神经网络的“连接主义”学习开始,比如:感知机 六七十年代,基于逻辑表示的“ ”符号主义学习发展, ...
- 目录 0. Normalization简单解释 1. 常用的归一化方法 (1)线性函数归一化(Min-Max Scaling) (2)零均值归一化(Z-Score Normalization) 2. 为什么说数据归一化不是万能的?有哪些 适用哪些不适用? 0. Normalization简单解释 为了消除数据特征之间的量纲的影响,所以需要进行归一化的处理,... 目录 0. Normalization简单解释 1. 常用的归一化方法 (1)线性函数归一化(Min-Max Scaling) (2)零均值归一化(Z-Score Normalization) 2. 为什么说数据归一化不是万能的?有哪些 适用哪些不适用? 0. Normalization简单解释 为了消除数据特征之间的量纲的影响,所以需要进行归一化的处理,...
- 目录 1. 实际案例: 2. 回顾基本知识: 精确率Precision 召回率Recall 排序问题中,如何衡量模型性能? 精确率和召回率是既矛盾又统一的两个指标 3. 解答实例问题 如何解决或者权衡? P-R曲线 F1 score 是精确率和召回率的调和平均值 1. 实际案例: 搜索引擎提供模糊搜索功能,搜索排序模型返回的TOP 5 精确率非常... 目录 1. 实际案例: 2. 回顾基本知识: 精确率Precision 召回率Recall 排序问题中,如何衡量模型性能? 精确率和召回率是既矛盾又统一的两个指标 3. 解答实例问题 如何解决或者权衡? P-R曲线 F1 score 是精确率和召回率的调和平均值 1. 实际案例: 搜索引擎提供模糊搜索功能,搜索排序模型返回的TOP 5 精确率非常...
- 机器学习基本概念 1. 特征工程1.1 特征工程的目的1.2 怎么做特征工程?1.2.1 特征构建1.2.2 特征提取1.2.2.1特征提取常用方法 1.2.3 特征选择1.2.3.1 特征选择常用方法 2. 结构化数据3. 非结构化数据 1. 特征工程 特征工程师对原始数据进行一系列的工程处理,作为输入供算法和模型使用。 举例:想让机器识别... 机器学习基本概念 1. 特征工程1.1 特征工程的目的1.2 怎么做特征工程?1.2.1 特征构建1.2.2 特征提取1.2.2.1特征提取常用方法 1.2.3 特征选择1.2.3.1 特征选择常用方法 2. 结构化数据3. 非结构化数据 1. 特征工程 特征工程师对原始数据进行一系列的工程处理,作为输入供算法和模型使用。 举例:想让机器识别...
- 目录 回顾知识点: 实际场景: 1. 什么是分类的准确率? 2. 如何避免由于样本比例不均衡导致准确率失效? 回顾知识点: 准确率 : Accuracy 精确率 : Precision 召回率 : Recall 均方根误差 : Root Mean Square Error, RMSE 实际场景: 拿到奢侈品用户数据,训练和测试奢侈品用... 目录 回顾知识点: 实际场景: 1. 什么是分类的准确率? 2. 如何避免由于样本比例不均衡导致准确率失效? 回顾知识点: 准确率 : Accuracy 精确率 : Precision 召回率 : Recall 均方根误差 : Root Mean Square Error, RMSE 实际场景: 拿到奢侈品用户数据,训练和测试奢侈品用...
- 集成学习(ensemble learning)可以说是现在非常火爆的机器学习方法了。它本身不是一个单独的机器学习算法,而是通过构建并结合多个机器学习器来完成学习任务。也就是我们常说的“博采众长”。集成学习可以用于分类问题集成,回归问题集成,特征选取集成,异常点检测集成等等,可以说所有的机器学习领域都可以看到集成学习的身影。本文就对集成学习的原理做一个总结。 1. 集成学习概... 集成学习(ensemble learning)可以说是现在非常火爆的机器学习方法了。它本身不是一个单独的机器学习算法,而是通过构建并结合多个机器学习器来完成学习任务。也就是我们常说的“博采众长”。集成学习可以用于分类问题集成,回归问题集成,特征选取集成,异常点检测集成等等,可以说所有的机器学习领域都可以看到集成学习的身影。本文就对集成学习的原理做一个总结。 1. 集成学习概...
- 目录 1. 模型可以提供什么? 2. 先验信息可以用在哪里? 3. 图像分类训练数据不足带来的问题? 4. 如何解决图像分类训练数据不足? 5. 图像分类任务中,在保持图像类别不变的前提下,可以对训练集中的每幅图像进行哪些变换? 6. 如何训练自己的模型?迁移学习 1. 模型可以提供什么? 训练数据中所蕴含的信息模型构造学习推理过程中,人们提供的先验... 目录 1. 模型可以提供什么? 2. 先验信息可以用在哪里? 3. 图像分类训练数据不足带来的问题? 4. 如何解决图像分类训练数据不足? 5. 图像分类任务中,在保持图像类别不变的前提下,可以对训练集中的每幅图像进行哪些变换? 6. 如何训练自己的模型?迁移学习 1. 模型可以提供什么? 训练数据中所蕴含的信息模型构造学习推理过程中,人们提供的先验...
- By 超神经 场景描述:要问什么水果和夏天最搭,答案一定是西瓜。作为西瓜生产与消费大国,中国在 2018 年以全世界 20% 的人口消耗掉全世界 70% 的西瓜,人均 100 斤。如何挑选最甜的瓜,也成了「吃瓜群众」十分关心的问题。一位浙江大学的博士,用机器学习的方法判断西瓜的成熟度,十分接地气。 关键词:西瓜 声学特征检测 机器学习 ... By 超神经 场景描述:要问什么水果和夏天最搭,答案一定是西瓜。作为西瓜生产与消费大国,中国在 2018 年以全世界 20% 的人口消耗掉全世界 70% 的西瓜,人均 100 斤。如何挑选最甜的瓜,也成了「吃瓜群众」十分关心的问题。一位浙江大学的博士,用机器学习的方法判断西瓜的成熟度,十分接地气。 关键词:西瓜 声学特征检测 机器学习 ...
- Geoffrey Hinton等6位图灵奖得主亲临,百余位顶级学者邀请你加入群聊「2020北京智源大会」,深入系统探讨「人工智能的下一个十年」。 自2009年深度学习崛起以来,第三波人工智能浪潮席卷全球,推动了新一波技术革命。 在这波澜壮阔的11年,我们见证了技术突破、应用创新与产业变革。 技术上,深度学习首先带来计算机视觉、语音识别等领域的突破,让机器识别的... Geoffrey Hinton等6位图灵奖得主亲临,百余位顶级学者邀请你加入群聊「2020北京智源大会」,深入系统探讨「人工智能的下一个十年」。 自2009年深度学习崛起以来,第三波人工智能浪潮席卷全球,推动了新一波技术革命。 在这波澜壮阔的11年,我们见证了技术突破、应用创新与产业变革。 技术上,深度学习首先带来计算机视觉、语音识别等领域的突破,让机器识别的...
- Numpy 和 scikit-learn 都是python常用的第三方库。numpy库可以用来存储和处理大型矩阵,并且在一定程度上弥补了python在运算效率上的不足,正是因为numpy的存在使得python成为数值计算领域的一大利器;sklearn是python著名的机器学习库,它其中封装了大量的机器学习算法,内置了大量的公开数据集,并且拥有完善的文档,因此成... Numpy 和 scikit-learn 都是python常用的第三方库。numpy库可以用来存储和处理大型矩阵,并且在一定程度上弥补了python在运算效率上的不足,正是因为numpy的存在使得python成为数值计算领域的一大利器;sklearn是python著名的机器学习库,它其中封装了大量的机器学习算法,内置了大量的公开数据集,并且拥有完善的文档,因此成...
- 今天强烈推荐一些互联网行业内优质技术公众号,互联网人大部分都关注了,在工作、生活节奏超快的今天,想要不断提升自我,利用碎片化阅读学习是你最佳选择,这些号在行业里深耕已久,会给你带来事半功倍的效果,非诚勿扰,扫码关注。 01 Python爬虫人工智能大数据 公众号由一位零基础转行Python的Python全栈工程师创办,文章以... 今天强烈推荐一些互联网行业内优质技术公众号,互联网人大部分都关注了,在工作、生活节奏超快的今天,想要不断提升自我,利用碎片化阅读学习是你最佳选择,这些号在行业里深耕已久,会给你带来事半功倍的效果,非诚勿扰,扫码关注。 01 Python爬虫人工智能大数据 公众号由一位零基础转行Python的Python全栈工程师创办,文章以...
- 介绍一位腻害的朋友 Python爬虫人工智能大数据 这是我一位非常要好的朋友 他目前从事Python全栈开发 在爬虫 web 数据分析 机器学习 web/app自动化测试 前端 UI设计等 均有摸过 均有丰富的项目经验 他的故事非常令人鼓舞 本科是化工专业 毕业后 卖保险 卖房子 进化工厂 去越南打工 ... 介绍一位腻害的朋友 Python爬虫人工智能大数据 这是我一位非常要好的朋友 他目前从事Python全栈开发 在爬虫 web 数据分析 机器学习 web/app自动化测试 前端 UI设计等 均有摸过 均有丰富的项目经验 他的故事非常令人鼓舞 本科是化工专业 毕业后 卖保险 卖房子 进化工厂 去越南打工 ...
- Python 是一个很棒的语言。它是世界上发展最快的编程语言之一。它一次又一次地证明了在开发人员职位中和跨行业的数据科学职位中的实用性。整个 Python 及其库的生态系统使它成为全世界用户(初学者和高级用户)的合适选择。它的成功和流行的原因之一是它强大的第三方库的集合,这些库使它可以保持活力和高效。 在本文中,我们会研究一些用于数据科学任务的 Python 库,... Python 是一个很棒的语言。它是世界上发展最快的编程语言之一。它一次又一次地证明了在开发人员职位中和跨行业的数据科学职位中的实用性。整个 Python 及其库的生态系统使它成为全世界用户(初学者和高级用户)的合适选择。它的成功和流行的原因之一是它强大的第三方库的集合,这些库使它可以保持活力和高效。 在本文中,我们会研究一些用于数据科学任务的 Python 库,...
- 内容简介 1 《Python之路40篇实战 .pdf》包含Python篇、数据分析篇、机器学习篇等 3 大模块,目录如下: 下载方式 2 关注公众号「Python与算法社区」,后台回复一个数字「1」, 即可下载最新版的《Python之路40篇 .pdf》。 长按二维码关注 公号内容 3 Python 篇 Python ... 内容简介 1 《Python之路40篇实战 .pdf》包含Python篇、数据分析篇、机器学习篇等 3 大模块,目录如下: 下载方式 2 关注公众号「Python与算法社区」,后台回复一个数字「1」, 即可下载最新版的《Python之路40篇 .pdf》。 长按二维码关注 公号内容 3 Python 篇 Python ...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签