- 层次聚类(Hierarchical Clustering)是一种常用的聚类算法,它的主要思想是通过计算样本之间的相似性或距离,将样本逐步合并形成一棵层次化的聚类树。层次聚类算法可以分为两种类型:凝聚型(Agglomerative)和分裂型(Divisive)。 凝聚型层次聚类是从每个样本作为一个独立的聚类开始,然后通过合并相似的聚类逐渐形成更大的聚类,直到最终只剩下一个聚类或者达到预设的聚类... 层次聚类(Hierarchical Clustering)是一种常用的聚类算法,它的主要思想是通过计算样本之间的相似性或距离,将样本逐步合并形成一棵层次化的聚类树。层次聚类算法可以分为两种类型:凝聚型(Agglomerative)和分裂型(Divisive)。 凝聚型层次聚类是从每个样本作为一个独立的聚类开始,然后通过合并相似的聚类逐渐形成更大的聚类,直到最终只剩下一个聚类或者达到预设的聚类...
- 清华大学地球系统科学系宫鹏等基于研究组2011年以来在全球30米地表覆盖制图中获得的经验和在样本库建设方面的积累,结合10米分辨率Sentinel-2全球影像的完整存储和免费获取,开发出了世界首套30米分辨率的全球地表覆盖产品—FROM-GLC30(清华大学全球首套30米分辨率地表覆盖图称为Finer Resolution Observation and Monitoring of Gl... 清华大学地球系统科学系宫鹏等基于研究组2011年以来在全球30米地表覆盖制图中获得的经验和在样本库建设方面的积累,结合10米分辨率Sentinel-2全球影像的完整存储和免费获取,开发出了世界首套30米分辨率的全球地表覆盖产品—FROM-GLC30(清华大学全球首套30米分辨率地表覆盖图称为Finer Resolution Observation and Monitoring of Gl...
- 中国500m分辨率生态环境质量年度合成产品(CHEQ_V2)采用了多源遥感影像(MODIS和夜间灯光数据DMSP/OLS),改进了基于像素的模型,生成了覆盖中国区域的年度生态环境质量数据,空间分辨率为500m,时间分辨率为年,由北京师范大学、南方科技大学和北京大学联合开发。验证结果表明,CHEQ产品与中国生态环境部提供的环境指数(EI)高度一致;CHEQ产品填补了国内生态环境监测领域的研... 中国500m分辨率生态环境质量年度合成产品(CHEQ_V2)采用了多源遥感影像(MODIS和夜间灯光数据DMSP/OLS),改进了基于像素的模型,生成了覆盖中国区域的年度生态环境质量数据,空间分辨率为500m,时间分辨率为年,由北京师范大学、南方科技大学和北京大学联合开发。验证结果表明,CHEQ产品与中国生态环境部提供的环境指数(EI)高度一致;CHEQ产品填补了国内生态环境监测领域的研...
- LandScan全球人口分布数据来自于East View Cartographic,由美国能源部橡树岭国家实验室(ORNL)开发。LandScan运用GIS和遥感等创新方法,是全球人口数据发布的社会标准,是全球最为准确、可靠,基于地理位置的,具有分布模型和最佳分辨率的全球人口动态统计分析数据。Landscan全球人口分布数据集提供了2000年至2017年的全球人口统计数据,空间分辨率接近... LandScan全球人口分布数据来自于East View Cartographic,由美国能源部橡树岭国家实验室(ORNL)开发。LandScan运用GIS和遥感等创新方法,是全球人口数据发布的社会标准,是全球最为准确、可靠,基于地理位置的,具有分布模型和最佳分辨率的全球人口动态统计分析数据。Landscan全球人口分布数据集提供了2000年至2017年的全球人口统计数据,空间分辨率接近...
- OCR文字检测与识别系统:融合文字检测、文字识别和方向分类器的综合解决方案 OCR文字检测与识别系统:融合文字检测、文字识别和方向分类器的综合解决方案
- 自主学习算法中的变分自编码器(Variational Autoencoders,简称VAE)是一种用于生成模型的概率图模型方法。它可以通过学习潜在空间中的分布来生成新的数据样本,同时也可以用于数据压缩和特征提取。 VAE是基于自编码器(Autoencoder)的一种改进和扩展。自编码器是一种无监督学习算法,通过将输入数据编码成低维表示,再将其解码重构为原始数据,从而学习数据的压缩表示和重要特... 自主学习算法中的变分自编码器(Variational Autoencoders,简称VAE)是一种用于生成模型的概率图模型方法。它可以通过学习潜在空间中的分布来生成新的数据样本,同时也可以用于数据压缩和特征提取。 VAE是基于自编码器(Autoencoder)的一种改进和扩展。自编码器是一种无监督学习算法,通过将输入数据编码成低维表示,再将其解码重构为原始数据,从而学习数据的压缩表示和重要特...
- 中国站点尺度天然径流量估算数据集,包括全国多个水文站1961–2018年月值天然径流量(数据将继续更新),数据为ASCII格式。该数据是基于VIC(The Variable Infiltration Capacity)分布式水文模型,结合参数不确定分析、流向校正和统计后处理等数据质量方法重建的,是中国长时序、高质量与时间连续的天然河川径流资料。研究中涉及到的全国水文站分别约有83%和56%... 中国站点尺度天然径流量估算数据集,包括全国多个水文站1961–2018年月值天然径流量(数据将继续更新),数据为ASCII格式。该数据是基于VIC(The Variable Infiltration Capacity)分布式水文模型,结合参数不确定分析、流向校正和统计后处理等数据质量方法重建的,是中国长时序、高质量与时间连续的天然河川径流资料。研究中涉及到的全国水文站分别约有83%和56%...
- 迁移学习是一种机器学习技术,用于在训练数据和测试数据之间存在分布差异的情况下进行模型训练和预测。算法中的领域自适应(Domain Adaptation)是迁移学习中的一种方法,用于解决源领域和目标领域之间存在分布差异的问题。 在传统的机器学习中,通常假设训练数据和测试数据是从同一分布中独立同分布采样而来的。然而,在现实生活中,很多情况下源领域和目标领域之间的分布差异是不可避免的。例如,训练一... 迁移学习是一种机器学习技术,用于在训练数据和测试数据之间存在分布差异的情况下进行模型训练和预测。算法中的领域自适应(Domain Adaptation)是迁移学习中的一种方法,用于解决源领域和目标领域之间存在分布差异的问题。 在传统的机器学习中,通常假设训练数据和测试数据是从同一分布中独立同分布采样而来的。然而,在现实生活中,很多情况下源领域和目标领域之间的分布差异是不可避免的。例如,训练一...
- 自训练(Self-training)是半监督学习算法中的一种方法。在半监督学习中,我们通常有一个带有标签的小型数据集和一个未标记的大型数据集。自训练算法通过使用已经标记的数据来训练一个初始模型,然后使用这个模型来对未标记的数据进行预测。根据预测结果,将置信度较高的样本添加到已标记的数据集中,然后使用这个更新后的标记数据集来重新训练模型。这个过程不断迭代,直到达到停止条件。 具体来说,自训练算... 自训练(Self-training)是半监督学习算法中的一种方法。在半监督学习中,我们通常有一个带有标签的小型数据集和一个未标记的大型数据集。自训练算法通过使用已经标记的数据来训练一个初始模型,然后使用这个模型来对未标记的数据进行预测。根据预测结果,将置信度较高的样本添加到已标记的数据集中,然后使用这个更新后的标记数据集来重新训练模型。这个过程不断迭代,直到达到停止条件。 具体来说,自训练算...
- 缺乏长期一致的大尺度观测水文数据集给中国水文气候研究带来了很大的不确定性。本文描述了0-25年中国每天0.25°×05.1°的陆地水文数据集(VIC-CN1961.2017)。该数据集由最新的可变入渗能力(VIC)模型模拟,并由纯站大气强迫和基于野外调查的高分辨率土壤参数驱动。使用多个观测(原位和遥感)产品和五个统计指标,包括偏差、相对误差(RE)、均方根误差(RMSE)、... 缺乏长期一致的大尺度观测水文数据集给中国水文气候研究带来了很大的不确定性。本文描述了0-25年中国每天0.25°×05.1°的陆地水文数据集(VIC-CN1961.2017)。该数据集由最新的可变入渗能力(VIC)模型模拟,并由纯站大气强迫和基于野外调查的高分辨率土壤参数驱动。使用多个观测(原位和遥感)产品和五个统计指标,包括偏差、相对误差(RE)、均方根误差(RMSE)、...
- 🤵♂️ 个人主页: @AI_magician📡主页地址: 作者简介:CSDN内容合伙人,全栈领域优质创作者。👨💻景愿:旨在于能和更多的热爱计算机的伙伴一起成长!!🐱🏍🙋♂️声明:本人目前大学就读于大二,研究兴趣方向人工智能&硬件(虽然硬件还没开始玩,但一直很感兴趣!希望大佬带带)该文章收录专栏[✨— 《深入解析机器学习:从原理到应用的全面指南》 —✨] 梯度爆炸与消失... 🤵♂️ 个人主页: @AI_magician📡主页地址: 作者简介:CSDN内容合伙人,全栈领域优质创作者。👨💻景愿:旨在于能和更多的热爱计算机的伙伴一起成长!!🐱🏍🙋♂️声明:本人目前大学就读于大二,研究兴趣方向人工智能&硬件(虽然硬件还没开始玩,但一直很感兴趣!希望大佬带带)该文章收录专栏[✨— 《深入解析机器学习:从原理到应用的全面指南》 —✨] 梯度爆炸与消失...
- SARSA是一种强化学习算法,用于处理序贯决策问题。它是基于状态-动作-奖励-下一个状态-下一个动作(State-Action-Reward-State-Action)的模式进行学习和决策的。 在SARSA算法中,智能体通过与环境进行交互来学习最优策略。智能体在每个时间步骤中观察当前状态,并根据当前策略选择一个动作执行。执行动作后,智能体会得到一个奖励信号以及下一个状态。然后,智能体会使用当... SARSA是一种强化学习算法,用于处理序贯决策问题。它是基于状态-动作-奖励-下一个状态-下一个动作(State-Action-Reward-State-Action)的模式进行学习和决策的。 在SARSA算法中,智能体通过与环境进行交互来学习最优策略。智能体在每个时间步骤中观察当前状态,并根据当前策略选择一个动作执行。执行动作后,智能体会得到一个奖励信号以及下一个状态。然后,智能体会使用当...
- 强化学习是一种机器学习方法,用于训练智能体在与环境交互的过程中学习最佳行动策略。Q-learning是强化学习中的一种基于值函数的算法,用于解决马尔科夫决策问题。 Q-learning的核心思想是通过学习一个状态-动作值函数(Q函数),来指导智能体在环境中选择最佳的行动。Q函数表示在特定状态下采取特定动作所获得的预期累积奖励。通过迭代的方式,智能体不断更新Q函数的估计值,以使其逼近真实的Q函... 强化学习是一种机器学习方法,用于训练智能体在与环境交互的过程中学习最佳行动策略。Q-learning是强化学习中的一种基于值函数的算法,用于解决马尔科夫决策问题。 Q-learning的核心思想是通过学习一个状态-动作值函数(Q函数),来指导智能体在环境中选择最佳的行动。Q函数表示在特定状态下采取特定动作所获得的预期累积奖励。通过迭代的方式,智能体不断更新Q函数的估计值,以使其逼近真实的Q函...
- 关联规则学习(Association Rule Learning)是无监督学习算法中的一种方法,用于发现数据集中的项集之间的关联关系。它是数据挖掘中常用的技术,可以帮助我们发现数据中的隐藏模式和规律。 关联规则学习的目标是找出数据中的频繁项集和关联规则。频繁项集是指在数据集中经常同时出现的一组项,而关联规则则是描述这些项之间的关联关系。关联规则通常采用"IF-THEN"的形式来表示,其中IF... 关联规则学习(Association Rule Learning)是无监督学习算法中的一种方法,用于发现数据集中的项集之间的关联关系。它是数据挖掘中常用的技术,可以帮助我们发现数据中的隐藏模式和规律。 关联规则学习的目标是找出数据中的频繁项集和关联规则。频繁项集是指在数据集中经常同时出现的一组项,而关联规则则是描述这些项之间的关联关系。关联规则通常采用"IF-THEN"的形式来表示,其中IF...
- 高斯混合模型(Gaussian Mixture Models,简称GMM)是一种无监督学习算法,用于对数据进行聚类或概率密度估计。它基于高斯分布的组合来建模数据的分布。 GMM假设数据是由多个高斯分布组合而成的,每个高斯分布表示一个独立的聚类簇。每个数据点都属于其中一个聚类簇,并且聚类簇的分配是未知的。GMM的目标是通过最大化似然函数来估计每个数据点属于每个聚类簇的概率以及聚类簇的参数。 在... 高斯混合模型(Gaussian Mixture Models,简称GMM)是一种无监督学习算法,用于对数据进行聚类或概率密度估计。它基于高斯分布的组合来建模数据的分布。 GMM假设数据是由多个高斯分布组合而成的,每个高斯分布表示一个独立的聚类簇。每个数据点都属于其中一个聚类簇,并且聚类簇的分配是未知的。GMM的目标是通过最大化似然函数来估计每个数据点属于每个聚类簇的概率以及聚类簇的参数。 在...
上滑加载中
推荐直播
-
仓颉编程语言开源创新人才培养经验分享
2025/08/06 周三 19:00-20:00
张引 -华为开发者布道师-高校教师
热情而富有活力的仓颉社区为学生的学习提供了一个充满机遇和挑战的平台。本次直播探讨如何运用社区的力量帮助同学们变身为开源开发者,从而完成从学生到工程师身份的转变。
回顾中 -
“全域洞察·智控未来” ——云资源监控实战
2025/08/08 周五 15:00-16:00
星璇 华为云监控产品经理,霄图 华为云监控体验设计师,云枢 华为云可观测产品经理
本期直播深度解析全栈监控技术实践,揭秘华为云、头部企业如何通过智能监控实现业务零中断,分享高可用系统背后的“鹰眼系统”。即刻预约,解锁数字化转型的运维密码!
即将直播
热门标签