- 数据在为人们的生活带来了种种便利的同时,也使得大家对个人数据隐私和安全产生了担忧,这俨然已经成为世界性的问题。 近年来隐私计算技术发展迅速,它作为赋能数据流通的核心技术之一,将成为数据流通的底层基础设施,为数据流通创造条件并守护数据隐私和安全。 数据在为人们的生活带来了种种便利的同时,也使得大家对个人数据隐私和安全产生了担忧,这俨然已经成为世界性的问题。 近年来隐私计算技术发展迅速,它作为赋能数据流通的核心技术之一,将成为数据流通的底层基础设施,为数据流通创造条件并守护数据隐私和安全。
- logistic回归用户画像用户响应度预测 logistic回归用户画像用户响应度预测
- 朴素贝叶斯算法输入:样本集合D={(x_1,y_1),(x_2,y_2)~(x_m,y_m);待预测样本x;样本标记的所有可能取值{c_1,c_2,c_3~c_k};样本输入变量X的每个属性变量X^i的所有可能取值{a_i1,a_i2,~,a_iAi};输出:待预测样本x所属的类别1.计算标记为c_k的样本出现概率。2.计算标记c_k的样本,其X^i分量的属性值为a_ip的概率。3.根据上... 朴素贝叶斯算法输入:样本集合D={(x_1,y_1),(x_2,y_2)~(x_m,y_m);待预测样本x;样本标记的所有可能取值{c_1,c_2,c_3~c_k};样本输入变量X的每个属性变量X^i的所有可能取值{a_i1,a_i2,~,a_iAi};输出:待预测样本x所属的类别1.计算标记为c_k的样本出现概率。2.计算标记c_k的样本,其X^i分量的属性值为a_ip的概率。3.根据上...
- R k-means,层次聚类,EM聚类的实现 R k-means,层次聚类,EM聚类的实现
- 1 数据统计与预览library(raster)a = read.csv("film.csv", header = T) ##读入数据,不要将字符串视为factorsummary(a) ##查看数据基本情况,检查缺失情况a = n... 1 数据统计与预览library(raster)a = read.csv("film.csv", header = T) ##读入数据,不要将字符串视为factorsummary(a) ##查看数据基本情况,检查缺失情况a = n...
- 支持向量机 support vector machine 支持向量机 support vector machine
- 1 数据分类分类的过程 2 获取数据数值型数据• 病例中的各种化验数据• 空气质量监测数据描述性数据• 人事部门档案资料图片型数据• 指纹、掌纹• 自然场景图片• 很多情况下,需要将上述数据统一转换为数值型数据序列,即形成特征向量(特征提取) 3 预处理为了提高分类的准确性和有效性,需要对分类所用的数据进行预处理• 去除噪声数据• 对空缺值进行处理• 数据降维(特征选择)–(PCA、LDA... 1 数据分类分类的过程 2 获取数据数值型数据• 病例中的各种化验数据• 空气质量监测数据描述性数据• 人事部门档案资料图片型数据• 指纹、掌纹• 自然场景图片• 很多情况下,需要将上述数据统一转换为数值型数据序列,即形成特征向量(特征提取) 3 预处理为了提高分类的准确性和有效性,需要对分类所用的数据进行预处理• 去除噪声数据• 对空缺值进行处理• 数据降维(特征选择)–(PCA、LDA...
- 主成分与因子分析 主成分与因子分析
- spark中存在一个cacheManager,它的作用是什么? 缓存原理又是如何的? 以及和内存memoryStore对应的diskManager,它又是如何和内存管理做交互,实现spark很重要的落盘机制的?本文将给你进行一一讲解 spark中存在一个cacheManager,它的作用是什么? 缓存原理又是如何的? 以及和内存memoryStore对应的diskManager,它又是如何和内存管理做交互,实现spark很重要的落盘机制的?本文将给你进行一一讲解
- 我们看下spark是怎么针对master、worker、executor的异常情况做处理的。 容错机制-exeuctor退出首先可以假设worker中的executor执行任务时,发送了莫名其妙的异常或者错误,然后对应线程消失了。我们看这个时候会做什么事情上图总结下来就是:executor由backend进程包着,如果抛异常,他会感知到,并调用executorRunner.exitStatu... 我们看下spark是怎么针对master、worker、executor的异常情况做处理的。 容错机制-exeuctor退出首先可以假设worker中的executor执行任务时,发送了莫名其妙的异常或者错误,然后对应线程消失了。我们看这个时候会做什么事情上图总结下来就是:executor由backend进程包着,如果抛异常,他会感知到,并调用executorRunner.exitStatu...
- 简单工厂Q: 简单工厂模式是什么?A:简单工厂模式不是23种设计模式里的一种,简而言之,就是有一个专门生产某个产品的类。比如下图中的鼠标工厂,专业生产鼠标,给参数0,生产戴尔鼠标,给参数1,生产惠普鼠标。注意这个参数, 我必须根据入参去确定返回factory.create(int type)Q: 简单工厂模式的缺点是什么?A:当我试图新增一种类型, 我就得在create里新增case-w... 简单工厂Q: 简单工厂模式是什么?A:简单工厂模式不是23种设计模式里的一种,简而言之,就是有一个专门生产某个产品的类。比如下图中的鼠标工厂,专业生产鼠标,给参数0,生产戴尔鼠标,给参数1,生产惠普鼠标。注意这个参数, 我必须根据入参去确定返回factory.create(int type)Q: 简单工厂模式的缺点是什么?A:当我试图新增一种类型, 我就得在create里新增case-w...
- presto计算引擎作为一个纯内存计算引擎,是如何保证计算过程不会发生作业内存溢出的?本篇文章会进行深入的学习和分析 presto计算引擎作为一个纯内存计算引擎,是如何保证计算过程不会发生作业内存溢出的?本篇文章会进行深入的学习和分析
- 联邦多方计算场景,一方对于另一方的运行中数据是无法感知的, 通过MPC算法或者TEE安全硬件, 可以保证数据计算过程中的安全性。 但是当计算完成后,得到的结果中却包含了潜在的安全风险。 针对这种问题, 华为云tics服务联合德国慕尼黑可信技术实验室, 推出了基于多方sql作业的差分隐私算法应用, 对于大规模的聚合类计算,可以实现对内部个体的数据保护。 联邦多方计算场景,一方对于另一方的运行中数据是无法感知的, 通过MPC算法或者TEE安全硬件, 可以保证数据计算过程中的安全性。 但是当计算完成后,得到的结果中却包含了潜在的安全风险。 针对这种问题, 华为云tics服务联合德国慕尼黑可信技术实验室, 推出了基于多方sql作业的差分隐私算法应用, 对于大规模的聚合类计算,可以实现对内部个体的数据保护。
- 简介Kafka的API有Producer API,Consumer API还有自定义Interceptor (自定义拦截器),以及处理的流使用的Streams API和构建连接器的Kafka Connect API。 Producer APIKafka的Producer发送消息采用的是异步发送的方式。在消息发送过程中,涉及两个线程:main线程和Sender线程,以及一个线程共享变量Rec... 简介Kafka的API有Producer API,Consumer API还有自定义Interceptor (自定义拦截器),以及处理的流使用的Streams API和构建连接器的Kafka Connect API。 Producer APIKafka的Producer发送消息采用的是异步发送的方式。在消息发送过程中,涉及两个线程:main线程和Sender线程,以及一个线程共享变量Rec...
- 说明这四个方法都和缓存有关,所以写在一块。 JavaPairRDD的cache方法讲解 官方文档说明Persist this RDD with the default storage level (MEMORY_ONLY). 中文含义cache就是在内存中缓存数据,其实也是使用的persist。使用非序列化的方式将RDD的数据全部尝试持久化到内存中,cache()只是一个transform... 说明这四个方法都和缓存有关,所以写在一块。 JavaPairRDD的cache方法讲解 官方文档说明Persist this RDD with the default storage level (MEMORY_ONLY). 中文含义cache就是在内存中缓存数据,其实也是使用的persist。使用非序列化的方式将RDD的数据全部尝试持久化到内存中,cache()只是一个transform...
上滑加载中
推荐直播
-
GaussDB管理平台TPOPS,DBA高效运维的一站式解决方案
2024/12/24 周二 16:30-18:00
Leo 华为云数据库DTSE技术布道师
数据库的复杂运维,是否让你感到头疼不已?今天,华为云GaussDB管理平台将彻底来改观!本期直播,我们将深入探索GaussDB管理平台的TPOPS功能,带你感受一键式部署安装的便捷,和智能化运维管理的高效,让复杂的运维、管理变得简单,让简单变得可靠。
回顾中 -
走进数据库:数据库基础知识精讲
2024/12/27 周五 16:00-17:30
Steven 华为云学堂技术讲师
数据管理是数据库的核心任务,本期直播将带领大家一起走进数据库,了解期发展趋势、基础模型、架构演进及相关的技术特点。同时还会介绍数据库对象和相关概念,帮助开发者对数据库使用和实践夯实基础。
去报名
热门标签