大数据_标签_开发者_华为云

博客(3.2k)
视频(24)
论坛(0)
云声(0)
代码示例(0)

客快物流大数据项目（九十）：ClickHouse的引擎介绍和深入日志引擎讲解
ClickHouse的引擎介绍和深入日志引擎讲解一、引擎介绍ClickHouse提供了多种不同的表引擎，表引擎可以简单理解为不同类型的表。表引擎（即表的类型）决定了：数据的存储方式和位置，写到哪里以及从哪里读取数据支持哪些查询以及如何支持并发数据访问索引的使用（如果存在）是否可以执行多线程请求数据复制参数下面介绍其中几种，对其他引擎有兴趣的可以去查阅官方文档：https://clickhou...

Lansonli
发表于2022-12-22 13:53:31
5423 0 0

5.4k 0 0

ClickHouse的引擎介绍和深入日志引擎讲解一、引擎介绍ClickHouse提供了多种不同的表引擎，表引擎可以简单理解为不同类型的表。表引擎（即表的类型）决定了：数据的存储方式和位置，写到哪里以及从哪里读取数据支持哪些查询以及如何支持并发数据访问索引的使用（如果存在）是否可以执行多线程请求数据复制参数下面介绍其中几种，对其他引擎有兴趣的可以去查阅官方文档：https://clickhou...
大数据智慧物流
客快物流大数据项目（八十九）：ClickHouse的数据类型支持
ClickHouse的数据类型支持ClickHouse与常用的关系型数据库MySQL或Oracle的数据类型类似，提供了丰富的数据类型支持。一、整型ClickHouse支持Int和Uint两种固定长度的整型，Int类型是符号整型，Uint类型是无符号整型。分类数据类型取值范围整型Int8-128 ~ 127Int16-32768 ~ 32767Int32-2147483648 ~ 21474...

Lansonli
发表于2022-12-22 13:52:09
6012 0 0

6.0k 0 0

ClickHouse的数据类型支持ClickHouse与常用的关系型数据库MySQL或Oracle的数据类型类似，提供了丰富的数据类型支持。一、整型ClickHouse支持Int和Uint两种固定长度的整型，Int类型是符号整型，Uint类型是无符号整型。分类数据类型取值范围整型Int8-128 ~ 127Int16-32768 ~ 32767Int32-2147483648 ~ 21474...
大数据数据结构智慧物流
客快物流大数据项目（八十六）：ClickHouse的深入了解
ClickHouse的深入了解一、介绍ClickHouse是俄罗斯的Yandex于2016年开源的面向OLAP列式数据库管理系统（DBMS）ClickHouse采用 C++ 语言开发，以卓越的查询性能著称，在基准测试中超过了目前很多主流的列式数据库ClickHouse集群的每台服务器每秒能处理数亿到十亿多行和数十千兆字节的数据ClickHouse会充分利用所有可用的硬件，以尽可能快地处理每个...

Lansonli
发表于2022-12-21 10:01:17
7122 0 0

7.1k 0 0

ClickHouse的深入了解一、介绍ClickHouse是俄罗斯的Yandex于2016年开源的面向OLAP列式数据库管理系统（DBMS）ClickHouse采用 C++ 语言开发，以卓越的查询性能著称，在基准测试中超过了目前很多主流的列式数据库ClickHouse集群的每台服务器每秒能处理数亿到十亿多行和数十千兆字节的数据ClickHouse会充分利用所有可用的硬件，以尽可能快地处理每个...
大数据智慧物流
大数据Kudu（九）：Spark操作Kudu
Spark操作Kudu一、添加Maven依赖使用SparkSQL操作Kudu，这里需要导入Kudu与SparkSQL整合的包和SparkSQL的包，在Maven中导入如下依赖：<dependency> <groupId>org.apache.kudu</groupId> <artifactId>kudu-sp...

Lansonli
发表于2022-12-21 09:59:53
5685 0 0

5.6k 0 0

Spark操作Kudu一、添加Maven依赖使用SparkSQL操作Kudu，这里需要导入Kudu与SparkSQL整合的包和SparkSQL的包，在Maven中导入如下依赖：<dependency> <groupId>org.apache.kudu</groupId> <artifactId>kudu-sp...
spark 大数据
大数据Kudu（八）：Kudu与Impala整合
Kudu与Impala整合Impala是cloudera提供的一款高效率的sql查询工具，使用内存进行计算提供实时的SQL查询,impala强依赖于Hive 的MetaStore，直接使用hive的元数据，意味着impala元数据都存储在hive的MetaStore当中，并且impala兼容hive的绝大多数sql语法,具有实时，批处理，多并发等优点。Kudu不支持标准SQL操作，可以将K...

Lansonli
发表于2022-12-21 09:58:34
2902 0 0

2.9k 0 0

Kudu与Impala整合Impala是cloudera提供的一款高效率的sql查询工具，使用内存进行计算提供实时的SQL查询,impala强依赖于Hive 的MetaStore，直接使用hive的元数据，意味着impala元数据都存储在hive的MetaStore当中，并且impala兼容hive的绝大多数sql语法,具有实时，批处理，多并发等优点。Kudu不支持标准SQL操作，可以将K...
SQL 大数据
客快物流大数据项目（七十二）：Impala sql 语法
Impala sql 语法一、数据库特定语言1、创建数据库CREATE DATABASE语句用于在Impala中创建新数据库。CREATE DATABASE IF NOT EXISTS database_name;这里，IF NOT EXISTS是一个可选的子句。如果我们使用此子句，则只有在没有具有相同名称的现有数据库时，才会创建具有给定名称的数据库。impala默认使用impala用户执...

Lansonli
发表于2022-12-19 12:02:42
6082 0 0

6.0k 0 0

Impala sql 语法一、数据库特定语言1、创建数据库CREATE DATABASE语句用于在Impala中创建新数据库。CREATE DATABASE IF NOT EXISTS database_name;这里，IF NOT EXISTS是一个可选的子句。如果我们使用此子句，则只有在没有具有相同名称的现有数据库时，才会创建具有给定名称的数据库。impala默认使用impala用户执...
SQL 大数据智慧物流
客快物流大数据项目（七十）：Impala入门介绍
Impala入门介绍一、impala基本介绍impala是cloudera提供的一款高效率的sql查询工具，提供实时的查询效果，官方测试性能比hive快10到100倍，其sql查询比sparkSQL还要更加快速，号称是当前大数据领域最快的查询sql工具，impala是参照谷歌的新三篇论文（Caffeine--网络搜索引擎、Pregel--分布式图计算、Dremel--交互式分析工具）当中的...

Lansonli
发表于2022-12-19 11:59:05
6868 0 0

6.8k 0 0

Impala入门介绍一、impala基本介绍impala是cloudera提供的一款高效率的sql查询工具，提供实时的查询效果，官方测试性能比hive快10到100倍，其sql查询比sparkSQL还要更加快速，号称是当前大数据领域最快的查询sql工具，impala是参照谷歌的新三篇论文（Caffeine--网络搜索引擎、Pregel--分布式图计算、Dremel--交互式分析工具）当中的...
Hive 大数据智慧物流
大数据面试题（四）：Yarn核心高频面试题
Yarn核心高频面试题一、简述Hadoop1与Hadoop2的架构异同加入了yarn解决了资源调度的问题。加入了对zookeeper的支持实现比较可靠的高可用。二、为什么会产生yarn，它解决了什么问题，有什么优势？Yarn最主要的功能就是解决运行的用户程序与yarn框架完全解耦。Yarn上可以运行各种类型的分布式运算程序（mapreduce只是其中的一种），比如mapreduce、stor...

Lansonli
发表于2022-12-14 14:03:29
6790 1 0

6.7k 1 0

Yarn核心高频面试题一、简述Hadoop1与Hadoop2的架构异同加入了yarn解决了资源调度的问题。加入了对zookeeper的支持实现比较可靠的高可用。二、为什么会产生yarn，它解决了什么问题，有什么优势？Yarn最主要的功能就是解决运行的用户程序与yarn框架完全解耦。Yarn上可以运行各种类型的分布式运算程序（mapreduce只是其中的一种），比如mapreduce、stor...
Hadoop Yarn 大数据
大数据面试题（一）：HDFS核心高频面试题
HDFS核心高频面试题一、HDFS的存储机制（读写流程）HDFS存储机制，包括HDFS的写入过程和读取过程两个部分1）客户端向namenode请求上传文件，namenode检查目标文件是否已存在，父目录是否存在。2）namenode返回是否可以上传。3）客户端请求第一个 block上传到哪几个datanode服务器上。4）namenode返回3个datanode节点，分别为dn1、dn2、d...

Lansonli
发表于2022-12-14 13:59:38
4917 0 0

4.9k 0 0

HDFS核心高频面试题一、HDFS的存储机制（读写流程）HDFS存储机制，包括HDFS的写入过程和读取过程两个部分1）客户端向namenode请求上传文件，namenode检查目标文件是否已存在，父目录是否存在。2）namenode返回是否可以上传。3）客户端请求第一个 block上传到哪几个datanode服务器上。4）namenode返回3个datanode节点，分别为dn1、dn2、d...
Hadoop Node.js 大数据
大数据面试题（一）：HDFS核心高频面试题
HDFS核心高频面试题一、HDFS的存储机制（读写流程）HDFS存储机制，包括HDFS的写入过程和读取过程两个部分1）客户端向namenode请求上传文件，namenode检查目标文件是否已存在，父目录是否存在。2）namenode返回是否可以上传。3）客户端请求第一个 block上传到哪几个datanode服务器上。4）namenode返回3个datanode节点，分别为dn1、dn2...

Lansonli
发表于2022-12-12 21:38:10
5726 1 0

5.7k 1 0

HDFS核心高频面试题一、HDFS的存储机制（读写流程）HDFS存储机制，包括HDFS的写入过程和读取过程两个部分1）客户端向namenode请求上传文件，namenode检查目标文件是否已存在，父目录是否存在。2）namenode返回是否可以上传。3）客户端请求第一个 block上传到哪几个datanode服务器上。4）namenode返回3个datanode节点，分别为dn1、dn2...
Hadoop Node.js 大数据
10.PGL图学习之图神经网络ERNIESage、UniMP进阶模型[系列八]
为了实现可扩展的，健壮的和可重现的图学习研究，提出了Open Graph Benchmark (OGB)——具有规模大、领域广、任务类别多样化的现实图数据集。在特定于应用程序的使用案例的驱动下，对给定的数据集采用了实际的数据分割方法。通过广泛的基准实验，强调OGB数据集对于图学习模型在现实的数据分割方案下处理大规模图并进行准确的预测提出了重大挑战。总而言之，OGB为未来的研究提供了丰富的机会，以推

汀丶
发表于2022-11-26 09:44:45
4779 0 0

4.7k 0 0

为了实现可扩展的，健壮的和可重现的图学习研究，提出了Open Graph Benchmark (OGB)——具有规模大、领域广、任务类别多样化的现实图数据集。在特定于应用程序的使用案例的驱动下，对给定的数据集采用了实际的数据分割方法。通过广泛的基准实验，强调OGB数据集对于图学习模型在现实的数据分割方案下处理大规模图并进行准确的预测提出了重大挑战。总而言之，OGB为未来的研究提供了丰富的机会，以推
大数据机器学习深度学习知识图谱神经网络
大数据Presto（四）：Presto自定义函数和JDBC连接
Presto自定义函数和JDBC连接一、Presto 自定义函数我们可以登录Presto客户端，使用命令：show functions 来查询对应的内置函数。我们也可以自己定义函数，自定义的函数包含UDF和UDAF函数。1、UDF函数自定义UDF函数及使用可以按照下面步骤来实现。1.1、创建Maven项目，加入如下依赖<dependency> <groupI...

Lansonli
发表于2022-11-26 04:54:39
6536 0 0

6.5k 0 0

Presto自定义函数和JDBC连接一、Presto 自定义函数我们可以登录Presto客户端，使用命令：show functions 来查询对应的内置函数。我们也可以自己定义函数，自定义的函数包含UDF和UDAF函数。1、UDF函数自定义UDF函数及使用可以按照下面步骤来实现。1.1、创建Maven项目，加入如下依赖<dependency> <groupI...
JDBC 大数据
PGL图学习之图神经网络GraphSAGE、GIN图采样算法[系列七]
PGL图学习之图神经网络GraphSAGE、GIN图采样算法[系列七]

汀丶
发表于2022-11-25 11:07:44
7460 0 0

7.4k 0 0

PGL图学习之图神经网络GraphSAGE、GIN图采样算法[系列七]
大数据机器学习深度学习知识图谱神经网络
PGL图学习之图游走类metapath2vec模型[系列五]
介绍了异质图，利用pgl对metapath2vec、metapath2vec 进行了实现，并给出了多个框架版本的demo满足个性化需求 metapath2vec是一种用于异构网络中表示学习的算法框架，其中包含多种类型的节点和链接。给定异构图，metapath2vec 算法首先生成基于元路径的随机游走，然后使用 skipgram 模型训练语言模型。基于 PGL重现了 metapath2vec 算法

汀丶
发表于2022-11-23 10:20:08
4533 0 0

4.5k 0 0

介绍了异质图，利用pgl对metapath2vec、metapath2vec 进行了实现，并给出了多个框架版本的demo满足个性化需求 metapath2vec是一种用于异构网络中表示学习的算法框架，其中包含多种类型的节点和链接。给定异构图，metapath2vec 算法首先生成基于元路径的随机游走，然后使用 skipgram 模型训练语言模型。基于 PGL重现了 metapath2vec 算法
大数据机器学习深度学习知识图谱神经网络
Paddle Graph Learning (PGL)图学习之图游走类模型[系列四]
6.Paddle Graph Learning (PGL)图学习之图游走类模型[系列四]

汀丶
发表于2022-11-22 10:26:26
3903 0 0

3.9k 0 0

6.Paddle Graph Learning (PGL)图学习之图游走类模型[系列四]
大数据机器学习深度学习知识图谱神经网络

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript