【尚硅谷】大数据Apache Doris教程(基于实际开发环境安装部署配置)

作者: 尚硅谷分类: 计算机技术 发布时间: 2022-05-05 14:55:00 浏览:138174 次

【尚硅谷】大数据Apache Doris教程(基于实际开发环境安装部署配置)

柚子单杀无状态:
已学完,阿帕奇·杜蕾斯真的是个非常厉害的技术

就是不救塞尔达:
🚗……尚硅谷🏃……尚硅谷🧎没有你我怎么活~

【回复】回复 @你老爹12138 :看直播就可以
才不要跟憨批说话呢:
尚硅谷,让天下没有学得完的技术[大哭][大哭]

小推叔:
我补充下1.1和1.2的新特性,和0.15比,简直是两doris。 2022年7月: ● 在 1.1 版本中,实现了计算层和存储层的全面向量化、正式将向量化执行引擎作为稳定功能进行全面启用; ● 增加了直接访问 Apache Iceberg 外部表的能力,支持对 Doris 和 Iceberg 中的数据进行联邦查询; ● 在原有的 LZ4 基础上增加了 ZSTD 压缩算法,进一步提升了数据压缩率; ● 修复了诸多之前版本存在的性能与稳定性问题,使系统稳定性得到大幅提升。 ● 也支持二进制文件压缩包直接安装,不用再用docker编译了。 2022年12月7日: ● 在 1.2 版本中,实现了全面的向量化(包括数据导入、Schema Change、Compaction、数据导出、UDF 等); ● 在 Unique Key 模型上实现了 Merge-on-Write 的数据更新模式; ● 增加了 Multi-Catalog 多源数据目录、提供了无缝接入 Hive、ES、Hudi、Iceberg 等外部数据源的能力; ● 引入了Light Schema Change 轻量表结构变更:支持对列进行重命名。 ● 实现毫秒级的Schema Change 操作并可以借助 Flink CDC 自动同步上游数据库的 DML 和 DDL 操作; ● 以 JDBC外部表替换了过去的 ODBC 外部表; ● 支持了Java UDF 和 Romote UDF 以及 Array 数组类型和 JSONB 类型; ● 支持TVF(表函数),将HDFS的路径当做一张表来from。 ● 支持通过 FROM TO 命令创建一个时间范围内的多个分区。 ● 支持行级权限:可以通过 CREATE ROW POLICY 命令创建行级权限。 ● 导入更新:CSV 导入支持带 header 的 CSV 文件;Spark Load 支持 Parquet 和 ORC 文件导入;Broker Load 新增支持阿里云 OSS,腾讯 CHDFS 、华为云 OBS和 百度云 BOS 、AFS ● 支持:SELECT * EXCEPT ● DELETE 语句支持 IN 谓词条件。并且支持分区裁剪。 ● 添加两张系统表:backends、rowsets ● 持自动同步 Hive Metastore 元数据信息

夏娜是我的老婆:
已经学完,现在是美团派送服务的最高执行官[doge]

书忆江南:
Doris深入原理源码讲解[脱单doge]:https://www.bilibili.com/video/BV1Wb4y1Y7wG

EXneverbur:
公司刚因为报表查询太慢所以搭了个这玩意,特来学习

既是来迟_也是错过:
免费全面,爱分享的教育机构,必须三连,必须投币!!!

旌城子衿:
可惜版本太低了,现在都1.1.3了,讲座中的是0.15

少龙008:
请问一下大佬们,Apache Doris 能否替代impala。目前公司数据量每个小时1TB的样子,这种数据能放到Doris里面来查询吗?查询效率怎么样?有没有比impala快?

2Amor_:
https://dist.apache.org/repos/dist/release/doris/0.15.0-incubating/apache-doris-0.15.0-incubating-src.tar.gz

Apache Doris OLAP分析 apache doris 大数据 Spark Doris Flink

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!