【尚硅谷】大数据Apache Doris教程(基于实际开发环境安装部署配置)
柚子单杀无状态:
已学完,阿帕奇·杜蕾斯真的是个非常厉害的技术
就是不救塞尔达:
🚗……尚硅谷🏃……尚硅谷🧎没有你我怎么活~
【回复】回复 @你老爹12138 :看直播就可以
才不要跟憨批说话呢:
尚硅谷,让天下没有学得完的技术[大哭][大哭]
小推叔:
我补充下1.1和1.2的新特性,和0.15比,简直是两doris。
2022年7月:
● 在 1.1 版本中,实现了计算层和存储层的全面向量化、正式将向量化执行引擎作为稳定功能进行全面启用;
● 增加了直接访问 Apache Iceberg 外部表的能力,支持对 Doris 和 Iceberg 中的数据进行联邦查询;
● 在原有的 LZ4 基础上增加了 ZSTD 压缩算法,进一步提升了数据压缩率;
● 修复了诸多之前版本存在的性能与稳定性问题,使系统稳定性得到大幅提升。
● 也支持二进制文件压缩包直接安装,不用再用docker编译了。
2022年12月7日:
● 在 1.2 版本中,实现了全面的向量化(包括数据导入、Schema Change、Compaction、数据导出、UDF 等);
● 在 Unique Key 模型上实现了 Merge-on-Write 的数据更新模式;
● 增加了 Multi-Catalog 多源数据目录、提供了无缝接入 Hive、ES、Hudi、Iceberg 等外部数据源的能力;
● 引入了Light Schema Change 轻量表结构变更:支持对列进行重命名。
● 实现毫秒级的Schema Change 操作并可以借助 Flink CDC 自动同步上游数据库的 DML 和 DDL 操作;
● 以 JDBC外部表替换了过去的 ODBC 外部表;
● 支持了Java UDF 和 Romote UDF 以及 Array 数组类型和 JSONB 类型;
● 支持TVF(表函数),将HDFS的路径当做一张表来from。
● 支持通过 FROM TO 命令创建一个时间范围内的多个分区。
● 支持行级权限:可以通过 CREATE ROW POLICY 命令创建行级权限。
● 导入更新:CSV 导入支持带 header 的 CSV 文件;Spark Load 支持 Parquet 和 ORC 文件导入;Broker Load 新增支持阿里云 OSS,腾讯 CHDFS 、华为云 OBS和 百度云 BOS 、AFS
● 支持:SELECT * EXCEPT
● DELETE 语句支持 IN 谓词条件。并且支持分区裁剪。
● 添加两张系统表:backends、rowsets
● 持自动同步 Hive Metastore 元数据信息
夏娜是我的老婆:
已经学完,现在是美团派送服务的最高执行官[doge]
书忆江南:
Doris深入原理源码讲解[脱单doge]:https://www.bilibili.com/video/BV1Wb4y1Y7wG
EXneverbur:
公司刚因为报表查询太慢所以搭了个这玩意,特来学习
既是来迟_也是错过:
免费全面,爱分享的教育机构,必须三连,必须投币!!!
旌城子衿:
可惜版本太低了,现在都1.1.3了,讲座中的是0.15
少龙008:
请问一下大佬们,Apache Doris 能否替代impala。目前公司数据量每个小时1TB的样子,这种数据能放到Doris里面来查询吗?查询效率怎么样?有没有比impala快?
2Amor_:
https://dist.apache.org/repos/dist/release/doris/0.15.0-incubating/apache-doris-0.15.0-incubating-src.tar.gz