Apache Kudu在网易的实践
相关推荐
-
高效大数据时间序列存储的架构设计
闻数起舞2021-02-14 12:08:20 在论证了大规模运行Druid的挑战之后,我想提出我对下一代开源时间序列存储的看法,这应该不会出现Druid固有的问题. "开源"是问 ...
-
kudu 的基本架构与存储结构
kudu 的基本架构与存储结构 1. 基本架构 TMaster and TServer TMaster 主要用来管理元数据,即tablet 和 表的基本信息,监听TServer的状态,TMaster之 ...
-
kudu介绍
文章内容来源于官网文档: http://kudu.apache.org/docs/index.html 一.kudu介绍 Kudu是Cloudera开源的新型列式存储系统,是Apache Hadoop ...
-
Hudi原理 | 在Apache Hudi中为快速更删配置合适的索引原创
英文原文:https://hudi.apache.org/blog/hudi-indexing-mechanisms/ Apache Hudi使用索引来定位更删操作所在的文件组.对于Copy-On-W ...
-
hive的insert语句列顺序问题以及新增字段遇到的坑
讲问题之前,先简单创建一个表: CREATE TABLE IF NOT EXISTS `my.test_table`( `col1` int COMMENT "第一列", `col ...
-
在规模上使用Apache Kafka的20个最佳实践
Apache Kafka是一种广受欢迎的分布式流媒体平台,New Relic,Uber和Square等数千家公司使用它来构建可扩展,高吞吐量,可靠的实时流媒体系统.例如,New Relic的生产Kaf ...
-
Impala 3.4在网易的最新实践
编辑整理:甘顺 出品平台:DataFunTalk 导读:Impala是Cloudera公司主导开发的交互式查询系统,它提供SQL语义和计算能力,但是本身并不存储数据.本次分享会聚焦于Impala在网易 ...
-
网易传媒数据指标体系建设实践
网易传媒数据指标体系建设实践
-
全链路数据治理在网易严选的实践
正文开始 数据治理(Data Governance)的边界非常的宽泛,通常会把数据的定义.存储方式.使用规范.数据安全策略.数据质量等等都包括在其中.治理是一个很官僚化的术语,流程.评审.审计.规范这 ...
-
Apache Kylin的实践与优化
总第423篇 2020年 第47篇 从2016年开始,美团到店餐饮技术团队就开始使用Apache Kylin作为OLAP引擎,但是随着业务的高速发展,在构建和查询层面都出现了效率问题.于是,技术团队从 ...
-
Apache Doris在京东广告的应用实践
文章作者:杨文波 京东 研发工程师 内容来源:DorisDB 导读:本文主要介绍Apache Doris在京东广告报表查询场景下的应用.文章将从我们原有系统开始讲述,包括我们遇到的问题,面临的挑战,以 ...
-
徐怀书的经方实践
徐怀书的经方实践
-
组织活力建设:PRE 活力模型的构建与应用实践
方向只能大致正确,组织要确保活力,这远比很多企业家功成名就了总结出来的战略思想靠谱的多. T&D 在多年第四方深度诊断与经营质量变革项目中的经验提炼总结的组织活力模型-PRE 活力模型给更多的 ...
-
微服务实践之分布式定时任务
承接上篇:上篇文章讲到改造 go-zero 生成的 app module 中的 gateway & RPC .本篇讲讲如何接入 异步任务 以及 log的使用. Delay Job 日常任务开放 ...
