当前位置:网站首页>数仓基本概述
数仓基本概述
2022-07-20 05:31:00 【艾斯xi】
数据仓库(data warehouse ,DW)
定义
数仓是面向主题的集成的非易失的且随时间变化的数据集合。
主要用于组织积累的历史数据,并使用分析方法(OLAP,数据分析) 进行分析整理,进而辅助决策,为管理者,企业提供数据支持,构建商业智能。
特点
1 面向主题: 根据主题将原始数据集合在一起。
2 集成 原始数据源不用,需要经过ETL转化(清洗, 统一标准 )
3 非易失 : 不允许被修改,只允许查询、分析
4 时变性:数仓 会定期接受。集成新的数据, 从而反映数据的最新变化。
数仓 vs 数据库
数据库面向事物设计,属于OLTP系统,主要操作随机读写,在设计时避免冗余,常采用复合范式规范来设计 ;
数仓是面向主题设计的, 属于OLAP,主要操作批量读写,关注数据整合,以及分析处理性能,会有意引入冗余,采用反范式方式设计;
边栏推荐
- [dish of learning notes dog learning C] evaluation expression
- 【学习笔记之菜Dog学C】初识常见关键字、#define定义常量和宏
- 使用 poi 导入导出
- 试题 B: 顺子日期
- [sort] bucket sort and cardinal sort
- Oracle sorted by Chinese
- Comparative study of SIGIR '22 recommendation system papers
- TypeScript
- C语言函数作业
- [dish of learning notes dog learning C] initial level of pointer
猜你喜欢
随机推荐
文件编辑器vim的使用和介绍
node 查询目标 目录下所有(文件或文件夹)名为 filename 的文件路径
Mknod command: creating device files
【学习笔记之菜Dog学C】结构体初阶
【学习笔记之菜Dog学C】初识常见关键字、#define定义常量和宏
如何使用 IDEA 打 jar 包
【学习笔记之菜Dog学C】求值表达式
Parameters and calls of the [learning notes dish dog learning C] function
Niuke bm6 judges whether there is a ring in the linked list
ModuleNotFoundError: No module named ‘PyEMD‘ 解决方法
DOM -- operation document tree and its cases
【C】 C语言入门
分别用递归和非递归的方式实现二叉树先序、中序和后序遍历
【学习笔记之菜Dog学C】循环语句
[dish of learning notes dog learning C] evaluation expression
[dish of learning notes, dog learning C] minesweeping game
JDBC 学习笔记
手写Promise
ECMAScript新特性
[dish of learning notes dog learning C] initial level of structure