维表与事实表_Lidisam的博客-CSDN博客_事实表 维表


本站和网页 https://blog.csdn.net/qq_28666081/article/details/104686822 的作者无关,不对其内容负责。快照谨为网络故障时之索引,不代表被搜索网站的即时页面。

维表与事实表_Lidisam的博客-CSDN博客_事实表 维表
维表与事实表
Lidisam
于 2020-03-05 23:12:15 发布
10166
收藏
43
分类专栏:
架构服务
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_28666081/article/details/104686822
版权
架构服务
专栏收录该内容
54 篇文章
2 订阅
订阅专栏
BI平台分为事实表、维表,然后两种表聚合成一个宽表。(注意这里取的BI平台是Davinci:https://edp963.github.io/davinci/)
其维表、事实表的关系图如下:
一个维表会对应多个事实表,而维表和事实表所有关联起来就形成一个宽表,其关系如同mysql中的外键索引,如A表中有B_id,A作为维表,B作为事实表,A(维表)可通过B_id来关联B(事实表),然后关联汇总生成的SQL就是宽表。
BI系统中可根据事实表和维度表的关系,应遵循如下两种模型的规范:星型模型和雪花型模型。
星型表:反范式,数据冗余,查询效率高。
遵循范式:数据不冗余,但引用层级深,维护复杂,查询效率较低。
下面举一个星型模型(体验课上课预约记录)的例子来说明如下:
上图以user_table_course_schedule的部分字段(user_id、table_course_schedule_id、teacher_id、gmt_create)来作为维度,并分别关联到了userinfo、tablec_course_schedule、teacherinfo这三张事实表,然后形成一张宽表。
以上面星型模型的例子,对其进行修改,举一个雪花模型例子来说明如下:
上面雪花模型中,学生信息事实表的orderId还继续关联了下一个层级体验课记录表,体验课报名记录表还可能会继续往下关联,对于复杂的系统而言,一般会采用雪花模型,关键层级会较多,而星型模型的关联过于单一,层级不够深,无法支持这种操作。
理解了上面两种模型的设计,接下来需要确定维度和指标的用法:
维度与指标的规范:
维度:维度用于关联事实表,也可用于做冗余显示(如gmt_create),用于数据检索,所以对于维度设计时,可将其进行分类(看业务扩展需要):
时间维:将时间进行维度细分,如gmt_create划分为年维度、月维度、日维度。
地域维:将地域划分为省维度、市维度、区维度。反例:把省市区 只作为一个维度,而没有拆分,后面进行筛选就不方便。
 其他维度按业务进行扩招
指标:用于统计(如总和、平均数、最大值、最小值)、排序等。
Lidisam
关注
关注
11
点赞
43
收藏
打赏
评论
维表与事实表
BI平台分为事实表、维表,然后两种表聚合成一个宽表。(注意这里取的BI平台是Davinci:https://edp963.github.io/davinci/)其维表、事实表的关系图如下:一个维表会对应多个事实表,而维表和事实表所有关联起来就形成一个宽表,其关系如同mysql中的外键索引,如A表中有B_id,A作为维表,B作为事实表,A(维表)可通过B_id来关联B...
复制链接
扫一扫
专栏目录
维表和事实表介绍
04-05
事实表是数据库中最大的表,是星形模型结构的核心。事实表包含了基本商业事务的详细信息,是对商务活动进行客户关系、销售趋势和产品趋势等分析的素材。事实表的设计包括对事实的选择、量度的构造、粒度的设计和聚合的设计等。
数据仓库(二)之维度建模篇
雾岛与鲸的博客
09-25
324
概述
维度建模是一种将数据结构化的逻辑设计方法,它将客观世界划分为度量和上下文。度量是常常是以数值形式出现,事实周围有上下文包围着,这种上下文被直观地分成独立的逻辑块,称之为维度。它与实体-关系建模有很大的区别,实体-关系建模是面向应用,遵循第三范式,以消除数据冗余为目标的设计技术。维度建模是面向分析,为了提高查询性能可以增加数据冗余,反规范化的设计技术。
维度建模优点
事实表
事实表存储了从业务活动或事件提炼出来的性能度量,它主要包含维度表的外键和连续变化的可加性数值或半可加事实。事实表产生于业务过程
参与评论
您还未登录,请先
登录
后发表或查看评论
什么是Dimension table(维表)
热门推荐
lindan1984的专栏
07-20
2万+
什么是Dimension table(维表)
Dimension Table概念多出现于数据仓库里面,维表与事实表想对应,比如一个 “销售统计表” 就是一个 事实表,而 “销售统计表” 里面统计数据的来源离不开 “商品价格表”,“商品价格表” 就是销售统计的一个维度表。事实数据和维度数据的识别必须依据具体的主题问题而定。“事实表” 用来存储事实的度量及指向各个维的外键值。维表用来保存该维的元数据...
数据库建模—维度建模
最新发布
lbs567的博客
10-16
154
上篇文章介绍了er模型,本次接着往下介绍维度数据模型,两者都是数据库建模的重要基础,分别适用于不同的场景。由于本人是边学习边发文,经验不足之处还请见谅,错误之处欢迎指教。通俗来说,就是按照业务流程需求,将一个业务看作一个事实,事实所处的环境称为维度。如一个下单流程中的付款业务也看作为一个事实,其付款时间,付款人,付款商品则可以看作维度。因此,其包括事实和维度两个部分。因此在构建表时,先确定事实表,再确定维度表,一个维度表可以被多个事实表对应,以减少数据冗余。
维表(Dimension Table)与事实表的区别
干勾鱼的CSDN博客
03-20
1万+
转载请注明出处:https://yuhaidong.blog.csdn.net/article/details/104992257
本文出自【我是干勾鱼的博客】
维表(Dimension Table,也称维度表):是对数据进行分析时所用的一个量。
事实表:是数据聚合后依据某个维度生成的结果表,是具体的统计表。
维表与与事实表的概念更多使用在数据仓库中,两者相互对应。一个经典的例子在销售领域,如...
事实表(基础表)、维表、大宽表概念
qq_42844410的博客
11-16
3030
以下几个概念取自SQL Server联机丛书。
星型架构
一种关系数据库结构,该结构中在位于架构中心的单个事实数据表中维护数据,其它维度数据存储在维度表中。每个维度表与事实数据表直接相关,且通常通过一个键列联接到事实数据表。星型架构用在数据仓库中。
事实数据表
数据仓库架构中的中央表,它包含联系事实与维度表的数字度量值和键。事实数据表包含描述业务(如银行事务或产品销售)内特定事件的数据。
维度表
数据仓库中的表,其条目描述事实数据表中的数据。维度表包含创建维度所基于的数据。
再举个实际的例子。银行对存款记账
维度表,实体表,事实表之间的关系
SunWuKong_Hadoop的博客
03-14
1472
看了这个让我们顿悟:
维度表:维度表可以看成是用户用来分析一个事实的窗口,它里面的数据应该是对事实的各个方面描述,比如时间维度表,它里面的数据就是一些日,周,月,季,年,日期等数据,维度表只能是事实表的一个分析角度。
实体表:实体表就是一个实际对象的表,实体表它放的数据一定是一条条客观存在的事物数据,比如说设备 ,它就是客观存在的,所以可以将其设计一个实体表。
...
事实表与维度表
chbxw
08-26
4939
文章目录前言一、事实表1.2、事实表的特征1.3、事实表的类型1.3.1、交易事实表1.3.2、快照事实表1.3.3、积累事实表1.4、它如何在数据仓库中工作?1.5、事实表的优点二、维度表2.1、维度表类型2.1.1、SCD(缓慢变化维)2.1.2、一致维度2.1.3、垃圾维度2.1.4、退化维度2.1.5、角色扮演维度2.2、它在数据仓库中是如何工作的?2.3、维度表的好处三、维度表 vs 事实表3.1、事实表和维表之间的主要区别3.2、对比项关注我的公众号【宝哥大数据】,更多干货
前言
事实表包含系统
Blink SQL之创建数据维表
胜利的曙光的博客
04-01
2885
Blink SQL只创建数据关联维表。
事实表和维度表(重点)
weixin_44870066的博客
04-07
1167
1.事实表
事实表中的每行数据代表一个业务事件(下单、支付、退款、评价等)。“事实”这个术语表示的是业务事件的度量值(可统计次数、个数、件数、金额等),例如,订单事件中的下单金额。
每一个事实表的行包括:具有可加性的数值型的度量值、与维表相连接的外键、通常具有两个和两个以上的外键、外键之间表示维表之间多对多的关系。
每个数据仓库都包含一个或者多个事实数据表,事实表是对分析主题的度量,它包含了与各维度表相关联的外键,并通过连接(Join)方式与维度表关联。
事实表的度量通常是数值类型,且记录数会不断增加,表规
数据仓库 - 事实表与维度表的概念和关系
hanne_lovegood的博客
07-21
870
2021/7/21 周三
刚开始系统地接触数据仓库,关于事实表与维度表的概念和关系,找了CSDN和博客园很多文章,都讲得太抽象、术语多,越看越懵,一直在想它们的从属关系或对应关系。反而知乎上的一篇让我豁然开朗:
事实表与维度表
最后我的理解是:
事实表记录了具体业务产生的一些数据,而维度表就是相当于 给事实表里重复值比较多的字段 做个目录,在事实表里就可以只用代码来表示。
如果需要,可以给事实表里的很多个字段都做维表,一个维表也可能在多张事实表里都用到了。所以没有什么从属关系,关系应该算多对多吧。
...
数据仓库之维度表和事实表
不言尘世
05-30
8353
1 维度表
维度表:一般是对事实的 描述信息。每一张维表对应现实世界中的一个对象或者概念。
例如:用户、商品、日期、地区等。
维表的特征:
 维表的范围很宽(具有多个属性、列比较多)
 跟事实表相比,行数相对较小:通常< 10 万条
 内容相对固定:编码表
时间维度表:
2 事实表
事实表中的 每行数据代表一个业务事件(下单、支付、退款、评价等)。“事实”这
个术语表示的是业务事件的 度量值(可统计次数、个数、件数、金额等),例如,订单事
件中的下单金额。
每一个事实表的行包括:具有可加性
数仓(六):数据建模之维度建模: 事实表&维度表设计
06-21
6330
维度设计基本方法
1、设计步骤:
1)第一步:选择维度或新建维度。
作为维度建模的核心,在企业级数据仓库中必须保证维度的唯一性。以淘宝商品维度为例,有且只允许有一个维度定义。
2)第二步:确定主维表。
此处的主维表一般是 ODS 表,直接与业务系统同步。以淘宝商品维度为例,s_auction_ auctions是与前台商品中心系统同步的商品表,此表即是主维表。
3)第三步:确定相关维表。
数据仓库是业务源系统的数据整合,不同业务系统或者同一业务系统中的表之间存在关联性。根据对业务的梳理,确定哪些表和主维
维度表、事实表、宽表
kevin1993best的博客
07-24
9368
一、维度表:数据仓库中的表,其条目描述事实数据表中的数据。维度表包含创建维度所基于的数据。
二、事实表:也叫事实数据表,就是app埋点日志,主要特点是含有大量的数据,并且这些数据是可以汇总,并被记录的。
每个数据仓库都包含一个或者多个事实数据表。
事实数据表可能包含业务销售数据,如现金登记事务所产生的数据,
事实数据表通常包含大量的行。事实数据表的主要特点是包含数字数据(事实),并且这些数字信息可以汇总,以提供有关单位作为历史的数据。
每个事实数据表包含一个由多个部分组成的索引,该索引包含作为外键
事实表和维表关系
06-19
701
本篇文章是根据自己的实战,参考网上一些文章写的,可能有相通的话语,请原谅,若有写的不对的地方,希望指正。
以人才监测项目为例:人才+企业=人才项目,目前项目需求中个人隶属于一个公司,同一个人才项目可同时申报市级别的、省级别的或...
【数据仓库】|4 维度建模之事实表设计
nidongla的博客
06-01
369
事实表是维度建模的核心,紧紧围绕着业务过程来设计,通过描述度量来表达业务过程,包含了维度的引用和业务度量值。
上一篇文章我们讲了《维度表的设计》,今天我们聊一下事实表的设计。一样,我们的目录结构和内容参考了《阿里巴巴大数据之路》一书。
事实表的基础优惠券网 https://m.fenfaw.net/
概念
粒度
事实表中的每一条记录所表达的业务细节程度被称为粒度。
粒度由两种方式表述:
维度属性组合所表示的细节程度
所表示的具体业务含义
事实
用来描述业务过程的度量,一般是整形、...
“相关推荐”对你有帮助么?
非常没帮助
没帮助
一般
有帮助
非常有帮助
提交
©️2022 CSDN
皮肤主题:编程工作室
设计师:CSDN官方博客
返回首页
Lidisam
CSDN认证博客专家
CSDN认证企业博客
码龄8年
暂无认证
228
原创
2万+
周排名
2万+
总排名
82万+
访问
等级
8244
积分
415
粉丝
997
获赞
172
评论
1195
收藏
私信
关注
热门文章
IDEA查看Java源码技巧
71861
laravel各种路径的获取方法
43500
秒杀系统设计思路笔记
41613
用JS写个简单的抢课脚本
38414
微信公众号开发--获取网页授权并自定义菜单点击获得openid跳转
34875
分类专栏
高性能MySQL
11篇
设计模式
9篇
JAVA
123篇
Linux
25篇
mysql
13篇
HTML
7篇
Laravel
15篇
PHP
46篇
Javascript
15篇
工具
14篇
C语言
4篇
爬虫
5篇
Android
2篇
设计模式
15篇
微信
2篇
大数据
5篇
生活
2篇
协议
4篇
NIO
1篇
Go
架构服务
54篇
算法
2篇
最新评论
Xxl-Job调度器原理解析
Java就是搞对象:
qiang ,深入浅出,注释清晰,学习了!
TransmittableThreadLocal原理解析
liuhui_306:
博主流程图用什么画的呢?
Retry注解源码解析
Lidisam:
15年的文章有前端
Retry注解源码解析
贪睡的小聪:
能不能放点前端的
秒杀系统设计思路笔记
Lidisam:
这跟小猪啥的没关系。首先这个是极客时间上的,我只是汇总做笔记,文中最后一行也声明了独自:极客时间。其次这是18年的文章,那时候不知道有没小猪求职
您愿意向朋友推荐“博客详情页”吗?
强烈不推荐
不推荐
一般般
推荐
强烈推荐
提交
最新文章
RocketMQ存储层原理
FastThreadLocal源码解析
Tomcat长轮训原理解析
2022年6篇
2021年38篇
2020年17篇
2019年53篇
2018年63篇
2017年27篇
2016年48篇
2015年29篇
目录
目录
分类专栏
高性能MySQL
11篇
设计模式
9篇
JAVA
123篇
Linux
25篇
mysql
13篇
HTML
7篇
Laravel
15篇
PHP
46篇
Javascript
15篇
工具
14篇
C语言
4篇
爬虫
5篇
Android
2篇
设计模式
15篇
微信
2篇
大数据
5篇
生活
2篇
协议
4篇
NIO
1篇
Go
架构服务
54篇
算法
2篇
目录
评论
被折叠的 条评论
为什么被折叠?
到【灌水乐园】发言
查看更多评论
打赏作者
Lidisam
你的鼓励将是我创作的最大动力
¥2
¥4
¥6
¥10
¥20
输入1-500的整数
余额支付
(余额:-- )
扫码支付
扫码支付:¥2
获取中
扫码支付
您的余额不足,请更换扫码支付或充值
打赏作者
实付元
使用余额支付
点击重新获取
扫码支付
钱包余额
抵扣说明:
1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。 2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。
余额充值