什么是星型模式? 的优点和缺点
什么是星型模式?
星型模式由 Ralph Kimball 于 1996 年提出,是一种多维数据建模技术。 这是企业使用的最简单的模式类型 数据仓库.
根据其名称,星型模式在可视化时就像一颗星。 它的中间有一个事实表,并附有许多维度表。 这种简单的非规范化结构使得查询数据非常高效。

具有事实表和维度表的星型模式
星型模式结构:事实表和维度表
事实表
事实表或事实实体充当星型模式的核心。 典型的事实表包含表示业务事件、事务或测量的定量数据或度量。 这些事实通常是数值,例如销售收入、利润或销售数量。
我们可以在下面看到事实表的示例。 它包含可衡量的事实,例如销售单位的价格和销售税。
| 日期 | 商店位置 | 产品类型 | 数量 | 单价 | 销售额 | 库存 | 营业税 |
| 8/4/2023 | CA | 尼龙 | 5 | 100 | 500 | 30 | 7.75% |
| 8/4/2023 | CA | 聚酯纤维 | 7 | 250 | 1750 | 50 | 7.75% |
| 8/4/2023 | PA | 尼龙 | 6 | 100 | 600 | 65 | 6.00% |
尺寸表
维度表是辅助表,为事实表中的数据提供上下文和描述性属性。 它们帮助回答与业务事件相关的“谁”、“什么”、“何时”、“何地”和“如何”等问题。 维度表保存分类数据,例如客户名称、产品类别、时间段和地理位置。
示例:下面的两个维度表提供了上面事实表中产品信息的详细信息。
| 日期维度 | ||
| 日期键 | 日期 | 天 |
| 10201 | 8/4/2023 | 星期六 |
| 10202 | 8/4/2023 | 星期六 |
日期维度表
| 店铺规模 | |||
| 存储密钥 | 商店名称 | 城市 | 州 |
| 151 | AngAngie'sparel Angie'sparel | 洛杉矶 | 加州 |
| 152 | AngAngie'sparel Angie'sparel | 匹兹堡 | 宾夕法尼亚 |
店铺维度表
使用星型模式的优点
-
简化查询: 星型模式易于理解和实现。 它们的非规范化结构减少了检索数据所需的联接数量。 这简化并导致更快的数据聚合和报告。
- 更快的性能: 降低的连接复杂性以及事实表和维度表的高效索引增强了数据检索。 这对于需要快速获取见解的决策者来说尤其重要。
- 直观分析: 星型模式可实现直观、直接的数据分析。 用户可以轻松理解维度之间的关系和层次结构。
- 强大的支持: 星型模式提供对 OLAP 结构的支持,例如数据立方体——用于改进数据分析的多维数组。
使用星型模式的缺点
- 缺乏诚信: 非规范化会导致数据冗余。 维度属性通常在维度表中的多个记录中重复,这可能会导致数据质量问题。 由于数据在非规范化中会重复,因此频繁的更改也会导致某些表显示过时的信息。
- 增加成本: 添加冗余数据会增加计算和存储成本。 在处理大型数据集时,这尤其令人不安。
- 灵活性有限: 星型模式的稳健性相对规范化结构而言较差,因为它们是针对特定用例构建的。 其他方法对于涉及多个联接的复杂查询可能更有效。
- 维修难点: 随着数据随着时间的推移而变化,维护星型模式可能变得具有挑战性。 对维度属性的更新可能需要在多个位置进行更改。
何时使用星型模式
在以下情况下,这种维度建模技术是最佳选择:
- 用户对所需数据有清晰的了解。 例如:各州销售的产品数量。
- 数据是结构化和定量的,具有一些分类属性。
- 他们希望快速、轻松地获取数据,而不需要创建多个联接。 查询性能是重中之重。
- 数据冗余不会成为问题。
想要更高数据刚性的分析师和业务用户可以选择更标准化的方法。 雪花模式是星型模式的扩展 - 它由普通星型模型和附加子维度表组成。
雪花模式使用更标准化的方法,适合较少的冗余和更复杂的查询。
了解更多关于优缺点的信息 星型模式与雪花模式 以及何时使用它们。
结语
星型模式只是一种方法 维度建模。 其他方法,如雪花和 3NF,也广泛用于构建数据集市和数据仓库。 数据团队的重要任务是根据他们的用例和资源找到最佳方法。
选择正确的建模技术对于自动化数据仓库和 BI 计划至关重要。 查看我们的工具包指南,了解如何为数据仓库自动化创建有效的数据模型和管道以及改进报告和分析。


