用户登录
用户注册

分享至

企业经济效益数据仓库维度模型的研究

  • 作者: cl杰
  • 来源: 51数据库
  • 2020-12-23

    目前,随着科学技术的进步和数据规模的扩大,在对数据本身进行操作的前提下,仅靠人力做出分析和决策已无法适应时代的发展和要求,而通过科学高效、快速全面的数据分析去获得更大的经济效益成为不可阻挡的潮流和趋势。由此看来,构建数据仓库不仅是一种必然,而且有取代数据库成为数据处理的主要工具的发展态势。正是基于对海量的数据进行科学分析、处理和预测的能力,沃尔玛超市的老板才发现“啤酒与尿布”这两种毫无联系的商品竟存在某种微妙的关系,于是将这两种商品放在一起,结果啤酒的销售量大大增加,由此可见数据仓库在数据分析中的巨大作用。


    企业在产品的采购、运输、生产、管理、销售、服务和回收过程中必然积累大量数据,并且数据以指数级增长,在此种情况下,企业迫切地需要根据自身需求对海量数据进行高效、精确、科学地分析,运用数据挖掘算法,挖掘出对企业发展起关键作用的信息,进而全面了解和掌握企业的经营状况和外部环境,并做出科学的预测和决断,以获得最大的经济效益。本文正是选取科学合理的企业经济效益评价指标,设计出企业经济效益数据仓库的维度模型,以对后期的企业管理提供有效的决策支持。


    1 数据仓库基本理论


    1.1 基本概念


    近年来随着利用数据支持决策分析的强烈需求和数据库管理及应用技术的广泛应用,数据仓库应运而生,它是一种基于数据库技术的的处理海量数据和信息的综合性前沿技术;在信息时代数据规模不断扩大的情况下,数据仓库将在数据库领域占据重要位置,并将成为下一代应用系统的重要组成部分。关于数据仓库的概念,最具代表性的是数据仓库之父W.H.Inmon在20世纪90年代提出的观点:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、非易失的(Non Volatile)、随时间不断变化的(Time Variant)数据集合,主要用于对企业管理进行决策、分析、评估和预测。


    1.2 维度建模


    维度建模是应用于数据仓库的一种逻辑设计方案,其基本思想是以某种数据立方体的形式表示大部分与业务有关的数据,各种测度值包含在这种数据立方体的各个单元格中,其中数据维度通过立方体的边定义和说明。将其中的维度表和事实表这两个组块融合到一起,就构成了数据仓库的基本维度模型。维度建模的优点如下:


    (1)维度模型是可预测的标准框架。


    (2)用户行为不可预知的变化因星型模型的可预测标准框架而弱化。


    (3)良好的扩展性,可将不可预测的新的设计决策以及数据源容纳进来。


    (4)业务环境中常见的建模情况可以通过维度模型中诸多的标准方案处理。


    (5)越来越多的管理实用程序及软件使维度模型可以用于诸多聚集的管理决策和使用过程。

[page]    2 数据仓库的维度模型分析


    2.1 企业经济效益评价指标体系


    企业经济效益是企业的生存和发展的关键,通过科学控制和决策,对企业的整个生命周期过程进行成本和收益的分配、分析以及决策,构建优化的企业经济效益评价模型,对企业生命周期过程中的业务流、资金流和分配流及周转流进行分析,依据企业经济效益的五性分析法,选择合理的经济效益评价指标,构建企业经济效益评价指标体系,如图1所示。

   

    图1 企业经济效益评价指标体系


    2.2 企业经济效益数据仓库的体系结构


    作为一种系统集成方案,数据仓库的主要工作是融合和集成处理数据所需的工具,以完成数据抽取(Extract)、转换(Transform)以及加载(Load)、OLAP分析与数据挖掘(DM)等过程,操作环境层、数据仓库层以及业务层构成了典型的数据仓库体系结构。


    企业经济效益数据仓库的一般体系结构如图2所示,其中操作环境层是企业外部数据源以及所使用操作型数据库的数据记录,进行数据预处理后,利用Microsoft SQL Server 2005将外部数据源及操作型数据集成到数据仓库中,生成数据仓库层,在数据仓库层中,根据企业经济效益指标评价体系构建企业经济效益数据仓库的维度模型,进而上升到业务层阶段,可以进行业务的即席查询,或者借助OLAP和数据挖掘工具对企业经济效益进行高效分析和挖掘,为后期的企业管理提供科学的参考建议和决策支持。

 

   

    图2 数据仓库的体系结构

[page]    2.3 企业经济效益数据仓库的星型模型


    维度建模技术几乎被应用在所有业务领域中,数据仓库设计中最常用的数据模型是星型模型和雪花模型。在构建企业经济效益评价指标体系的基础上,结合企业经济效益数据仓库的体系结构,根据以下四步维度设计方法,设计企业经济效益数据仓库的维度模型。


    (1)选取要建模的业务处理过程。通过对可用数据以及业务需求的理解对建模过程中的业务处理内容进行确定,是机构中进行的一种自然业务活动,在企业经济效益数据仓库的维度建模中,就是要选择企业经济效益数据仓库维度建模的主题域。


    (2)定义粒度。即确切解释各个事实表行的实际内容,并规定与度量值相联系的所有细节应达到的详细程度,即对企业经济效益数据仓库中业务事实表所包含的相关信息给出详细的解释。


    (3)选好维度。粒度定义后,维度也随之确定,在企业经济效益数据仓库的维度模型中,给出了时间维、企业维、产品维及地区维,随着其他相应属性的确定而使维度表更加充实、丰满。


    (4)确定事实。即确定要对业务处理过程的那些数字型事实进行评测,在企业经济效益业务事实中,根据企业经济效益指标评价体系,对生产性、成长性、流动性、安全性和收益性5个方面的指标进行分析,并且这5个方面的指标在维度表中都有良好的可加性。


    根据维度建模的步骤,将企业经济效益业务分析信息作为事实表,将时间、企业、产品和地区作为维度表,采用星型模式建立企业经济效益数据仓库的维度模型,如图3所示。在该模型中,时间维度表的待定属性中,可设置年份、季度、月份等信息,企业维度表的待定属性中,可设置企业名称、企业代码、企业性质、企业地址等基本信息,产品维度的待定属性中,可设置产品名称、生产部门、产品描述等基本信息,使维度模型更加完善。

   

    图3 企业经济效益数据仓库的星型模型


    3 总结和展望


    维度建模是数据仓库设计的重要环节和关键步骤之一,本文正是基于数据仓库理论和技术,在构建经济效益评价指标体系的基础上,设计企业经济效益数据仓库的体系结构,建立企业经济效益数据仓库的维度模型,为企业实现更大经济效益提供指导,为后期的企业管理提供科学的决策支持。本文从企业经济效益的5个方面选取指标,构建了科学的经济效益评价指标体系,并将其集成到数据仓库的维度模型中,在后续的数据仓库分析、数据挖掘以及企业的管理决策中,将对企业的经济效益进行更具科学性和合理性的评估和预测。


软件
前端设计
程序设计
Java相关