自我反思怎么写学生(自我反思怎么写) 怎么在百度发布信息 百度怎么发动态(百度怎样发布消息) 加勒比海盗小提琴曲(双城变奏中的小提琴曲) 排球的场地如何安排及尺寸大小(排球比赛场地尺寸大小) 手机壳贴钻还能这样DIY 你不知道吧(怎样贴手机壳的钻才能更牢固) 余弦函数公式大全表格(余弦函数公式) 如何解决使用打印机突然提示“尚未安装打印机”(尚未安装打印机怎么回事) 梦幻西游三维版怎么联系在线客服(梦幻西游三维版客服电话人工服务电话) 销售原材料结转成本的会计分录(销售原材料会计分录) 手机如何查询东莞住房公积金?(手机如何查询东莞住房公积金贷款额度) 呆萌宠物对对碰攻略(萌宠对决攻略) 工程招标代理资质取消通知(工程招标代理资质) 法定节假日加班工资怎么算(法定节假加班工资怎么计算) 驾照理论考试技巧和方法(驾照理论考试技巧和方法口诀) 黄花菜不能和什么食物同吃(黄花菜不能和什么食物一起吃) HTC G12刷recovery教程及进入recovery方法(htc如何进入recovery) b血型的人有什么特点男(b血型的人有什么特点) Sai软件手绘简笔画绿色环保机器人(SAI画画软件) Their是什么意思中文翻译怎么读(their是什么意思) 网上赚钱创业方法大全(网上赚钱创业方法大全套) 走路赚钱的几种方式(走路赚钱的几种方式是什么) 红龙鱼饲养方法(红龙草) 怎样增强抵抗力(怎样增强抵抗力和免疫力) qb怎么转给别人(怎么把qb给别人) 不是花中偏爱菊此花开尽更无花全诗拼音(不是花中偏爱菊此花开尽更无花全诗) 微信新功能"拍一拍"上线!(微信新功能朋友圈折叠) 现场仪表HART通讯如何接线(hart怎么接线) peacewarfound的英语怎么读(peace war find怎么读) q版泡泡堂6怎么换人(q版泡泡堂可以三人吗) 如何获得更多渠道商及他们的支持(如何获得更多渠道商及他们的支持英语) 作文那一次我失败了(作文那一次我真高兴) 围巾情人扣的织法(围巾情人扣的织法粗线) 悬崖上的金鱼公主国语版樱花动漫(悬崖上的金鱼公主国语版高清) 智能电视怎么看地方台频道直播 教你方法(智能电视怎么看地方台的频道) 初二英语周报所有答案大全(初二英语周报答案网) 篮球计分器 教你使用篮球计分器!(篮球计分器如何使用) 玉兔怎么画简单又漂亮(玉兔怎么画简单又漂亮图片) 项目措施费包干含后期签证吗(项目措施费包括哪些) 像粑粑一样恶心人(像粑粑一样恶心人的图片) PPT如何修改激光笔颜色(放映ppt时激光笔的颜色是可以更改的) 果绿色cmyk色值为多少(果绿色cmyk色值) 淘宝天猫如何设置店铺抽奖?(淘宝天猫如何设置店铺抽奖时间) 怎么设置浏览器的兼容模式(怎么设置浏览器的兼容模式手机) 台达VFD-B 3.7kW变频器维修方法(台达vfd—b变频器使用手册) 摩尔庄园手游农庄拍照任务流程(摩尔庄园手游庄园拍照任务) 医者仁心的经典语录(医者仁心是什么意思) 打好台球的小技巧(打好台球的小技巧和方法) 纸张方向只设置一页横向(纸张种类) 京东巴枪联迪P990修改时间 红樱桃木门效果图(红樱桃木)
您的位置:首页 >综合精选 >

数据仓库与数据库的区别有哪些(数据仓库与数据库的区别)

导读 关于数据仓库与数据库的区别有哪些,数据仓库与数据库的区别这个问题很多朋友还不知道,今天小六来为大家解答以上的问题,现在让我们一起来

关于数据仓库与数据库的区别有哪些,数据仓库与数据库的区别这个问题很多朋友还不知道,今天小六来为大家解答以上的问题,现在让我们一起来看看吧!

1、简而言之,数据库是面向事务的设计,数据仓库是面向主题设计的。

2、 数据库一般存储在线交易数据,数据仓库存储的一般是历史数据。

3、 数据库设计是尽量避免冗余,一般采用符合范式的规则来设计,数据仓库在设计是有意引入冗余,采用反范式的方式来设计。

4、 数据库是为捕获数据而设计,数据仓库是为分析数据而设计,它的两个基本的元素是维表和事实表。

5、维是看问题的角度,比如时间,部门,维表放的就是这些东西的定义,事实表里放着要查询的数据,同时有维的ID。

6、 单从概念上讲,有些晦涩。

7、任何技术都是为应用服务的,结合应用可以很容易地理解。

8、以银行业务为例。

9、数据库是事务系统的数据平台,客户在银行做的每笔交易都会写入数据库,被记录下来,这里,可以简单地理解为用数据库记帐。

10、数据仓库是分析系统的数据平台,它从事务系统获取数据,并做汇总、加工,为决策者提供决策的依据。

11、比如,某银行某分行一个月发生多少交易,该分行当前存款余额是多少。

12、如果存款又多,消费交易又多,那么该地区就有必要设立ATM了。

13、 显然,银行的交易量是巨大的,通常以百万甚至千万次来计算。

14、事务系统是实时的,这就要求时效性,客户存一笔钱需要几十秒是无法忍受的,这就要求数据库只能存储很短一段时间的数据。

15、而分析系统是事后的,它要提供关注时间段内所有的有效数据。

16、这些数据是海量的,汇总计算起来也要慢一些,但是,只要能够提供有效的分析数据就达到目的了。

17、 数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它决不是所谓的“大型数据库”。

18、那么,数据仓库与传统数据库比较,有哪些不同呢?让我们先看看W.H.Inmon关于数据仓库的定义:面向主题的、集成的、与时间相关且不可修改的数据集合。

19、 “面向主题的”:传统数据库主要是为应用程序进行数据处理,未必按照同一主题存储数据;数据仓库侧重于数据分析工作,是按照主题存储的。

20、这一点,类似于传统农贸市场与超市的区别-市场里面,白菜、萝卜、香菜会在一个摊位上,如果它们是一个小贩卖的;而超市里,白菜、萝卜、香菜则各自一块。

21、也就是说,市场里的菜(数据)是按照小贩(应用程序)归堆(存储)的,超市里面则是按照菜的类型(同主题)归堆的。

22、 “与时间相关”:数据库保存信息的时候,并不强调一定有时间信息。

23、数据仓库则不同,出于决策的需要,数据仓库中的数据都要标明时间属性。

24、决策中,时间属性很重要。

25、同样都是累计购买过九车产品的顾客,一位是最近三个月购买九车,一位是最近一年从未买过,这对于决策者意义是不同的。

26、 “不可修改”:数据仓库中的数据并不是最新的,而是来源于其它数据源。

27、数据仓库反映的是历史信息,并不是很多数据库处理的那种日常事务数据(有的数据库例如电信计费数据库甚至处理实时信息)。

28、因此,数据仓库中的数据是极少或根本不修改的;当然,向数据仓库添加数据是允许的。

29、 数据仓库的出现,并不是要取代数据库。

30、目前,大部分数据仓库还是用关系数据库管理系统来管理的。

31、可以说,数据库、数据仓库相辅相成、各有千秋。

32、 补充一下,数据仓库的方案建设的目的,是为前端查询和分析作为基础,由于有较大的冗余,所以需要的存储也较大。

33、为了更好地为前端应用服务,数据仓库必须有如下几点优点,否则是失败的数据仓库方案。

34、 1.效率足够高。

35、客户要求的分析数据一般分为日、周、月、季、年等,可以看出,日为周期的数据要求的效率最高,要求24小时甚至12小时内,客户能看到昨天的数据分析。

36、由于有的企业每日的数据量很大,设计不好的数据仓库经常会出问题,延迟1-3日才能给出数据,显然不行的。

37、 2.数据质量。

38、客户要看各种信息,肯定要准确的数据,但由于数据仓库流程至少分为3步,2次ETL,复杂的架构会更多层次,那么由于数据源有脏数据或者代码不严谨,都可以导致数据失真,客户看到错误的信息就可能导致分析出错误的决策,造成损失,而不是效益。

39、 3.扩展性。

40、之所以有的大型数据仓库系统架构设计复杂,是因为考虑到了未来3-5年的扩展性,这样的话,客户不用太快花钱去重建数据仓库系统,就能很稳定运行。

41、主要体现在数据建模的合理性,数据仓库方案中多出一些中间层,使海量数据流有足够的缓冲,不至于数据量大很多,就运行不起来了。

本文分享完毕,希望对大家有所帮助。

标签:

免责声明:本文由用户上传,如有侵权请联系删除!

最新文章