1,如何构建bi数据仓库以及bi数据分析的应用2,请问数据仓库都用什么建立3,想做数据仓库以前做java的有什么好的建议吗0基础感觉 问4,关于数据仓库的设计5,数据仓库的实现策略1,如何构建bi数据仓库以及bi数据分析的应用
首先通过etl工具抽取转换加载数据到数据仓库dw,按主题形成数据集市dw,最后通过报表展现数据。mircosoft ssisinformaticadatastage比较流行和常用的etl工具,可以到网上收集资料
2,请问数据仓库都用什么建立
数据仓库是为了管理数据,主要是思想。具体实施的工具就是为了解决问题而选取了比如异构/不同源数据的数据抽取问题,要用到etl,可能会用工具 或者自己写程序,看情况而定数据仓库的模型建设,要用到erwin等建模工具;数据的存放一般是借助关系数据库来实现,那么会用到oracle之类。不过现在已经开始慢慢摒弃传统关系数据库了,借助一些no sql平台,比如hadoop上的hive之类。不过无论用什么工具,一定要记住,数据仓库的思想是不变的,就是管理数据、把数据的价值通过有效地管理而展现出来,不经管理的数据就是一堆没有提炼的金矿,看着很值钱,直接狗屁用没有。
3,想做数据仓库以前做java的有什么好的建议吗0基础感觉 问
当然是j2ee有发展,数据仓库(不包括数据挖掘)这种东西说白了就是把老外的工具拿来用用尔亦。它的创造性远不及java c++等,而且数据仓库是与需求紧密相连的,也就是说它的知识不具有“可复用性”。对于谋生来说,可能现阶段数据仓库容易些,好骗人。有如此好的java背景,为什么不找个相关的工作呢?我现在在搞所谓的数据仓库,但个人最热衷的是设计模式以及j2ee等比较有意思的东西。早晚我会从事那样的工作,即比较底层的东西。从另外一个角度看,你搞一搞数据仓库也没有什么不好,sun不是也在指定用于olap和数据挖掘的规范吗?银行比较好,数据仓库比java前途好吧。根据个人爱好仔细斟酌,钱多少看自己以后发展。
4,关于数据仓库的设计
合并也不可能在系统一级上这么快合并,而是通过慢慢淘汰更新,用新系统替换旧系统。在数据的统计分析应用上,也不会这么快就有一个table或两个table的定论,都要看情况。产品与客户都是维表,事实表是要体现业务的,要基于具体业务来设计。这个你提供的信息太少了,要具体情况具体分析,不过未来两个公司的业务肯定都是合并的,你的产品和客户最终都要合并,所以 客户和产品作为维度肯定要合并。而你的事实表,要看情况,你是什么行业,你的业务简单(业务系统少),产品少,交易简单数据量小,那么事实表就数据量少,反之则根据 交易类型或产品进行事实表的拆分例如银行就按 卡、存款、对公、对私 业务 有不同的事实表
5,数据仓库的实现策略
数据仓库的开发策略主要有自顶向下、自底向上和这两种策略的联合使用。自顶向下策略在实际应用中比较困难,因为数据仓库的功能是一种决策支持功能。这种功能在企业战略的应用范围中常常是很难确定的,因为数据仓库的应用机会往往超出企业当前的实际业务范围,而且在开发前就确定目标,会在实现预定目标后就不再追求新的应用,是数据仓库丧失更有战略意义的应用。由于该策略在开发前就可以给出数据仓库的实现范围,能够清楚地向决策者和企业描述系统的收益情况和实现目标,因此是一种有效的数据仓库开发策略。该方法使用时需要开发人员具有丰富的自顶向下开发系统的经验,企业决策层和管理人员完全知道数据仓库的预定目标并且了解数据仓库能够在那些决策中发挥作用。自底向上策略一般从某个数据仓库原型开始,选择一些特定的为企业管理人员所熟知的管理问题作为数据仓库开发的对象,在此基础上进行数据仓库的开发。因此,该策略常常用于一个数据集市、一个经理系统或一个部门的数据仓库开发。该策略的优点在于企业能够以较小的投入,获得较高的数据仓库应用收益。在开发过程中,人员投入较少,也容易获得成效。当然,如果某个项目的开发失败可能造成企业整个数据仓库系统开发的延迟。该策略一般用于企业洗碗对数据仓库的技术进行评价,以确定该技术的应用方式、地点和时间,或希望了解实现和运行数据仓库所需要的各种费用,或在数据仓库的应用目标并不是很明确时,数据仓库对决策过程影响不是很明确时使用。在自顶向下的开发策略中可以采用结构化或面向对象的方法,按照数据仓库的规划、需求确定、系统分析、系统设计、系统集成、系统测试和系统试运行的阶段完成数据仓库的开发。而在自底向上的开发中,则可以采用螺旋式的原型开发方法,使用户可以根据新的需求对试运行的系统进行修改。螺旋式的原型开发方法要求在较短的时间内快速的生成可以不断增加功能的数据仓库系统,这种开发方法主要适合于这样一些场合:在企业的市场动向和需求无法预测,市场的时机是实现产品的重要组成部分,不断地改进对与企业的市场调节是必需的;持久的竞争优势来自连续不断地改进,系统地改进是基于用户在使用中的不断发现。自顶向下和自底向上策略的联合使用具有两种策略的优点,既能快速的完成数据仓库的开发与应用,还可建立具有长远价值的数据仓库方案。但在实践中往往难以操作,通常需要能够建立、应用和维护企业模型、数据模型和技术结构的、具有丰富经验的开发人员,能够熟练的从具体(如业务系统中的元数据)转移到抽象(只基于业务性质而不是基于实现系统技术的逻辑模型);企业需要拥有由最终用户和信息系统人员组成的有经验的开发小组,能够清楚地指出数据仓库在企业战略决策支持中的应用。目前,大家公认的数据仓库创始人w h.inmon在他所著的《建立数据仓库》一书中对数据仓库所下的定义;数据仓库就是面向主题的、集成的、稳定的、不同时间的数据集合,用以支持经营管理中的决策制定过程。数据仓库中的数据面向主题与传统的数据库面向应用相对应。主题是一个在较高层次将数据归类的标准,每一个主题对应一个宏观的分析领域。数据仓库的集成特性是指在数据进入数据仓库之前,必须进行数据加丁一和集成,这是建立数据仓库的关键步骤,首先要统一原始数据中的矛盾之处,还要将原始数据结构做一个从面向应用向面向主题的转变,数据仓库的稳定性是指数据仓库反映的是历史数据的内容,而不是日常事务处理产生的数据,数据经加工和集成进入数据仓库后是很少修改或根本不修改的;数据仓库是不同时间的数据集合,它要求数据仓库中的数据保存时限能满足进行决策分析的需要,而且数据仓库中的数据都要标明该数据的历史时期。 数据仓库最根本的特点是物理地存放数据,而且这些数据并不是最新的、专有的,而是来源于其他数据库,它要建立在一个较全面和完善的信息应用的基础上,用于支持高层决策分析,而事务处理数据库在企业的信息环境!!,承担的是日常操作性的任务,数据仓库是数据库技术的一种新的应用,到目前为止,数据仓库还是用数据库管理系统来管理其中的数据。
苹果笔记本可以用u盘装系统吗(苹果笔记本可以使用u盘吗)
win10电脑桌面壁纸尺寸调整(windows10怎么设置壁纸大小)
打印机如何打印非a4(打印机非标纸张设置)
小米手机打不开前置摄像头怎么回事(小米手机突然前置摄像头打不开了怎么处理zol问答)
用电脑比对两个表怎么比对(两张表怎么比对)
数据仓库开发,如何构建BI数据仓库以及BI数据分析的应用
笔记本触控板怎么设置灵敏度(笔记本触控板哪里设置)
苹果台式电脑一体机好用吗,苹果一体机电脑性能怎么样
win7官方纯净版系统怎么安装(正版windows7下载)_1
wps打印预览有空白页怎么删除不了(wps打印预览有空白页怎么删除掉)
最好的笔记本电脑牌子排名,设计师笔记本电脑什么牌子最好用
苹果手机怎么关闭手机5g网(苹果手机如何关闭手机5g网络)
小米路由 3c(小米路由器3c是千兆路由器吗)
联想台式电脑安装视频教程图解,联想h5060台式机安装视频
什么牌子的硬盘性能最好,什么牌的硬盘好
格式化d盘提示此驱动器正在使用,我在格式化D盘时电脑总是说无法格式化请退出正在使用该驱动器的
苹果拍照怎样显示九宫格(iphone拍照时怎么显示九宫格)
miui怎么破解,小米桌面我想告诉你怎么解开
小米忘记帐号怎么找回,小米手机忘记wifi密码怎么找回
固态硬盘跟移动硬盘有什么区别,买移动硬盘还是移动固态硬盘