基础设施因素 除了源数据之外,在开启一段开源商业智能平台之旅之前,你还需要考虑IT基础设施的因素: 选择的技术应该具有相关性,并能够与整体的开源架构良好地兼容。此外,尽量选择一些成熟的技术。 需要考虑云计算的未来规划,随时做好将BI系统推向云端的准备。 确定好服务器硬件以及网络设备环境,以满足商业智能平台的良好运作。 确定平台与多数据源的交互性以及信息注入的方式。 针对基础设施,可供选择的模型非常多,其中就包括云模型。例如,使用大型云服务提供商的服务,不同的BI平台实例将用来进行测试。多个数据源和系统的信息同化将成为标准。这需要一个健壮的数据集成过程,其中ETL将起到主要作用。一些平台还需要编写一个ETL整合层,并固定在其他系统的点击流数据上。这一工作需要内建在一个多级过程中,其中不同级别的数据将进入平台,并被BI报表工具所利用。 数据质量 大多数情况下,某种程度上的数据管理是必要的。对于一些新建的系统,你需要对数据生成级别进行质量评估和质量控制,有相应的工具可以完成这一工作。理想状态下,当ETL引入到BI平台中时,质量检测工具就必须安装。在容错级别下,你需要根据业务流程制定一个质量阈值。 |