IT 系统越来越多,交互频繁,但是经常报错,数据或漏或少,怎么解决?
1
tomczhen 2016-11-03 10:42:09 +08:00
|
2
cloudwise 2016-11-04 16:47:21 +08:00
用我们做过的一个案例来说吧:
是一个比较知名的全球快消连锁公司,系统包括订单系统、 CRM 系统、日志系统、交易系统、订单系统等。他们的需求是通过一个大屏,一眼看到这些用户交易是否正常、是否有失败的交易,如果有故障能够快速准确定位到故障位置。 原来他们的系统是比较分散的,出了问题,查起来也比较麻烦,有时候都无法重现。 所以我们总体的思路是先梳理业务流程,然后把用户体验的数据监控起来,并把业务和 IT 数据进行关联,最后借助数据可视化平台进行展示。 基本上是个这个结构: 1 、和运维部门把业务系统、业务管理和 IT 支撑服务模块遵循三维模型映射到底层应用拓扑; 2 、再从业务流程环节对设备、平台、云资源、应用 /服务、外部 API 进行梳理和关联,得到业务拓扑的分层逻辑架构视图; 3 、通过基于用户行为的端到端全栈性能问题定位、基于全球分布式网络的用户体验主动感知、基于云端压力测试平台的业务容量规划系统具对不同数据源的业务数据和性能数据进行实时采集、处理、预测和关联分析。 4 、最后,把业务指标数据、性能指标数据和趋势分析、预测数据在业务运维大屏上进行实时展示。 给你们炫耀下最后实现的大屏样式 所以,现在他们看一个大屏就能知道那个业务系统有问题,问题在哪里,从过端到端一排查,一层层追踪定位,很快就可以知道问题在哪里了。 是不是很酷:) 最后做个广告,需要我们云智慧这种业务运维解决方案的同学,快来找我,快来找我。 |