01 场景背景
随着IT行业的发展和各家企业IT建设的需要,信息系统移动化、社交化、大数据、系统互联、数据打通等需求不断增多,企业集成平台占据各个企业领域,成为各业务系统数据传输的中枢。
集成平台承接的业务系统越多,集成平台的运维事项也随之增加。集成平台运维是一项重要又复杂的工作,直接关系到应用系统是否能正常稳定运行。
企业集成平台常见运维问题包括且不限于:
- 接口说明文档版本繁多且易丢失,影响集成效率
- 接口问题难以精确定位,排查效率低下
- 集成平台缺少完备的运维预警机制
- 集成平台业务数据补偿机制不完善
通过我们的iPaaS运维方案,这些问题能够迎刃而解。
02 解决方案
我们的iPaaS运维方案,由「消费资产」、「管理门户」、「待办中心」、「重试」、「统计报表」、「系统预警」、「异常知识库」、「操作日志」等模块组成。
消费资产
「消费资产」模块,包含接口地址、请求响应参数维护、请求响应参数、调用方代码示例、调用日志功能。
- 通过线上维护接口的请求响应字段、字段名称、字段类型、示例值、请求响应报文,接口调用地址、认证方式可以一目了然,并代替原有文档维护接口信息,防止文档丢失以及文档多版本现象。
- 根据调用方不同的技术架构在线生成对应的调用示例,供调用方技术开发人员参考。
- 接口调用日志记录方便开发和运维人员发现排查问题根源,防止接口出现问题,可以精确定位问题根源所在,以防双方互相推卸责任。
管理门户
「管理门户」模块,包含运行服务总数、服务调用次数、服务流量统计、错误实例统计、iPaaS平台资源使用情况功能。
- 根据不同时间段分析数据传输高峰期、接口平均响应时长。
- 展示错误实例统计,点击错误实例穿透到具体接口,快速查看异常接口详情。
- 查看服务器性能情况,服务器硬件资源不足时及时发现,防止硬件资源不足影响业务数据的传输。
待办中心
我们的iPaaS平台提供「待办中心」模块。
普通用户调用iPaaS平台接口时需要提出申请,运维管理员可以在「待办中心」中对该用户的申请进行通过拒绝操作,防止iPaaS平台发布的接口出现被不明系统调用,恶意获取数据。
重试
我们的iPaaS平台提供接口「重试」功能,可以通过iPaaS平台重试接口。
-
由于网络延时或者业务系统服务不通出现的接口报错,iPaaS平台可以对失败的接口实例进行重试操作,运维人员通过重试操作将未下发成功的数据进行数据补偿,防止业务系统出现缺失数据的状况。
-
重试操作也支持对下发的数据修改后进行数据补偿。
统计报表
我们的iPaaS平台提供「统计报表」模块,根据应用系统统计、消费者统计、API调用统计、API消费统计,通过不同维度对经过iPaaS平台的数据进行分析,可统计不同接口服务的调用总数、成功率、失败率、平均执行时间、平均报文大小等。
运维人员能够方便直观看到各系统服务的使用状况,不需要再花费时间对数据进行统计,领导层也可以清晰获取到关心的数据。
系统预警
「系统预警」模块,包含错误异常预警、基于统计预警、API运行引擎预警、第三方系统预警四大功能。
- 错误异常预警:及时将出现异常的接口通过邮件、短信等方式通知运维人员,运维人员及时处理问题,防止业务和经济造成损失。
- 基于统计预警:通过失败率、失败次数、平均响应时间、报文平均响应大小对关心的消费者或者具体API服务进行预警,超过阀值后运维人员能及时收到预警信息。
- API运行引擎预警:对iPaaS平台的堆栈使用率、线程数、健康状况进行预警,超过阀值后及时对平台进行问题分析或者添加资源,减轻运维人员人为干预工作量。
- 第三方系统预警:对第三方业务系统进行心跳检测,当第三方业务系统出现异常时,及时通知运维人员发现、处理问题,防止造成更大的经济损失。
异常知识库
我们的iPaaS平台提供「异常知识库」模块。
运维人员将出现过的异常进行标记和异常码分类维护,根据不同的异常码维护异常名称、异常识别规则、异常处理方法。
当出现同样的异常信息时系统可自行将异常进行归类,并通过异常处理方法快速处理该问题,缩短运维人员的问题分析和处理时间,提升运维效率。
操作日志
我们的iPaaS平台提供「操作日志」模块,可在「操作日志」中查看操作人、操作时间、操作的内容,防止出现恶意操作和误操作时运维人员追踪不到具体操作人。
03 方案价值
我们的iPaaS运维方案,通过「消费资产」、「统计报表」、「系统预警」、「异常知识库」、「操作日志」等功能,规范企业运维流程,降低问题出现概率。
同时我们的iPaaS运维方案可缩短问题分析和处理时间,减轻运维人员工作量,提升运维工作效率。管理人员能够及时掌握各平台运行情况,为企业节省成本,最大限度减少业务和经济损失