Files
ops/docs/integrated-ops-platform-requirements.md
2026-06-21 17:50:24 +08:00

26 KiB
Raw Blame History

一体化运维平台 - 需求与功能清单

来源文件西藏自治区人民医院信息系统硬件支撑平台升级改造项目_招标文件.pdf菜单规划表3.0.xlsx

范围说明:本文件只提取“一体化运维平台”相关内容,不包含机房装修、网络交换、安全设备、服务器、存储、光纤布线等硬件交付清单。硬件、安全、网络设备仅在“被监控对象”维度出现。

1. 平台定位

项目 内容
平台名称 一体化运维管理平台
数量 1 套
建设目标 对网络设备、安全设备、服务器硬件、虚拟化系统、存储设备等 IT 资源进行集中监控管理与运维信息收集,提升 IT 运维效率
来源依据 第 77 页“6.一体化运维管理平台建设”;第 107-116 页“二、一体化运维平台”
主要模块 首页总览、可视化大屏、综合监控、网络架构管理、告警管理、工单管理、数据中心管理、资产管理、知识库、报表管理、用户权限管理、日志管理、系统管理、快速开发/低代码能力
验收方式 逐项功能演示、监控对象接入验证、告警测试、报表/大屏输出、权限与日志检查、移动端验证

2. 核心需求清单

编号 需求类型 强制性 优先级 需求描述 原文依据 来源位置 验收/证明方式 备注
OPS-001 首页总览 强制 P0 首页需以折线图、拓扑图等方式展示设备状态、告警状态、网络状态,提供待处理告警、设备总览、告警趋势、网络监控等入口,且支持总览页面模块化配置。 菜单规划表3.0.xlsx“总览”备注 Sheet1 第 6 行 查看首页总览,调整模块显示内容并验证保存生效 菜单列不作为需求依据,功能点来自描述与备注
OPS-002 操作系统监控 强制 P0 平台需统一监控内存利用率、磁盘、CPU 利用率、硬盘利用率、网卡状态、接收和发送的流量及包数、日志、Syslog、异常进程、目录和文件数量及大小等基础指标。 “操作系统监控的指标包含...” 招标文件第 107 页Sheet1 第 11 行 接入主机并展示指标,模拟阈值触发告警 基础监控能力
OPS-003 服务器硬件监控 强制 P1 支持 IBM、HP、联想、浪潮、华为、EMC、H3C 等厂商服务器硬件监控,采集电压、电流、温度、风扇及其他硬件状态。 “服务器硬件运行指标,包括电压、电流、温度、风扇...” 招标文件第 110 页Sheet1 第 12 行 接入物理服务器并展示硬件健康与性能指标 含多品牌适配
OPS-004 网络设备监控 强制 P1 支持不同品牌网络设备自动发现、拓扑生成、逻辑面板图、接口状态可视化、接口表、路由表、转发表、ARP 表查看,并可通过 Syslog、SNMP Trap 接收网络设备告警事件。 “逻辑面板图...接口表、路由表、转发表以及ARP表...” 招标文件第 107-110 页Sheet1 第 13 行 SNMP/Trap 接入、逻辑面板、接口状态和告警规则演示 被监控对象含交换机、防火墙、安全设备
OPS-005 安全设备监控 强制 P1 支持安全设备状态、型号、版本、CPU、内存、接口状态、接口信息等监控并提供历史数据记录管理和按时间间隔生成历史数据分析报表能力。 “安全设备监控...历史数据分析报表” Sheet1 第 14 行 接入安全设备并输出状态、接口与历史分析报表 与网络设备监控关联
OPS-006 存储监控 强制 P1 支持惠普、日立、EMC、群晖、IBM、华为等存储设备监控采集 CPU 使用率、内存及虚拟内存使用率、硬盘空间、磁盘 IO 吞吐、可用率、控制器状态、存储池、物理硬盘、网口状态、速率、流量、背板、节点等信息。 “存储设备监控...CPU使用率、内存...控制器状态” 招标文件第 110-111 页Sheet1 第 15 行 接入存储并展示容量、硬盘、网口、节点和控制器状态 需适配本项目存储设备
OPS-007 数据库监控 强制 P1 支持 Oracle、MySQL、国产数据库等监控采集表空间、死锁数、用户连接、请求、内存、缓存、连通性、SQL 执行耗时 TOP5、SQL 耗 CPU TOP5、SQL 耗内存 TOP5支持 Oracle RAC 运行状态、Cluster、ASM、数据库实例及其他集群资源状态支持自定义 SQL 脚本监控。 “监控指标包含:表空间...支持自定义SQL脚本监控” 招标文件第 107 页Sheet1 第 16 行 接入数据库实例展示性能、RAC/集群、SQL TOP 和自定义 SQL 监控结果 医院国产化环境重点
OPS-008 中间件监控 强制 P1 支持 WebLogic、Tomcat、MQ、国产中间件及 ActiveMQ、RocketMQ、Kafka、IBM WebSphere 等中间件监控采集服务可用性、JVM 总大小/已用大小、应用可用性、连接池可用性、连接池大小、活动连接数、等待连接数、创建连接数、活动线程数量、会话创建数、无效会话数等指标。 “监控指标包括服务可用性、JVM...” 招标文件第 107 页Sheet1 第 17 行 接入至少一种院方实际中间件并展示运行状态和指标 中间件种类需按现场确认
OPS-009 虚拟化监控 强制 P1 支持 VMware、华为云、私有云及国产虚拟化平台监控展示物理机、虚拟机、网络、存储资源、数据库等元素关系并动态更新同时展示宿主机、集群、虚拟机、资源池、CPU、内存、磁盘、开关机状态等。 “清晰展现各元素之间的关系,并且动态更新” 招标文件第 108、110 页Sheet1 第 18 行 接入虚拟化平台并展示主机、虚拟机、资源关系视图 与现有虚拟化平台兼容
OPS-010 日志与 Trap 监控 强制 P1 支持接收交换机、路由器、防火墙、Unix/Linux 等设备生成的 Syslog 消息,基于规则识别重要日志并关联告警;支持 SNMP Trap 规则、Trap 字典、OID 含义和描述自定义、告警级别和恢复信息设置、Trap 屏蔽策略和屏蔽时间段配置。 “支持Trap字典...支持Trap屏蔽” 招标文件第 111 页Sheet1 第 19、80 行 采集 Syslog/Trap配置字典、规则、屏蔽策略并验证告警关联 与日志审计设备不是同一范围
OPS-011 URL 与业务可用性监控 强制 P1 支持定期检测网页、网站、网址、URL 和 Web 业务流程是否可正常访问,及时发现 Web 业务异常或网页变化采集可用性、响应时间、返回状态代码等指标并支持端口、服务、进程、Webservice、业务调用链、业务日志监控。 “用于定期检测指定的网页、网站、网址或URL...” 招标文件第 107、111 页Sheet1 第 20 行 配置 URL/API/端口/服务监控,模拟异常并触发告警 面向 HIS/LIS/PACS/EMR 等业务
OPS-012 动环与安全环境监控 强制 P2 支持电力、UPS、空调、温湿度等电器相关监控以及消防、门禁、漏水、有害气体等消防安全相关监控。 “电力/UPS/空调/温湿度”“消防/门禁/漏水/有害气体” Sheet1 第 21-22 行 接入或模拟动环设备,展示状态、指标和告警 与数据中心/机房管理联动
OPS-013 网络拓扑管理 强制 P1 支持可视化拓扑展示、全景图、告警图标点击查看、拓扑统计查看设备名称、设备 IP、链路流量支持环形、层次、同心圆、网络布局、拓扑图下载、添加设备/文本/子拓扑/区域、导入设备、添加链路、分组和多级分组管理、拓扑缩放/纵览/移动/手动刷新。 “支持可视化展示拓扑视图、查看全景图...” 招标文件第 114 页Sheet1 第 24-26 行 创建拓扑分组,导入设备与链路,验证布局、告警查看、统计、下载 与 OPS-004 关联
OPS-014 网络流量分析 强制 P1 支持从应用、协议、会话、流向等维度分析网络流量状态和构成识别占用网络资源最多的应用、协议、设备和流向支持流量异常检测、WAN 流量监测、实时预警、网络优化参考、链路新增/编辑/删除/批量删除/禁止/允许、流量监控分析。 “从应用、协议、会话、流向等维度了解网络流量状态和构成” Sheet1 第 29 行 新增链路并展示应用/协议/会话/流向分析,触发流量异常预警 支撑网络带宽规划
OPS-015 流量参数配置 强制 P2 支持按实际应用场景或自定义业务类型设置需要监测的应用、端口、协议,并支持设置监测数据保存时间。 “用户自己设置需要监测流量的应用端口、协议...” Sheet1 第 33 行 配置应用/端口/协议和保存周期,验证流量采集策略生效 与流量分析联动
OPS-016 IP 地址管理 强制 P1 支持添加子网络、网段、IP 地址,展示 IP 与 MAC 对应关系,查看在用、未用、分配、保留状态;支持分组分层管理,从规划、分配、监控、回收维度对 IP 地址进行全生命周期管理。 “IP地址管理支持添加子网络、网段、IP地址...” 招标文件第 112-113 页Sheet1 第 34-36、38 行 创建分组、导入/新增子网,查看 IP/MAC、分配和使用状态 包含一键/自动扫描能力
OPS-017 IP 自动扫描与报表 强制 P2 支持按扫描规则和周期自动扫描 IP 网段、IP 地址并将新发现地址加入系统;支持 IP 概览、IP 地址冲突记录、子网 IP 使用占比 TOP10、IP 状态统计、子网统计、DHCP 地址租约、IP 变更记录、IP 异常记录等报表。 “系统会根据设置的扫描规则、周期自动扫描...” Sheet1 第 36、38 行 配置扫描任务并生成 IP 使用、冲突、租约、变更、异常报表 “一件扫描”统一理解为“一键扫描”
OPS-018 告警降噪与策略 强制 P0 支持告警去重、告警压缩、告警屏蔽、告警依赖、告警抑制、告警策略规则匹配和条件设置,可按设备、监测点、监测指标选择策略范围,减少告警泛滥、误报和重复告警。 “告警去重、告警压缩、告警屏蔽...” 招标文件第 111 页Sheet1 第 44、50 行 触发重复/依赖告警,验证去重、压缩、屏蔽、抑制和策略范围 运维闭环核心功能
OPS-019 告警模板与通知 强制 P0 支持操作系统、服务器硬件、网络设备、安全设备、存储、数据库、中间件、虚拟化、动环、消防等告警模板;模板可自定义告警内容并使用系统变量;支持颜色、网页弹窗、邮件、手机短信、声音、脚本、微信公众号、企业微信、钉钉、电话、工单等告警方式,邮件支持服务器、发件人、收件人、临时收件人配置,短信支持无线 Modem、短消息平台和第三方短信平台。 “用户可以自定义告警内容...支持多种告警方式” 招标文件第 111 页Sheet1 第 45-46 行 配置模板、变量和多渠道通知,触发测试告警 需确认医院实际通信渠道
OPS-020 告警级别与升级 强制 P1 支持最多七级告警级别,自定义级别名称和显示颜色;同一监控数据同时触发高低级别规则时只发送高级别告警;支持告警发生后在设置时间内未处理时自动升级并转发,通知方式可自由选择。 “最多可达七级...支持告警升级” Sheet1 第 47 行 配置多级告警、颜色和升级规则,验证高级别优先与超时升级 提升值班响应效率
OPS-021 告警受理与历史 强制 P0 支持受理、确认、忽略、查看、搜索、导出告警;支持直接将告警分派为工单处理,特定发送方式为工单时自动生成工单;记录通知或邮件发送历史,支持查看发送详情、告警来源、历史告警、已恢复、已忽略、已失效告警。 “受理告警、确认告警、忽略告警...” 招标文件第 111 页Sheet1 第 48-49 行 触发告警并完成确认、忽略、派单、导出、历史查询 与工单管理联动
OPS-022 工单管理 强制 P1 支持轻量化运维工单管理,可手动或自动创建事件处理工单,支持接单、转交、撤回、挂起、重启、关闭;支持告警联动自动生成事件工单、告警发送策略自动派单、在告警视图中直接创建工单并分派人员。 “工单管理可与告警联动,实现告警发生后自动生成事件工单” Sheet1 第 51 行 创建手工工单和告警自动工单,验证流转、派单、通知和关闭 规范运维任务处理
OPS-023 数据中心与机房管理 强制 P2 支持多层级机房和数据中心管理,可按“省份-城市-数据中心-楼层”模式管理;机房管理可集成动环设备并添加机柜,实现设备集中监控、集中告警、集中展示和数据中心能力管理。 “支持多层级机房和数据中心管理...” Sheet1 第 54 行 建立数据中心/楼层/机房层级,关联动环设备和机柜 与 3D 机房/资产数据相关
OPS-024 机柜与 U 位管理 强制 P2 支持机柜设计工具和机柜布局图,展示机柜内设备位置、占用 U 位、状态信息;关联已监控设备后实时显示设备状态和告警信息;支持按可容纳机柜数、实际使用机柜 U 位数统计物理空间使用量和剩余物理空间。 “创建机柜布局图...统计出各机房的物理空间使用量” 招标文件第 113 页Sheet1 第 56-57 行 创建机柜布局,绑定设备,查看 U 位占用、状态告警和剩余空间 支撑上架规划
OPS-025 资产管理 强制 P2 支持机房设备发生变化时手动添加或删除设备,系统根据变更计算最新可用物理空间,为设备上架提供规划参考。 “手动添加或删除设备...计算出最新的可用物理空间” Sheet1 第 60 行 新增/删除设备并验证空间容量重新计算 与机柜/U 位管理联动
OPS-026 知识库管理 强制 P2 支持知识与设备异常检测点关联,设备异常时可查看相关知识;支持知识分类创建、分类展示、新增、编辑、删除;支持知识发布、编辑、删除、浏览、附件下载;支持知识审核和审核日志记录。 “知识库支持和设备异常的检测点关联...” Sheet1 第 66、68、70 行 创建分类和知识,关联检测点,触发异常后查看知识并完成审核 提升故障处理复用能力
OPS-027 报表管理 强制 P1 支持 TopN 报表、统计报告、流量统计、故障报告、服务器报表、网络设备报表可对指定单台或多台设备、任意监测指标、任意时段进行统计并导出故障报告展示故障设备、检测点、IP、类型、次数、百分比、开始/结束时间、持续时间服务器报表展示可用性、响应时间、CPU、物理/虚拟内存、磁盘 I/O、磁盘使用率、今日告警次数网络设备报表展示可用性、服务成功率、平均响应时间、抖动、CPU、内存、运行时间、今日告警。 “TopN报表...统计报告...故障报告...” 招标文件第 112 页Sheet1 第 72-77 行 生成并导出 TopN、统计、流量、故障、服务器、网络设备报表 建议定义标准报表模板
OPS-028 可视化大屏管理 强制 P1 支持用户更换大屏展示样式和内容,深度个性化配置;支持大屏分组、不同用户使用各自配置、多自定义大屏轮播、轮播时间间隔设置;视图可显示状态报告、拓扑图、实时告警、接口流量图、业务状态图表等并自由组合。 “大屏展示支持分组展示...多个自定义的可视化大屏进行轮播展示” 招标文件第 114 页Sheet1 第 7 行 配置个人/分组大屏、轮播、数据组件和自由组合页面 可作为可视化验收重点
OPS-029 用户权限管理 强制 P1 支持用户分组、角色、用户权限、数据权限,保障用户在权限内使用系统和管理对象;支持用户新增、编辑、删除、停用、启用、关联到组;支持用户组新增、编辑、删除、关联用户、关联角色、关联数据权限;支持角色新增、编辑、删除、关联组、关联操作权限。 “用户权限支持管理用户的分组、角色、用户权限...” 招标文件第 114-115 页Sheet1 第 79 行 创建用户、用户组、角色,验证功能权限和数据权限隔离 保障系统安全性
OPS-030 系统管理 强制 P1 支持部门、用户、角色、数据字典、群组、岗位、参数配置、第三方账户、分类字典、Logo/登录页背景、常用语、消息列表、消息模板、系统日志等系统基础数据和配置管理。 “系统基础数据,维护部门信息...” 招标文件第 114-115 页 权限配置、用户角色、日志下载、消息模板配置 与用户权限管理配套
OPS-031 采集管理 强制 P1 支持定时任务、监控面板自定义、模板导入导出、主机添加和导入、主机群组、监控模板、指标维护、自动发现、自动分组、自动发现策略。 “支持定时任务...监控面板...模板...主机管理...自动发现” 招标文件第 113 页 新增主机、配置模板、自动发现、策略验证 平台运维配置能力
OPS-032 代理管理 强制 P2 支持跨网、跨地区部署代理,监控数据统一汇总,支持主动式和被动式数据推送。 “支持跨网、跨地区部署代理,监控数据统一汇总” 招标文件第 114 页 部署代理并验证数据汇聚 适合内外网隔离场景
OPS-033 业务系统视图与业务拓扑 强制 P1 支持按业务系统分类、等保级别、网络类型等多维度树状展示,展示业务系统关联资源告警、健康度、影响范围、业务拓扑、时间轴、运维笔记和文档;支持手动创建业务拓扑架构图,显示资源实时状态,支持分块组合和不同品牌型号设备图标自定义。 “支持按业务系统分类...提供手动方式创建业务拓扑架构图” 招标文件第 112 页 建立业务系统视图并绘制业务拓扑,验证资源、告警、健康度联动 建议围绕 HIS/LIS/PACS/EMR 建模

3. 模块化功能清单

模块 功能 对应需求编号 用户/角色 输入 处理 输出 验收点
首页总览 待处理告警、设备总览、告警趋势、网络监控、模块化总览 OPS-001 运维人员/管理者 设备状态、告警状态、网络状态 汇总、趋势分析、模块化展示 首页总览视图 总览数据准确,模块可配置
综合监控 操作系统、服务器硬件、网络设备、安全设备、存储、数据库、中间件、虚拟化统一监控 OPS-002 至 OPS-009 运维中心/专项管理员 主机、设备、数据库、中间件、虚拟化平台连接和指标 纳管、指标采集、状态判断、历史记录 全域资源监控视图 多品牌、多类型资源接入并展示指标
日志与 Trap Syslog、SNMP Trap、Trap 字典、OID 解析、告警关联、Trap 屏蔽 OPS-010 运维/网络管理员 Syslog、Trap、规则、字典、屏蔽策略 采集、解析、规则匹配、关联告警 日志与 Trap 告警视图 日志可读、规则生效、屏蔽可验证
URL 与业务可用性 URL、网页、Web 业务流程、端口、服务、进程、Webservice、调用链、业务日志 OPS-011, OPS-033 应用运维 URL/API、业务系统、端口、服务、日志 可用性探测、链路分析、业务建模 业务可用性和业务健康视图 模拟故障可告警,业务拓扑可联动
动环环境监控 电力、UPS、空调、温湿度、消防、门禁、漏水、有害气体 OPS-012, OPS-023 机房运维 动环设备、传感器、阈值 状态采集、阈值判断、机房关联 动环状态和告警 动环设备状态与机房视图联动
网络拓扑 拓扑展示、全景图、告警点击、设备和链路统计、布局、下载、子拓扑、区域、链路管理 OPS-013 网络管理员 设备、链路、区域、拓扑分组 可视化编排、布局、刷新、统计 网络拓扑图 拓扑可编辑、可查看告警和链路流量
流量分析 应用、协议、会话、流向分析异常检测WAN 监测,实时预警,链路管理,参数配置 OPS-014, OPS-015 网络管理员 链路、流量数据、应用端口、协议、保存周期 流量解析、统计、异常识别、策略配置 流量分析报表和预警 能定位高占用应用/协议/设备/流向
IP 地址管理 子网、网段、IP、MAC、分配/使用/保留状态、分组分层、自动扫描、IP 报表 OPS-016, OPS-017 网络管理员 IP 段、扫描规则、DHCP/地址状态 扫描、分组、统计、生命周期管理 IP 台账和 IP 报表 新 IP 自动发现,冲突和变更可追踪
告警中心 告警降噪、策略、模板、通知、级别、升级、受理、历史、导出 OPS-018 至 OPS-021 值班人员/负责人 指标异常、事件、阈值、通知配置、策略 去重、压缩、屏蔽、升级、派单、记录 告警状态、通知记录、历史告警 告警闭环、升级和多渠道通知可演示
工单管理 手动/自动工单、接单、转交、撤回、挂起、重启、关闭、告警自动派单 OPS-022 运维人员/负责人 告警事件、运维任务、处理人 创建、派单、流转、通知、关闭 工单列表和处理记录 告警自动转工单,工单流转完整
数据中心管理 数据中心层级、机房、楼层、动环集成、机柜接入、集中展示 OPS-023 机房运维 省份、城市、数据中心、楼层、机房、动环设备 层级建模、设备关联、能力展示 数据中心/机房统一视图 多层级数据中心结构可维护
机柜与 U 位 机柜设计、机柜布局、设备位置、U 位占用、设备状态、告警、空间容量 OPS-024 机房运维 机柜、设备、U 位、监控状态 可视化布局、状态绑定、容量计算 机柜图和空间容量视图 设备位置、U 位和剩余空间准确
资产管理 设备新增、删除、空间容量重算、上架规划参考 OPS-025 资产/机房运维 设备资产、机柜空间、变更信息 资产变更、容量计算 资产台账和空间规划结果 设备变更后容量自动更新
知识库管理 分类、知识发布、浏览、附件下载、异常检测点关联、审核、审核日志 OPS-026 运维人员/知识管理员 知识条目、附件、分类、检测点、审核意见 分类管理、发布审核、关联检索 知识库和故障处理参考 异常时可查看关联知识
报表管理 TopN、统计报告、流量统计、故障报告、服务器报表、网络设备报表、导出 OPS-027 管理者/运维 历史指标、告警、设备、时间范围 统计、排序、汇总、导出 运维报表 多类报表可生成并导出
可视化大屏 大屏分组、个人配置、组件组合、状态报告、拓扑、实时告警、接口流量、业务图表、轮播 OPS-028 运维中心/领导 设备、链路、指标、告警、业务状态 可视化编排、动态绑定、轮播展示 运维驾驶舱和专题大屏 多用户配置和轮播生效
用户权限管理 用户、用户组、角色、功能权限、数据权限、停启用、关联组/角色/权限 OPS-029 系统管理员 组织、账号、角色、权限范围 授权、分权、停启用、关联 权限配置结果 功能权限和数据权限隔离
系统管理 部门、用户、角色、字典、群组、岗位、参数、第三方账户、Logo、消息、日志 OPS-030 系统管理员 基础数据、系统参数、消息模板、日志 基础数据维护、参数配置、日志管理 管理后台 权限、日志、消息模板可配置
采集与代理 定时任务、面板模板、主机管理、群组、指标、自动发现、跨网代理、主动/被动推送 OPS-031, OPS-032 平台管理员 主机、模板、策略、代理节点、采集数据 配置、发现、分组、采集、汇总 采集配置和汇总监控数据 自动发现与跨网数据汇聚可验证
业务系统管理 业务分类、等保级别、网络类型、健康度、影响范围、业务拓扑、时间轴、笔记、文档 OPS-033 应用负责人 业务系统、关联资源、告警、文档 建模、关联、健康评估、拓扑编排 业务健康视图和业务拓扑 HIS/LIS/PACS/EMR 可建模