二十一世纪高速网络下之网管- 异常流量分析与网络性能管理 (一)
迈入二十一世纪﹐网络与一般人的日常生活息息相关﹐从电子邮件、个人网页、入口网站等﹐更
改变了人们过去的生活方式与习惯。在这个地球村里﹐因为有了网络人们之间的距离不再那么遥远,信息传播速度也加快不少。同样的,企业透过网络提高了工作效率与生产力。随着全球化的脚步逐渐加快﹐网络的重要性也与日俱增﹔如何有效管理网络也成为了企业内重要的管理课题。
迈向高速网络时代﹐随着网络带宽增加与各种不同网络应用程序的使用﹐企业对网络管理也越来
越重视﹔网管已经不再是口号﹐而是企业必须审慎面对的挑战。一般来说﹐根据网络建置的顺序﹐网管分为四个阶段﹕
网络管理的四个层次
第一阶段为网元管理(Element Management)﹕企业建置网络时﹐首先会面对构成网络基本设备﹐
这些设备包括了计算机、路由器、交换机等﹔在这阶段所进行管理工作包括网络设备的安装、设定与维护﹐利用一台中央服务器来管理企业内分散之计算机、路由器与交换机,主要目的为让使用者能使用网络上资源﹐这也是网管最基本的要求;CiscoWorks则是大家最耳熟能详与常用的设备管理系统。
第二阶段为运行管理(Operations Management)﹕运行管理包括了拓朴管理、资产管理、故障管
理、事件管理、除错与告警等﹐主要目的是让网络能够正常运作﹐当有问题发生时能通知相关人员来解决﹐此一阶段主要管理设备各界面是否正常运作,当有故障发生时,系统可以立即发出报警;另外,运行管理也包括了对异常流量之告警与提供除错的工具,如实时监控与协议分析等;此类代表性系统如HP OpenView、IBM Tivoli等。
第三阶段为性能/服务管理(Performance/Service Management)﹕当网络建置完成并顺利运作后
﹐就进入性能与服务管理阶段﹐性能管理涵盖了网络分析监控、应用分析监控、带宽规划、故障排除、
错误管理与服务等级管理等﹐其目的在于维持网络传输之品质与网络应用系统与服务能运行顺畅﹐除了显示实时流量信息外,还进行长时间之流量收集、分析与统计,提供管理人员带宽规划与趋势分析报告,并可以针对不同应用系统与服务之响应时间进行监测与统计,提供服务等级管理;此类代表性系统为NetScout nGenius。
第四阶段为业务管理(Business Management):业务管理包括了业务服务、业务影响分析、应用
仿真测试等。此一阶段代表了企业在实施新的业务时﹐如何预先从不同层面去分析新业务上线后对现有网络环境所造成的影响与所带来之效益;例如,当一家银行推出了网上银行业务时﹐需要重新评估依照现有设备及网络架构是否可以承载新业务所带来的网络流量与服务器工作量﹐藉此评估如何实施此业务,并提供企业未来之整体业务与服务蓝图。
目前在国内大部分的大型企业已经完成了设备管理﹐而金融业与电信业也有部分企业完成了运行
管理之系统建置。相较而言﹐欧美企业大都处在性能管理与业务管理阶段﹐而国内企业仍有很大空间去加强网络管理。目前在企业管理网络时普遍遭遇到以下问题﹕
网络可视性﹕ ?
知道网络的利用率﹐但不知道是什么应用程序在网络上运行﹖主要用户有哪些﹖
? 对于日趋重要的多媒体应用,如VoIP、视频会议等进行有效的监控和管理,以确保服务等
级﹔
? ? ?
遭遇到由于病毒或黑客引起的流量暴涨而导致网络严重拥塞﹔ 网络带宽规划没有长期统计数据来预测其网络使用趋势﹔ 网络需要优化,但是需要提出具体的统计资料来支持相关决策﹔
应用性能﹕ ?
当用户抱怨应用性能降低时﹐到底是服务器负载太高而处理慢呢﹖还是网络拥塞传输慢呢﹖
如何维持企业内重要应用与服务的性能呢﹖
无法提供详细之网络管理报表﹐包括各局域网与广域网之流量分析与应用服务器之性能状况﹔如:IP地址、应用层响应时间及协议分布等﹔
? ?
故障排除与错误管理﹕ ? ?
每天都有新的病毒出现﹐要如何在病毒肆虐前发现中毒征兆呢? 业务网,办公网或Internet带宽被个别用户占用,如何找出凶手呢﹖
? 网络出现异常流量时﹐如何找出原因并解决问题呢﹖
从这些网络管理所面临的问题来看,我们企业已经需要一个有效的性能管理系统来帮助排除这些
网络上的盲点,例如流量分析工具可以让管理人员了解更详细的网络使用情形,包括了网络上的主要用户与应用列表,网络电话品质的监控与用户使用统计资料,并可以主动发现异常流量,判断是否为黑客入侵或是病毒散播等;应用程序响应时间测量与监控可以让企业内重要之业务,如银行之网上银行业务、电信业之计费系统、制造业之ERP与PDM等运行顺畅;解决这些问题的根本之道在于有没有一个好的性能管理工具可以利用,这也是建置性能管理系统的开始。所谓的工欲善其事,必先利其器,有效的性能管理系统可以帮助网络管理人员更了解企业内部网络之运行状况,也能加强故障的管理及排障能力。
我们从欧美在网络管理经验可以知道性能管理在整个网管中是非常重要的一环。随着网络业务与
应用系统大量快速增加,网络性能变成在企业管理上一个策略性之标的,提高网络性能才能让这些新的业务与应用发挥其效益,包括提高服务品质与效率、减少错误发生、减低成本、提高竞争力。我们以美国一些全球性的金融服务业为例,他们目前正在实施企业内部之网络使用计费系统(UBB,Usage Based Billing),计费系统让企业各部门分担了网络建置投资与维护成本,员工能更珍惜网络带宽使用,保障重要之应用系统能维持好的效能,减少网络中断或是品质下降所造成之损失,并且可以长期分析网络使用行为模式,做为网络优化之基础。
谈了这么多性能管理之优点与实行的需要,那么性能管理究竟包括了哪些范围呢?首先我们就性
能管理之资料来源来看,与设备管理与运行管理不同的是,性能管理之资料来源主要来自网络流量,这些流量可能来自内部网络(Intranet)或是广域网(Internet),最普遍的收集流量的方法为放置探针(Probe)来监控网络,探针是一个硬件收集器,利用不同界面架设在内部网络或广域网上,以旁路分接方式利用Y形缆线或是Tap,将流量复制到探针中进行译码、分析与统计,另外也可利用交换机镜像功能将流量复制到探针。探针将流量归纳为下列七大类资料:
1. 2. 3. 4. 5. 6. 7.
统计(Statistic):包括网络利用率与吞吐量、协议分布、包大小、广播包比例; 主机(Host):网络层与应用层主机IP地址列表; 通信对(Conversations):网络层与应用层通信对列表; 告警(Alarm):针对各种异常现象之自动报警; 响应时延(Response Time):应用程序及服务响应时延; 误码(Errors):误码种类、错误率; 数据包档案(Trace):原始数据包资料;