数据中心

  |  手机版

收藏网站

投稿QQ:1745232315

IT专家网,汇聚专业声音 解析IT潮流 IT专家网,汇聚专业声音 解析IT潮流

网络

专家视点在现场环球瞭望
IT专家网 > 数据中心

数据中心流 量监控方法论

作者:匿名出处:论坛2016-05-05 19:29

  数据中心里各种设备是固定死的,但数据是流动的,形成了各种各样四通八达的流量。对数据中心流量进行监控对于业务评估、故障分析、日常运维、扩容等都非常有用,要用好这些数据流量。现在总被提及的大数据、云计算,就是充分利用数据进行商业用途的应用。所以,数据流量对于数据中心非常重要,如何管理好它,并用好它,需要有正确的方法。本文就来说一说数据中心流量监控的几种主流方法,通过利用这些方法可以很好地掌握整个数据中心的流量走向和特征。

  SFLOW SFLOW

  采用数据流随机采样技术,可提供完成的第二层到第四层的流量信息,让用户详细、实时地分析网络传输流的性能、趋势和存在的问题。SFLOW通过设定的采样比采集端口数据,采样比越大,收集的数据量越少,采样比越小,收集的数据量越多越详细。当然,如果采样比设置过小,大量SFLOW报文会冲击网络设备的CPU,很多设备都会扛不住,所以要根据端口数量设置合理的采样比,一般推荐大于10000:1,即端口上每一万个报文里采样一个报文,发向SFLOW的监控设备,这样的采样比是比较安全的数值。SFLOW的缺点也是很明显的,采集的流量在端口流量比较小的情况下,反映网络状况不是很准确,尤其是在端口各种流量比较丰富的情况下,就可能会漏掉部分流量。比如端口受到ARP报文攻击,如果这时端口其它转发流量也比较大,通过SFLOW的监控就很难发现这类攻击,和普通流量相比,ARP攻击报文的数量还是太少,通过万分之一的采样比很难捕捉到这类攻击的异常网络情况。SFLOW的好处是可以看到网络设备各个端口上出入方向流量的具体报文内容,这个报文对于网络分析非常重要。

  SNMP SNMP

  是使用最广泛、最古老的一种网络监控技术,SNMP设计了一些公用节点,管理软件或者网络管理设备可以通过这些公用节点,访问网络设备,从而获取网络设备各个端口上的流量信息,实施监控。当发现端口错误报文比较多,或者流量比较大的时候可以给出自动告警。SNMP需要网络设备支持端口流量节点的处理,当SNMP网管向设备发出端口流量请求时,设备可以很快地将端口流量信息发给网管。SNMP可以掌握网络设备所有端口的流量大小和主要特征(比如是单播、多播还是广播),但对报文内容无法获知。还有对于端口数量比较多的高端网络设备,SNMP轮询一次设备上的所有端口就要花费几十秒的时间,如果每次轮询的时间都设置得很小,网络设备就会一直在处理SNMP的请求,设备性能会受到很大影响。设置过大,流量的实时性又得不到保证。一般SNMP会设置获取流量的时间间隔在三分钟或者五分钟,绝大多数的网络设备都能承受得住(现在网络设备都支持虚拟化,有的支持四框,有的甚至支持10框,这样一个虚拟化设备拥有的端口数量轻松上千,这给SNMP带来不小的挑战,需要网络设备的CPU处理能力很强才行)。

  Netstream Netstream

  可以提供报文统计功能,可以对网络设备每个端口上出入方向的报文流量进行统计,区分源和目的IP地址、源和目的端口号、协议号等。根据设定的老化时间,对一定时间内的流量进行统计。通过Netstream可以看到老化时间周期内,端口上的所有流量的特征,这对于分析问题特别有用。Netstream收集的流量可以在网络设备上直接显示,也可以发向流量采集装置,把统计数据收集到数据库中,以便对数据进行进一步的过滤和聚合。不过,Netstream也无法看到流量报文的全貌,只具有流量统计的功能,可以很快掌握网络中都有哪些类型、哪些地址的访问流量,但是并不知道这些报文更详细的内容。并不是所有的网络设备都能支持Netstream,Netstream对网络设备性能要求较高,一般只有在高端网络设备上才实现,需要转发芯片支持才可以,同时还要求CPU的处理能力较强,如果老化的时间设置得比较长,需要CPU能够处理大量的Netstream报文统计。市面上还有单独的专门做Netstream的网络设备,这类设备只做流量分析一件事,这样设备的Netstream处理能力最强。

  Mirror Mirror

  镜像是一种应用非常广泛的流量监控功能,包括端口镜像、流镜像、远程镜像、基于VLAN的镜像等,镜像不仅可以看到具体的流量内容,还可以根据自己需要对特定流量进行镜像。不过镜像流量本身要占用网络设备内部的带宽,如果镜像的端口数量过多,会导致镜像流量占用过多的网络设备内部带宽,造成业务异常,所以镜像功能虽好,但不要使用过度。Mirror会滤去物理层错误,影响某些类型的分析,同时还可能改变数据报文交互时序变更响应时间,镜像数据的优先级也比正常端口之间的数据优先级低。有些数据中心业务非常重要,为了消除镜像带来的影响,避免镜像流量的不准确,往往可以在原有网络基础上再增加一套监控网络设备,这个监控设备专门做镜像流量的转发,就可以解决镜像流量过大的问题,也避免暴露了镜像技术的缺陷。

  经过以上介绍,相信大家对数据中心流量监控的方法已经掌握,这几种方法各有各的特点,也各自有使用上的缺陷,适用于不同的数据中心用户。这几种方法均在数据中心中有广泛应用,这几种方法不是互斥的,在同一个数据中心里可以同时部署多个流量监控方法,几种方法可以共用。掌握好这些流量监控方法,对于数据中心开展各项运维工作和故障事后分析都非常有帮助,充分利用这些流量监控技术,可大幅提升数据中心的运营效率。

相关文章

关键词:数据中心 , 流量监控 , SFLOW SFLOW ,大数据

责任编辑:杨爽

网警备案