基于SAN架构的密云卫星地面站网络存储系统设计与实现 下载本文

龙源期刊网 http://www.qikan.com.cn

基于SAN架构的密云卫星地面站网络存储系统设计与实现

作者:薛喜平 苏彦 朱新颖

来源:《电子技术与软件工程》2015年第20期

摘 要

针对密云卫星地面站大数据量、多平台的需求,分析了流行的存储技术DAS、NAS和SAN,并比较三者的差异。比较结果表明,SAN是密云卫星地面站网络存储方案的最佳选择。从体系结构和可靠性两方面进行分析SAN技术的优越性,以此研究为基础,从密云地面站实际需求出发,设计了一套SAN存储系统解决方案,并在探月工程嫦娥三号任务中投入建设运行。经过2年的运行表明,本文设计的网络存储系统解决方案在系统可靠性、系统容量、吞吐率和响应速度等方面均满足设计要求。

【关键词】卫星地面站 网络存储 SAN架构 可靠性分析 1 引言

密云卫星地面站是探月工程地面应用系统的一个卫星数据接收站,承担着接收嫦娥卫星下行科学数据并本地存储数据的任务。密云站主要完成探测任务管理,卫星探测数据的接收与存储管理功能,同时为用户提供全面的、集中的站内数据接收设备监视与控制功能。因此,密云地面站不仅要存储卫星下行的科学数据,还要存储地面站每一秒种记录的设备监视信息、控制信息和日志信息。在嫦娥三号任务建设阶段,密云地面站充分考虑到国家未来深空探测任务的增加以及观测接收科学数据的增加,现有的存储设备以及存储方案已经不能满足需要。因此,统筹考虑建设一个适应密云地面站未来发展的网络存储系统势在必行,也获得了国家探月工程专项资金的支持,研究人员于2011年开始调研与设计网络存储方案。 2 网络存储技术比较分析

目前,网络存储技术的发展科归纳为3个方向:直接连接存储(DAS,Direct Attached Storage)、网络附接存储(NAS,Network Attached Storage)和存储区域网络(SAN,Storage Area Networks)。

DAS是传统的存储方式,服务器后端连接着SCSI阵列,该磁盘阵列附属于一台服务器,不支持其他服务器共享存储。随着数据量的不断增大,逐渐暴露出诸多弊端,如存储空间得不到合理利用、数据分散不易管理、存储架构得不到扩展等。

龙源期刊网 http://www.qikan.com.cn

NAS是一种特殊的专用数据存储服务器,是可以直接连接到网上向用户提供文件级服务的存储设备,NAS有自己的简化的实时操作系统,它将硬件和软件有机地集成在一起,通常用于专用文件服务。NAS采用的数据传输协议为NFS和CIFS。由于,其数据传输需要通过普通网络,受到网络带宽的限制,传输效率不能得到保证。

SAN是继NAS之后出现的一种新的网络存储技术。主要思路是通过专用的交换机和网关建立服务器与磁盘阵列的直接连接,从传统的以太网中独立了出来,成为独立的存储区域网络,将原有以太网上的存储事务转换到主要由存储设备组成的SAN网络上。SAN取代服务器完成整个存储过程的控制和管理,减少了对服务器处理时间的占用,提高了服务器的使用效率。FC SAN是以光纤通道技术(FC)为基础,可以提供高达4Gb/s的传输速率,解决了NAS数据访问对网络带宽占用的问题,数据的访问不影响LAN的性能,在有大量数据访问时,不会大幅度降低正常网络性能。而随着数据爆炸式的发展,SAN是人们公认的具有发展潜力的存储技术解决方案。

根据上述研究内容分析,了解当前流行的网络存储技术的各自优势。从地面站网络存储系统关注的性能指标出发进行讨论研究,就以下项目对前三种网络存储技术进行比较,比较结果见表1。

从比较结果看出,SAN网络存储技术具有高带宽,易扩展、高可用、可靠以及安全高等品质性能,是密云地面站网络存储系统建设方案的首选。同时,大量资料表明,SAN也成为多媒体信息流存储、大数据量的快速网络存储、数据仓库以及决策支持等应用领域中较理想的存储方案。

3 SAN存储技术概述 3.1 FC SAN体系结构

FC SAN是通过光纤通道技术连接服务器、磁盘阵列、磁带库等存储设备的高性能专用网络。FC SAN的典型体系结构如图1所示,大致可以分为4个层次,从下到上的顺序依次为存储设备、交换设备、应用设备和LAN。 3.2 FC SAN架构可靠性分析

可靠性是指部件、元件、产品或者系统在规定的环境下、规定的时间内、规定条件下无故障地完成其规定功能的概率。本文利用可靠性R指标,对SAN架构进行可靠性计算。 在图1中,为了方便讨论,假设LAN和电源等其他系统的可靠性为1,假设某一个应用设备通过单条数据链路的可靠性概率为Pi。从应用设备到存储设备,根据数据交换的逻辑过程知道,在某1条数据链路中,1台应用设备通过1台交换机就能够访问到一套存储设备,是典型的串联关系模型;在整个系统中,1台应用设备可以通过2台交换机访问存储层中2套存储设备,可以看作是并联关系,共有4条数据链路。串联关系和并联关系在概率论和可靠性理论

龙源期刊网 http://www.qikan.com.cn

中具有严格的数学定义。就目前产品市场而言,单个设备的可靠性Tj一般高于0.9,假设Tj=0.9(j=1,2,3),在图1中一条链路由3个设备串联,系统可靠性概率计算公式为Pi=T1T2T3=0.93=0.729(i=1,2,3,4);多条链路并联的后的系统可靠性概率为:R=1-(1-P1)(1-P2)(1-P3)(1-P4)=1-(1-0.729)4=0.994。 表2:SAN架构的并联与串联关系模型可靠性计算分析 单个设备可靠性 串联可靠性 并联可靠性 Tj =0.9 Pi=0.729 R=0.994 Tj =0.8 Pi=0.512 R=0.943 Tj =0.7 Pi=0.343 R=0.813

上述计算结果表明,当单个设备可靠性Tj大于0.9时,系统整个可靠性概率R大于0.99。SAN架构的并联关系模型可靠性极高,远远高于单条数据链路的串联关系模型。随着时间的推移,单台设备的可靠性逐渐下降,两种模型的可靠性差异越来越大,并联模型的可靠性优势越发明显。因此,密云站在设计存储方案时首选采用FC SAN架构的并联关系模型。 4 密云卫星地面站网络存储系统设计 4.1 系统需求分析

密云卫星地面站主要完成卫星探测数据的接收与存储管理功能,同时为用户提供全面的、集中的站内数据接收设备监视与控制功能。密云站不仅要存储卫星下行的科学数据,还要存储地面站监视信息和控制信息。

在探月工程嫦娥三号任务设计中,密云站计算机系统由6台业务运行服务器(IBM)、4台应用工作站以及存储系统构成。6台业务运行服务器采用的是AIX6.0操作系统,要求均能独立访问共享存储系统;同时4台应用工作站采用的是Windows7专业版操作系统,也要独立访问共享存储系统。因此,在设计存储系统时要求采用的共享文件系统必须支持异构多操作系统。

设计中,LAN中6台业务运行服务器和4台工作站需要同时向磁盘写入16路科学数据,每一路科学数据的最大传输速率可达15MB/s,因此要求存储系统的吞吐率不小于240MB/s。同时,每一路写入的科学数据文件的最大容量可达810GB,要求存储系统支持大文件的读写。同时,系统数据库记录的设备监视信息、控制信息以及站内日志信息,要求做到实时记录与定期转存,也是一个不可忽视的数据量,平均每月增长几个GB。