导论

INTRODUCTION

随着社会对信息存储需求的不断加速,使得存储容量飞速增长,网络存储作为一种广泛的服务,用户除了对其要求提供海量储存容量外,还对包括数据访问性能、数据传输性能、数据管理能力、存储扩展能力、数据安全性等多个方面提出要求。存储技术的水平逐渐成为一种可量化的,影响系统和网络性能的关键因素,它的优劣直接影响到整个系统能否正常运行。因此,近年来存储行业逐渐成为IT业界最热门的领域之一。

为了让读者尽快熟悉网络存储技术,本栏目将简要介绍网络存储的基础知识,以及几种常见的存储结构及其发展趋势。

一、网络存储技术概述

存储是一种为数据提供稳定、非易失、可靠的保存数据的基础设施的总称。而网络存储技术,就是以互联网为载体实现数据的传输与存储,它采用面向网络的存储体系结构,使数据处理和数据存储分离。它通过网络连接服务器和存储资源,消除了不同存储设备和服务器之间的连接障碍;提高了数据的共享性、可用性、可扩展性和管理性。

有个比喻形象的说明了网络存储的作用,如果把有用的数据信息比作电,那么网络存储就是电站,电站的作用就是保证用户在需要用电的时候,随时打开电闸就有洁净的、充足的电力输出,用户即不用理会电力来自水力发电还是风力发电,也无需考虑经过了怎样的变电和传输处理,只管用电就行。

目前网络存储架构中,普遍使用的有直连式存储(Direct Attached Storage,DAS)、网络附属存储(Network Attached Storage,NAS)、存储区域网络(Storage Area Network,SAN)和iSCSI(Internet SmaII Computer System Interface)。这几种网络存储方式特点各异,应用在不同的领域,下面我们来一一介绍并分析个中区别。

(一)直连式存储(DAS)

直连式存储是指服务器主机与网络存储之间通过通信线缆直连,实现数据存取。直连式存储部署方式分为内置存储和外置存储。

1.内置存储

内置存储就是将存储设备(通常是磁盘)与服务器其他硬件直接安装在同一个机箱内,且该存储设备被服务器独占使用。当前被广泛使用的超融合云一体机就是典型的内置存储方式,它将服务器虚拟化、网络虚拟化、存储虚拟化纳入管理平台统一管理,实现企业私有云的超融合基础架构的交付。超融合服务器如图0-1所示。

图0-1 超融合服务器

2.外置存储

外置存储就是将存储设备从服务器中独立出来,存储设备通过电缆或光缆直接连接到服务器,I/O(Input/Output,输入/输出)请求直接发送到存储设备,DAS 依靠服务器进行工作,其本身只是硬件的堆叠,而没有操作系统。

外置存储必须依赖服务器主机操作系统进行数据的IO读写和存储维护管理,所以数据备份和恢复都会占用服务器主机资源(包括 CPU、系统 IO 等),外置存储与服务器主机之间的连接通道通常采用SCSI(SmaII Computer System Interface,小型计算机系统接口)连接,当前最高带宽为640MB/s。当终端连接数量增加时,总线会成为数据传输的瓶颈,严重影响到整个系统的正常工作。因此,这种存储方式不能适应较高的存储要求。

3.DAS的特点

DAS 存储体系结构是以服务器为中心,各种存储设备通过总线与服务器连接,终端对数据进行访问时,必须经过服务器才能与存储设备通信,因此,服务器就是一个数据转发器。

4.DAS的优点

(1)能实现大容量存储。它可以将多个磁盘合并成一个大容量的逻辑磁盘,满足海量存储的需求。

(2)实现了应用数据和操作系统的分离。操作系统一般存放主机硬盘中,而应用数据放置于存储的磁盘阵列中。

(3)提高存取性能。通过磁盘阵列,同时可以有多个物理磁盘在并行工作,I/O速度远高于单个磁盘的运行速度,可以较好的响应高I/O服务业务的需求。

(4)实施简单。DAS无须专业人员操作和维护,节省用户投资。

5.DAS的缺点

(1)随着服务器CPU的处理能力越来越强,存储硬盘空间越来越大,阵列的硬盘数量越来越多,SCSI通道已成为I/O瓶颈。

(2)服务器主机SCSI ID资源有限,能够建立的SCSI通道连接有限。

(3)数据中心的多台服务器都在使用DAS时,冗余的存储空间不能在服务器之间动态分配,造成存储资源浪费。

(4)面对不同操作系统的服务器的 DAS,网络管理员在数据共享和数据备份等应用中操作复杂,导致维护成本较高。

(5)当服务器发生故障时,数据不可访问。

6.DAS的适用环境

无论直连式存储还是服务器主机从一台扩展为多台服务器组成的群集(CIuster),又或是存储阵列容量的扩展,都存在业务系统停机的可能,从而给企业带来经济损失的风险,这对于银行、电信等行业的7×24小时服务的关键业务系统,这是不可接受的。因此,DAS 常应用于以下环境:

(1)企业仅有若干台服务器,且数据中心投资较少的非关键业务系统。

(2)存储系统必须被直接连接到应用服务器上时。

(3)服务器在地理分布上很分散,通过SAN(存储区域网络)或NAS(网络直接存储)在它们之间进行互连非常困难时。

(二)网络附属存储(NAS)

NAS 是在局域网(LAN)上,以文件为单元,进行数据存取,也就是说利用网络文件系统、TCP/IP、以太网络设施,实现数据存取。NAS存储服务基于TCP/IP网络进行数据交换,并采用业界标准文件共享协议(如NFS、HTTP、CIFS)提供文件级别的访问,并支持Windows、Linux、Mac 等操作系统的访问。它为异构平台使用统一存储系统提供了解决方案。NAS 网络拓扑如图0-2所示。

图0-2 NAS网络拓扑图

1.NAS的优点

(1)异构平台下的文件共享,支持Windows、Linux、Mac等客户端。

(2)NAS 只需要在一个基本的磁盘阵列柜外增加一套文件服务管理系统,容易部署,使用和管理都很方便。

(3)较低的拥有成本。以太网是目前绝大部分用户都采用的局域网络技术,NAS 模式可以充分利用用户现有的局域网络设施,大大节省了用户在存储上的投资。

2.NAS的缺点

(1)NAS需要占用LAN带宽,由于存储数据通过普通数据网络传输,因此易受网络上其它流量的影响,当网络上有其它大数据的流量时会严重影响系统性能。

(2)NAS是在TCP/IP技术上,以文件为单元进行传输,TCP/IP在帧传输时的丢包,也限制了NAS的速度,甚至威胁到数据的唯一性和数据安全。

(3)在文件访问的速度方面,NAS 采用的是文件 I/O 方式。文件的 I/O 请求先经过整个TCP/IP协议栈封装,再经过网络传输,再对存储设备进行读写。数据取出来之后要经过类似的与之相反的过程,这带来巨大的网络处理开销,因此NAS的文件访问速度相对SAN而言较低,不适合对访问速度要求高的应用场合,如数据库应用、在线事务处理等。

3.NAS的适用环境

NAS 系统去掉了通用服务器所具备的大多数计算功能,仅提供文件系统功能,用于存储服务。因此,NAS 将网络文件服务器、硬件、软件集合起来,提供高可靠、高可用的文件存储解决方案。

由于目前大部分的数据都是基于关系型数据库进行存储的,关系型数据库在操作上,需要实时高速的数据读取和存储,一般数据库都采用“块”(BIock)的方式进行数据传输,所以 NAS不适合数据库应用,仅适合于文件存储。

(三)存储区域网络(SAN)

SAN 是通过专用高速网络将网络存储设备和服务器连接起来的存储系统,实现服务器对网络存储的块级访问,提供高质量的数据块级存储服务。

SAN采用Fibre ChanneI协议构建的专用于存储的网络,依托光纤通道为服务器和存储设备之间的连接提供高吞吐能力。在传输端,光纤通道当前可提供最高100G的带宽,在存储端,SAN存储可以整合不同的存储设备形成一个统一的存储池为服务器提供服务。在SAN技术中,服务器和存储设备相分离,存储设备和SAN中的应用服务器之间采用BIock I/O的方式进行数据交换,两者的扩展可以独立进行。SAN存储网络拓扑如图0-3所示。

图0-3 SAN存储网络拓扑

1.SAN的特点

(1)高速存取。目前光纤通道最高可提供100Gbit/s的带宽;

(2)集中存储和管理。通过整合各种不同的存储设备形成一个统一的存储池,向用户提供服务。

(3)可扩展性。存储端和服务器端相对独立,双方可独立升级拓展,业务不中断。

(4)高可用的数据。SAN 存储可以同时为多台服务器提供服务,服务器单点故障不会对数据访问照成影响。

(5)存储数据备份采用专用光纤网络,不占用业务应用的带宽。

2.SAN的缺点

(1)建设成本高。SAN网络需要建设高带宽,高可用的光纤网络,建设成本较高。

(2)维护成本高。SAN网络架构相对复杂,对维护人员要求较高。

(3)异地扩展困难。由于需要单独建立光纤网络,两个IDC距离较远时,建设困难。

3.SAN的适用环境

由于SAN的建设成本高,管理和维护相对复杂,目前主要应用在大型企业的数据中心,用于实现海量数据存储和关键业务数据支撑,主要客户有电信、银行、电子政务等的信息中心。

(四)iSCSI存储

iSCSI(Internet SCSI)是2003年IETF(InternetEngineering Task Force,互联网工程任务组)制订的一项标准,用于将SCSI数据块映射成以太网数据包。SCSI(SmaII Computer System Interface)是块数据传输协议,在存储行业广泛应用,是存储设备最基本的标准协议。

iSCSI(Internet SCSI)通过在IP网络中封装SCSI 命令,让服务器通过IP网络连接到SAN存储,实现服务器对网络存储的块级访问,iSCSI存储网络拓扑如图0-4所示。

图0-4 iSCSI存储网络拓扑

近几年,随着企业园区网和互联网带宽的快速增长,iSCSI存储技术也得到了快速发展。iSCSI最大的优势就是能够依托现有的网络基础设施实现网络存储的块级访问,其性能和带宽虽然和SAN的光纤网络还有一些差距,但能节省企业约30%~40%的成本。

1.iSCSI的优点

(1)硬件成本低。构建iSCSI存储网络,除了存储设备外,交换机、线缆、接口卡都是标准的以太网配件,价格相对来说比较低廉。同时,iSCSI还可以在现有的网络上直接安装,并不需要更改企业的网络架构,这样可以最大程度地节约投入。

(2)操作简单,维护方便。对iSCSI存储网络的管理,实际上就是对以太网设备的管理,iSCSI减少了配置、维护、管理的复杂度,企业现有的网络管理人员就可以完成日常的管理与维护工作。

(3)带宽和性能。SCSI 存储网络的访问带宽依赖以太网带宽,随着千兆以太网的普及和万兆以太网的应用,iSCSI存储网络会达到甚至超过SAN存储网络的带宽和性能。

(4)突破距离限制。因为是基于 IP 网络的存储系统,所以只要网络带宽支持,没有距离限制。

2.iSCSI的缺点

(1)iSCSI通过普通网卡存取iSCSI数据时,解码成SCSI需要CPU进行运算,增加了系统性能开销,如果采用专门的iSCSI网卡虽然可以减少系统性能开销,但会大大增加成本。

(2)使用数据网络进行存取,存取速度冗余受网络运行状况的影响。

3.iSCSI的适用场景

使用SAN的成本很高,而利用普通的数据网来传输SCSI数据,实现与SAN相似的功能则可以大大的降低成本,同时提高系统的灵活性。iSCSI 就是这样一种技术,它利用 TCP/IP 来传输本来用存储区域网来传输的SCSI数据块。iSCSI的成本相对SAN来说要低不少。

因此,iSCSI 具有低廉、开放、大容量、传输速度高、兼容、安全等诸多优点,其优越的性能使其自发布之始便受到市场的关注与青睐,其必将成为网络存储领域内的核心技术之一。

目前看来iSCSI最适合需要在网络上存储和传输大量数据的机构,如ISP-互联网服务提供商、SSP-存储服务提供商、需要远程数据复制和灾难恢复的机构、IT 资源、基础设施和预算均十分有限的机构等。

二、存储的发展趋势

实际上,只有真正开放的存储网络才是计算机产业发展的潮流。正像SCSI技术和Ethernet技术的发展所走过的道路,网络存储最终将实现不同主机和不同存储设备间真正意义上的资源共享,就如同自来水和电力等公共资源一样。而企业的管理者将是这一目标的最大受益者,它将充分享受科学技术带来的巨大收益。存储系统将有机地融为一体,存储空间将变得十分广阔,充分体现信息对企业的价值。

接下来将简要介绍虚拟存储和云存储这两种网络存储新技术。

1.虚拟存储

所谓虚拟存储,就是把内存与外存有机的结合起来使用,从而得到一个容量很大的“内存”。以存储网络为中心的存储解决不了全部的数据存储问题,如存储资源共享、数据共享、数据融合等。不少先进存储系统的倡导者都提出,存储作为一种资源,应该像我们日常生活中的自来水和电力一样,随时可以方便的存取和使用,这就是存储公用设施模型,也是网络存储的发展目标。实现存储公用设施模型的关键就是在网络存储基础上实现统一虚拟存储系统。目前存储技术还处于存储网络阶段,虚拟存储才刚刚起步。

2.云存储

云存储是在云计算(CIoud Computing)概念上延伸和发展出来的一个新的概念。云计算基于分布式处理(Distributed Computing)、并行处理(ParaIIeI Computing)和网格计算(Grid Computing),透过网络将庞大的计算处理程序自动分拆成无数个较小的子程序,再交由多部服务器所组成的庞大系统经计算分析之后将处理结果回传给用户。

云存储的概念与云计算类似,它是指通过集群应用、网格技术或分布式文件系统等功能,将网络中大量不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。云存储的核心是应用软件与存储设备相结合,通过应用软件来实现存储设备向存储服务的转变。

云存储对使用者来讲,不是指某一个具体的设备,而是指一个由许许多多存储设备和服务器所构成的集合体。用户使用云存储,并不是使用某一个存储设备,而是使用整个云存储系统带来的一种数据访问服务。所以严格来讲,云存储不是存储,而是一种服务。

3.小结

数据的重要性越来越得到人们的广泛认同,未来网络的核心将是数据,网络化存储正是数据存储的一个发展方向。目前网络存储技术沿着三个主要的方向发展:NAS、SAN、IP—SAN。由于SAN和NAS的融合将更有利于数据的存储和备份,因此,SAN和NAS的融合、统一虚拟存储技术是未来网络存储技术发展的两个趋势。