SYS PRACTICE 系统实践 云计算环境下的分布存储技木分析 ◆刘岩 摘要:云计算服务提供通用的通过浏览器访问的在线商业应用,为用户提供 个可配置的能够共享基础资源的计算模式,将海量的软件和数据存储在数据中 心中,并为上层应用提供安全可靠的计算服务和数据存储,本文将以提高云计算 环境下存储技术的容错性、可扩展性以及降低能耗等为目标,对云计算环境下分 一布的存储技术进行分析。 关键词:云计算;分布存储;数据中心 云计算的核心基础设施是由上百万级节点组成的数据 中心,存储在数据中心上的数据规模往往达 ̄IJpB级甚至EB 构,利用交换机将数据中心的各个服务器连接起来,构成层次 式的分成边缘层、聚合层和核心层三层树型结构。交换机负责 连接服务器的同时也负责数据包的转发。这种以交换机为中心 的树型结构操作简单方便,但灵活性差,下层的服务器只负责 存储和处理数据,不需要占用CPu资源,利用率低。 ’(二)以服务器为中心的结构。这种结构没有利用交换 级,这种庞大的数据存储规模容易导致数据失误。这种失误 会增加云计算成本的同时,也会给云计算的推广和应用带来 很大的。因此,怎样加强云计算环境下分布存储技术的 研究,成为当今商业界和学术界关注的重要话题。 一、云计算环境下分布的存储技术的关键技术 机进行数据转发,这个数据转发的责任就落到了服务器的身 上,因为,服务器不仅要存储和处理数据,还要进行数据包的 转发。这种以服务器为中心的结构线路连接和结构组成比较方 (一)容错性。以前通过高性能服务器和专用的存储设 备或者RAID技术等来提高容错性,但这种方法的成本都太 高,云计算提供商的利润降低,加上庞大的数据量和节点规 模,大大提高了数据失效的概率,在云计算环境下,数据失 效已经成为一种常态。这种容易产生错误的行为会给云计算 服务提供商和客户都带来巨大的损失,因此,这一问题必须 得到解决。 便,可以使服务器与底层的网络进行交互,但是,由于没有交 换机,该结构存在较多的链路冗余,服务器的负担过重,导致 服务器的整体计算效率降低和性能损失,增加运行成本。 (三)混合结构。混合结构就是以交换机为中心的结构 与服务器为中心的结构的混合体,利用交换机做服务器连接 的节点,在服务器中安装多个网卡,同时运用交换机和服务 器提供数据的路由转发功能,这样服务器就能参与到数据包 的转发功能中来,但是需要占用CPU资源。利用这种混合结 构更加灵活地运用于特定场景的网络结构,在相同条件下成 本更低。 (二)可扩展性。以前以个人计算机为主的数据存储方 式中,提高自身的可扩展性的方式主要是通过一个预留的磁盘 来实现其可扩展性的目的的,这种方式在以前的数据量上是够 用的,但在数据量大增的今天,云计算数据中心的数据量非常 的庞大,无论哪一个供应商提供的传统存储方式都无法满足当 今的数据存储要求,由此可见,数据中心的存储硬件和组织结 构要求必须有非常好的可扩展性,只有这样,才能让磁能不断 结语 云计算在商业计算和科学计算领域都得到广泛的应用。 而数据中心作为云计算的基础,需要解决当下海量数据环境 下分布存储遇到的容错性、可扩展性以及低成本等方面的问 地适应数据存储的新要求,从而满足客户的需要。 (二三)成本控制。传统的分布存储的节点和数据的规模 都比较小,对能耗的要求比较低,因而成本比较低。随着云 计算环境下的分布存储的数据越来越多,规模越来越大,应 用范围越来越广,能耗的开销也越来越大。在散热、制冷设 备的投入也越来越多,对于成本的控制成为商家一个非常棘 手的问题。降低能耗不仅能延长硬件设备的寿命,而且还可 以为商家提供一个获利的手段,属于低碳生活的生活理念, 保护环境,为商品提供了一个新卖点。 题,因此,数据中心物理网络拓扑的建构技术仍有待研究。 提高云计算环境下的分别存储的容错性,发展节能技术降低 能耗,运用各方面的技术,构建一个可扩展性良好、容错性 强和成本低的分布存储数据中心。当然,在云计算环境下构 建一个先进的分布存储数据中心还是有很大难度的,这就为 未来的研究提供了方向。 参考文献 [1]郑纬民云计算的大幕已经拉开口]中国计算机学会通讯,2009,5(6),6— 7. 帅 二、云计算环境下分布存储技术的结构的分析 与比较 (一)以交换机为中心的结构。以交换机为中心的结 [2]刘鹏.云计算的定义和特点.中国云计算[EB/OL].2009 (作者单位:中国石油大港油田信息中心) 信息系统I2程l 20141.20 33