关于存储技术的入门科普

说到 “存储”,朋友们会想到甚么?

是这个?

或是这个?

又大概是这个?

哈哈,没错,咱们当今处于消息时代,每天都在和计算机、手机打交道。咱们的工作和生活,曾经彻底离不开视频、音乐、图片、文本、表格如许的数据文件。

而全部这些数据文件,都需要经历电子装备进行留存,这即是数据存储,简称存储。

▉存储的根基载体——硬盘

对于一般用户来说,非常多见的存储装备,即是硬盘。

咱们晓得,计较机的三大焦点硬件,划分是 CPU(中间处理器)、内存(Memory)和硬盘(Hard Disk)。CPU 负责运算,硬盘负责存储。而内存,是 CPU 和硬盘之间的桥梁。用于暂时寄放 CPU 中的运算数据。

CPU、内存、硬盘

绝大片面的台式机、服务器、手机,都是内置存储体系。也即是说,它们的硬盘安置在装备内部。

以一般台式机为例,硬盘经历专用接口和数据线,连接在主板上,实现和 CPU、内存的数据连接。

台式机上安置好的硬盘

常用的硬盘专用接口以下:

手机等数码装备的 “硬盘”,则是做成了很小的存储芯片,干脆焊在主板上。

多见的手机存储芯片:eMMC、UFS(更快)

咱们再来简单看看硬盘的内部布局。

当前合流的硬盘范例有两种,划分是传统机器硬盘和 SSD 固态硬盘。小枣君以朋友们相对谙习的机器硬盘为例进行说明。

左边是机器硬盘,右侧是 SSD 固态硬盘

硬盘之因此叫硬盘,是由于它的焦点片面是一块或多块由坚挺金属质料制成的盘片。盘片上头涂抹了磁性介质,两面都能够记录消息。在盘面上读 / 写数据的,是磁头。

硬盘,也叫磁盘(有点像唱片机)

下图表现的是一个盘面:

盘面中一圈圈灰色齐心圆为一条条磁道。从圆心向外画直线,能够将磁道划分为几何个弧段,每个弧段被称之为一个扇区(Sector,图中绿色片面)。

扇区是磁盘的非常小组成单位。朋友们应该看出来了,越靠圆心,扇区越短。辣么,是不是越往外,扇区越长,存储的数据越多呢?

不一定。

旧式的硬盘,无论靠内或是靠外,每个扇区的大小是同样的,都是 512 字节。这种硬盘用柱面 - 磁头 - 扇区号(CHS,Cylinder-Head-Sector)组成的编号进行寻址。

而当今合流的硬盘,扇区密度是一致的,也即是说,越靠外侧,扇区数越多。每个扇区的大小是 4K 字节,用一个逻辑块编号寻址(LBA,Logical Block Addressing)。

以扇区为基础,一个或多个陆续的扇区组成一个块,叫做物理块。因此,硬盘往往又叫块装备(Block Device)。

▉ 甚么是逻辑卷?甚么是文件体系?

为了利便经管,咱们能够将硬盘如许的物理块装备,盘据成多个逻辑块装备。大概,咱们也能够将多个物理块装备,组合成一个容量更大的逻辑块装备。

底层的关联技术和对象,包含 RAID(朋友们大概相对谙习)、JBOD、卷经管体系(Volume Manager)。

Windows 的卷经管体系,即是它自带的磁盘经管对象。而 Linux 的,是大名鼎鼎的 LVM(Logical Volume Manager,逻辑卷经管)。

咱们先说说 Windows 的。

在 Windows 中,磁盘分为根基磁盘和动静磁盘。默认情况下,用户用的都是根基磁盘。

一个根基磁盘能够划分为多个分区,分区种别包含主分区、扩大分区和逻辑分区。

硬盘分区

主分区是硬盘的启动分区,咱们常说的 “C 盘”即是硬盘上的主分区。MBR 分区表能够划分出 4 个主分区。若使用 GPT 分区,能够经管 128 个主分区。

除去主分区之外,硬盘剩下的容量就被认定为扩大分区。扩大分区不能够干脆使用。扩大分区能够分红一个或几何个逻辑分区,也即是咱们的 “D 盘”、“E 盘”等。

动静磁盘是根基磁盘的晋级模式。在动静磁盘中,分区叫做卷。卷的发现,即是为了便于对多硬盘进行经管。

简单来说,动静磁盘能够将不同硬盘分到一个卷。假设你手中有 160G 和 250G 硬盘各一块,若想划分 90G 和 320G 的分区,就能够借助动静磁盘来实现。

动静磁盘内部的卷,又分为简单卷、跨区卷、带区卷、镜像卷、RAID-5 卷。限于篇幅,就不做详细说明了。根基磁盘里的分区,当今也被微软改叫为卷。

再来看看 Linux 的 LVM 对象。

实在 LVM 和动静磁盘的思绪差未几的,也是把物理空间造成逻辑空间。

首先,物理存储介质进行初始化,造成物理卷(PV,physical volume)。

然后,一个或多个物理卷组成一个卷组(VG,Volume Group)。

建立卷组以后,再建立逻辑卷(LV,logical volume)。

全部历程,以下图所示:

LVM 要紧元素的组成

好了,不论 Windows 或是 Linux,逻辑卷都有了,是不是能够干脆使用它们啦?

不行,还差一步。那即是文件体系(File System)。

文件体系就像堆栈经管员。作为用户,你不需要晓得堆栈内部毕竟甚么样子,只需要把货品交给他,他会以一个树形布局目次,挂号这些货品。你来取的时分,只需要报告他途径,他就会把货品交给你。

文件夹布局

文件体系有许多品种型,多见的有 Windows 的 FAT/FAT32/NTFS(朋友们应该很谙习),另有即是 Linux 的 EXT2/EXT3/EXT4/XFS/BtrFS 等。

Windows 体系下,经历对分区(卷)进行文件体系花样化,再分派一个盘符,咱们就能够在 “我的计算机”里看到可用的磁盘。Linux 体系下,咱们需要对逻辑卷进行文件体系花样化,然后实行挂载操纵,也就能对存储空间进行使用了。

▉ 甚么是 DAS/NAS/SAN

除了内置存储之外,跟着存储容量需要的接续增加,加上保护便当性的需要,计较机体系首先引入了外挂存储。也即是说,硬盘从计较机的内部,跑到了计较机的外部。

外挂存储分为两种,一种是直连式存储(DAS,Direct Attached Storage),另有一种是网络存储(FAS,Fabric Attached Storage)。

DAS 直连式存储,大凡使用专用线缆(比方 SCSI),与存储装备(比方磁盘阵列)进行直连。

固然数据存储装备看似在外部,但干脆挂接在服务器内部总线上,是全部服务器布局的一片面。

DAS 的坏处是存储装备只能连接到一台主机使用,无法互鉴,老本较高,且平安性靠得住性较低。

FAS 网络存储,是一种多点连接式的存储。它又分为 NAS(Network-attached Storage,网络接入存储)和 SAN(Storage Area Network,存储区域网络)。

这些观点的名字很像,朋友们万万别晕。画个图看得清楚少许:

NAS 与 DAS 相比,非常大的特色短长直连。它能够经历 IP 网络,实现多台主机与存储装备之间的连接。

NAS 大大进步了存储的平安性、互鉴性和老本。但是 I/O(输入输出)逐渐成为性能瓶颈。跟着使用服务器的接续增加,网络体系服从会急剧下降。为打听决这个疑问,发现了 SAN 存储方案。

SAN 是在 NAS 基础上做的演进。它经历专用光纤通道互换机走访数据,接纳 ISCSI、FC 和谈。

SAN 和 NAS 的环节差别,就在于文件体系的位置。画个图就清楚了:

能够看出,若说 SAN 是一块网络硬盘的话,NAS 根基上曾经像一台自力的服务器了。NAS 领有文件体系,用户能够经历 TCP/IP 和谈干脆走访上头的数据。

当今许多家庭都首先使用小型 NAS 装备,相配于一个小型服务器。

在 NAS 的模式下,不同的客户端能够使用网络文件体系(Network File System)走访 NAS 上的文件。多见的网络文件体系有 Windows 网络的 CIFS(也叫 SMB)、类 Unix 体系网络的 NFS 等。

FTP、HTTP 实在也算是文件存储的某种分外实现,它们经历某个 URL 地点来走访一个文件。

▉未完待续……

跟着互联网的连接开展,网络上的数据量在接续激增,这给存储体系带来了庞大的压力和搦战。

云计较的鼓起,会给咱们斩新的办理方案吗?

您可能还会对下面的文章感兴趣: