服务器硬件基础知识

2019-12-09 18:12:38 1132

服务器概述

一、服务器的基本概念

服务器是计算机的一种，是网络中为客户端计算机提供各种服务的高性能的计算机；

服务器在网络操作系统的控制下，将与其相连的硬盘、磁带、打印机及昂贵的专用通讯设备提供给网络上的客户站点共享，也能为网络用户提供集中计算、信息发布及数据管理等服务。

服务器英文名称为Server。

２、服务器按处理器架构分类

X86架构服务器

RISC架构服务器

EPIC架构服务器（IA-64）

640 (1).jpg

1）X86架构服务器

IA－32、x86－32、x86－64都属于x86，即英特尔的32位x86架构，x86－64是AMD在其最新的Athlon 64处理器系列中采用的新架构，但这一处理器基础架构还是IA－32（因英特尔的x86架构并未申请专利保护，所以绝大多数处理器厂商为了保持与Intel的主流处理器兼容，都不得不采用这一x86架构），只是在此架构基础之上作了一些扩展，以支持64位程序的应用，进一步提高处理器的运算性能。

2）RISC架构服务器

RISC的英文全称为“Reduced Instruction Set Computing”，中文即“精简指令集”，它的指令系统相对简单，它只要求硬件执行很有限且最常用的那部分执令，大部分复杂的操作则使用成熟的编译技术，由简单指令合成。目前在中高档服务器中普遍采用这一指令系统的CPU，特别是高档服务器全都采用RISC指令系统的CPU，并且此类服务器都采用UNIX操作系统。
在中高档服务器中采用RISC指令的CPU主要有Compaq（康柏，即新惠普）公司的Alpha、HP公司的PA-RISC、IBM公司的Power PC、SGI公司的MIPS和SUN公司的Sparc。

3）IA-64

EPIC（Explicitly Parallel InstructionComputers，精确并行指令计算机）。Intel采用EPIC技术的服务器CPU是安腾Itanium。它是64位处理器，也是IA－64系列中的第一款。在Intel采用了X86指令集之后，它又转而寻求更先进的64-bit微处理器，Intel这样做的原因是，它们想摆脱容量巨大的x86架构,从而引入精力充沛而又功能强大的指令集，于是采用EPIC指令集的IA-64架构便诞生了。IA-64在很多方面来说，都比x86有了长足的进步。突破了传统IA32架构的许多限制，在数据的处理能力，系统的稳定性、安全性、可用性、可观理性等方面获得了突破性的提高。IA-64微处理器最大的缺陷是它们缺乏与x86的兼容。

３、服务器按功能应用分类

域控制服务器（Domain Server）

文件服务器（File Server）

打印服务器（Print Server）

数据库服务器（Database Server）

邮件服务器（E-mail Server）

Web服务器（Web Server）
多媒体服务器（MultimediaServer）

通讯服务器（Communication Server）

终端服务器（Terminal Server）

基础架构服务器（Infrastructure Server）

虚拟化服务器（Virtualization Server）

640 (2).jpg

目前的技术来说，这些功能划分为逻辑形态。从可以把多个功能把多个功能部署在一台服务器上面。从物理形态上来说，可以是一台服务器完成多个功能。

640 (3).jpg

4、服务器按外观分类

640 (4).jpg

640 (5).jpg

5、服务器的特点与PC机、工作站、小型机的区别

服务器与PC机的区别

640 (6).jpg

640 (7).jpg

服务器与工作站的区别

640 (8).jpg

6、服务器性能评价标准

640 (9).jpg

二、服务器关键组件及技术

640 (10).jpg

640 (11).jpg

CPU

内存

硬盘

Raid

PCIe

HBA

网卡

电源

热插拔技术

CPU

中央处理器（CPU，Central Processing Unit）是是一台计算机的运算核心和控制核心。

计算机的性能在很大程度上由CPU的性能决定，而CPU的性能主要体现在其运行程序的速度上。影响运行速度的性能指标包括CPU的工作频率、Cache容量、指令系统和逻辑结构等参数。

主频：主频也叫时钟频率，单位是兆赫（MHz）或千兆赫（GHz），用来表示CPU的运算、处理数据的速度。通常，主频越高，CPU处理数据的速度就越快；

缓存（Cache）：实际工作时，CPU往往需要重复读取同样的数据块，而缓存容量的增大，可以大幅度提升CPU内部读取数据的命中率，而不用再到内存或者硬盘上寻找，以此提高系统性能。但是由于CPU芯片面积和成本的因素来考虑，缓存都很小；

核心数：般情况下每个核心都有一个线程，几核心就有几线程，但是intel发明了超线程技术，可以让单核模拟多核心工作，intel的超线程可以让单核心具有两个线程，双核四线程；

线程数：线程数多当然速度就快,但功耗就大；

从英特尔品牌来看，主要有酷睿、至强、奔腾、凌动、赛扬、安腾和应用在物联网领域的Quark几大品类。PC多以酷睿系列为主，至强则是服务器级处理器的唯一选择。在真是的攒机场景中，确实有玩家将至强E3处理器应用在PC之上，这主要是因为服务器级CPU会比一般PC能支持更大的缓存和多处理（安装了多个物理CPU）。

640 (12).jpg

英特尔至强可扩展处理器架构

　　在服务器应用场景下，常常会在一台服务器上搭载两个甚至多达几十个物理CPU，各个处理器之间通过高效互联互通，提升计算力。在服务器处理器缓存方面，一般提供了三级缓存。以笔者之前测过的Intel Xeon Glod 6140 CPU（2.30GHz、18 Cores）处理器为例，L2缓存为18*1024KB，L3缓存为25344KB（L表示缓存级别L2和L3的大小也是特定系列中CPU型号的主要区别之一）。

至强E7 v4处理器

　　当然，服务器级处理器的稳定性也会远高于PC级处理器，这是因为在服务器应用的IDC场景中，需要7*24小时，一年365天不间断工作，而酷睿处理器显然不具备这样的特点。除此之外，二者的接口也略有不同，拿几年前的INTEL为例，当时其桌面级CPU为775接口，而服务器CPU则有775和771等。

处理器型号相关内容更新很快，以上内容仅供参考。

Intel命名也是几套，内部一套外部一套，过两天可能还改名。

内存是计算机中重要的部件之一，它是与CPU进行沟通的桥梁。计算机中所有程序的运行都是在内存中进行的，因此内存的性能对计算机的影响非常大。其作用是用于暂时存放CPU中的运算数据，以及与硬盘等外部存储器交换的数据。只要计算机在运行中，CPU就会把需要运算的数据调到内存中进行运算，当运算完成后CPU再将结果传送出来，内存的运行也决定了计算机的稳定运行。内存是由内存芯片、电路板、金手指等部分组成的。

芯片组

这里说的芯片组，是X86系统独有的，一般RISC处理器都是SoC，芯片即为系统；X86比较独特，以前是由CPU、南桥、北桥组成一个系统，现在是由CPU+PCH形成一个系统。因为接口和总线太多，太复杂，又由于X86系统一直传承着继承性，兼容性等特点，所以多个处理器可以匹配不同主板，同一个主板可以适配多种处理器，所以这样做了功能拆分。

640 (14).jpg

640 (15).jpg

内存

服务器内存与PC内存的区别：

性能更高

兼容性更好

可靠性更高

640 (16).jpg

什么是Register？

拥有Registers功能的内存模组，可以通过重新驱动控制信号来改善内存的运作，提高电平信号的准确性，从而有助于保持系统长时间稳定运作。不过，由于Registers的信号重驱动需花费一个时钟周期，延迟时间有所增加，但是传输的速率相对可以提高，对走线的要求也降低了。

与逻辑设计中的流水线是一个原理。

这样控制信号的信号质量更好。

服务器内存上面要比普通内存多几颗芯片：主要是PLL (Phase Locked Loop)和Register IC，它们的具体用处如下　PLL(Phase Locked Loop) 琐相环集成电路芯片，内存条底部较小IC，比Register IC小，一般只有一个，起到调整时钟信号，保证内存条之间的信号同步的作用。Register IC内存条底部较小的集成电路芯片(2-3片),起提高驱动能力的作用。服务器产品需要支持大容量的内存，单靠主板无法驱动如此大容量的内存，而使用带Register的内存条，通过Register IC提高驱动能力，使服务器可支持高达32GB的内存。

640 (17).jpg

图为DDR2 400 ECC REG

1 SPD芯片

2 PLL芯片

3 Register IC芯片

4 内存颗粒

什么是ECC内存？

目前是一谈到服务器内存，大家都一致强调要买ECC内存，认为ECC内存速度快，其实是一种错误地认识，ECC内存成功之处并不是因为它速度快（速度方面根本不关它事只与内存类型有关），而是因为它有特殊的纠错能力，使服务器保持稳定。ECC本身并不是一种内存型号，也不是一种内存专用技术，它是一种广泛应用于各种领域的计算机指令中，是一种指令纠错技术。它的英文全称是“Error Checking and Correcting”，对应的中文名称就叫做“错误检查和纠正”，从这个名称我们就可以看出它的主要功能就是“发现并纠正错误”，它比奇偶校正技术更先进的方面主要在于它不仅能发现错误，而且能纠正这些错误，这些错误纠正之后计算机才能正确执行下面的任务，确保服务器的正常运行。之所以说它并不是一种内存型号，那是因为并不是一种影响内存结构和存储速度的技术，它可以应用到不同的内存类型之中，就象我们在前面讲到的“奇偶校正”内存，它也不是一种内存，最开始应用这种技术的是EDO内存，现在的SD也有应用，而ECC内存主要是从SD内存开始得到广泛应用，而新的DDR、RDRAM也有相应的应用，目前主流的ECC内存其实是一种SD内存。

ECC通过数据位多一些位数，对数据进行校验，所以内存颗粒一般会多一颗。

ECC可发现2bit错误，并纠正1bit错误，可靠性更高。

一般情况下服务器内存都具有ECC功能，只有较低端的服务器采用普通台内存时不具有此功能；

640 (18).jpg

640 (19).jpg

服务器内存的其他典型技术：

Chipkill技术

Chipkill技术是IBM公司为了解决服务器内存中ECC技术的不足而开发的，是一种新的ECC内存保护标准。我们知道ECC内存只能同时检测和纠正单一比特错误，但如果同时检测出两个以上比特的数据有错误，则无能为力。ECC技术之所以在服务器内存中广泛采用，一则是因为在这以前其它新的内存技术还不成熟，再则在服务器中系统速度还是很高，在这种频率上一般来说同时出现多比特错误的现象很少发生，因为这样才使得ECC技术得到了充分地认可和应用，使得ECC内存技术成为几乎所有服务器上的内存标准。

但随着基于Intel处理器架构的服务器的CPU性能在以几何级的倍数提高，而硬盘驱动器的性能只提高少数的倍数，为了获得足够的性能，服务器需要大量的内存来临时保存CPU上需要读取的数据，这样大的数据访问量就导致单一内存芯片上每次访问时通常要提供4（32位）或8（64位）比特的数据，一次读取这么多数据，出现多位数据错误的可能性会大大地提高，而ECC又不能纠正双比特以上的错误，这样很可能造成全部比特数据的丢失，系统就很快崩溃了。IBM的Chipkill技术是利用内存的子系统来解决这一难题。内存子系统的设计原理是这样的，单一芯片，无论数据宽度是多少，只对于一个给定的ECC识别码，它的影响最多为一比特。举例来说，如果使用4比特宽的DRAM，4比特中的每一位的奇偶性将分别组成不同的ECC识别码，这个ECC识别码是用单独一个数据位来保存的，也就是说保存在不同的内存空间地址。因此，即使整个内存芯片出了故障，每个ECC识别码也将最多出现一比特坏数据，而这种情况完全可以通过ECC逻辑修复，从而保证内存子系统的容错性，保证服务器在出现故障时，有强大的自我恢复能力。采用这种技术的内存可以同时检查并修复4个错误数据位，服务器的可靠性和稳定得到了更充分的保障。

Memory ProteXion（内存保护）

　　Memory ProteXion技术最初应用在IBM公司的z系列和i系列大型主机服务器中，相对Chipkill内存技术在保护能力上更加强。

640 (20).jpg

　类似硬盘的热备份功能，能够自动利用备用的比特位自动找回数据，从而保证服务器的平稳运行。该技术可以纠正发生在每对DIMM内存中多达4个连续比特位的错误。即便永久性的硬件错误，也可利用热备份的比特位使得DIMM内存芯片继续工作，直到被替换为止。

　　同时，Memory ProteXion技术比ECC技术纠错更加有效，标准的ECC内存虽然可以检测出2位的数据错误，但它只能纠正一位错误。采用内存保护技术，就可以立即隔离这个失效的内存，重写数据在空余的数据位。而且无需添加另外的硬件、无需增加额外的费用，独立操作系统工作，也不会给系统增加任何额外负担。这种技术可以使减少停机时间，使服务器持续保持高效的计算平台。

Memory Mirroring（内存镜像）

　　IBM的另一种更高级内存技术就是内存镜像技术，在内存保护能力上更强，弥补了Chipkill修复技术和内存保护技校术都不能完全修复时，可以在系统中运行直到有故障内存被更换。

640 (21).jpg

　　一般说，内存镜像技术和磁盘镜像技术相仿，都是将数据同时写入到两个独立的内存卡中，内存只从活动内存卡中进行数据读取，当一个内存中有足以引起系统报警的软故障，系统会自动提醒管理员这个内存条将要出故障；同时服务器就会自动地切换到使用镜像内存卡，直到这个有故障的内存被更换。

另外，镜像内存允许进行热交换（Hot swap）和在线添加（Hot-add）内存。因为镜像内存采用的的两套内存中实际只有一套在使用，另一套用于备份，所以对于软件系统来说也就只有整个内存的一半容量是可用的。

PCIe

640 (22).jpg

640 (23).jpg

硬盘

SATA：Serial ATA接口，即串行ATA，采用串行技术以获得更高的传输速度及可靠性。目前是第二代即SATAII

SCSI：全称为“SmallComputer System Interface”（小型计算机系统接口），具有应用范围广、多任务、带宽大、CPU占用率低，以及热插拔等优点，主要应用于中、高端服务器和高档工作站

SAS：Serial Attached SCSI接口，即串行SCSI，采用串行技术以获得更高的传输速度。目前仍然是第一代

SSD：固态存储硬盘(Solid State Disk)其特别之处在于没有机械结构，以区块写入和抹除的方式作读写的功能，与目前的传统硬盘相较，具有低耗电、耐震、稳定性高、耐低温等优点。

640 (24).jpg

服务器硬盘接口有哪些种类

一、风光依旧的SATA接口

SATA接口又被称之为“串行接口”，所以现在采用SATA接口的硬盘都被习惯的叫做串口硬盘。它是继IDE硬盘之后的一次演变。SATA的物理设计是以光纤通道作为蓝本，所以采用了四芯的数据线。SATA接口发展至今主要有3种规格，其中目前普遍使用的是SATA-2规格，传输速度可达3GB/秒，如图1所示为某品牌固态硬盘采用的SATA-2接口规格。

640 (25).jpg

现在已经有SATA-3接口出现，如图所示即为西部数据的一款SATA-3接口的服务器硬盘。SATA-3接口除了将传输速率提高到了6GB/秒之外，还对诸多数据类型提供了读取优化设置。当然对于用户来说，SATA-3接口的出现并不意味着现有的SATA-2产品会被淘汰，因为SATA-3虽然采用了全新INCITS ATA8-ACS标准，但依然可以兼容旧有的SATA设备。

640 (26).jpg

由于SATA接口的服务器硬盘，技术相当成熟而且构造成本不高，因此相对于其他接口类型的产品来说，其市场价位是比较平民化的。相信对于预算不高的企业用户来说，在原来的服务器架构中升级同样接口但容量更大的SATA-2接口硬盘，是最好的选择了。

二、应用更普及的SCSI接口

SCSI接口的服务器硬盘是现在多数服务器中采用的一种，它具有数据吞吐量大、CPU占有率极低的特点：用于连接SCSI接口硬盘的SCSI控制器上有一个相当于CPU功能的控制芯片，能够替代CPU处理大部分工作；现在普遍采用的Ultra 320标准的SCSI接口硬盘，数据传输率可达320MB/秒。SCSI接口服务器硬盘及SCSI控制器如图所示。

640 (27).jpg

另外，SCSI硬盘具有的支持热拔插技术的SCA2接口，也非常适合部署在现在的工作组和部门级服务器中。SCSI硬盘必须通过SCSI接口才能使用，现在服务器主板一般都集成了SCSI接口，也可以安装专门的SCSI接口卡来连接更多个SCSI设备，所以其横向扩展能力是比较强的。

那么，SCSI接口的服务器硬盘，主要强于哪些方面，又适用于怎样的企业环境中呢?首先，SCSI对磁盘冗余阵列（RAID）的良好支持，可以满足有大数据存储的企业环境，同时数据安全性也有保障；再者，SCSI硬盘的转速早已高达15000rpm，这让企业数据中心的处理性能得到了保障；再次，其较低的CPU占用率以及多任务的并行处理特性，都可为成长型企业环境提供较强力的数据处理及存储支持。最后，从如图6所示现在的市场价格对比来看，SCSI接口硬盘整体上要低于SAS接口硬盘，但明显高于SATA接口硬盘，所以，其更适合装配在对数据存储有一定的安全需求、容量需求、高处理性能需求的企业环境中。

三、追求性能最大化的SAS接口

“SAS”就是串行连接SCSI的意思，简单理解就是SCSI接口技术的升级改良，目的就是进一步改进SCSI技术的效能、可用性和扩充性。其特点就是可以同时连接更多的磁盘设备、更节省服务器内部空间；比如SAS接口减少了线缆的尺寸，且用更细的电缆搭配，而且SAS硬盘有2.5英寸的规格，如图7所示即为希捷（Savvio 15K.2）2.5英寸SAS硬盘接口。

更好的空间占用特点使得这种接口的硬盘可以广泛部署在刀片服务器中。在2U高度内使用 8个 2.5英寸的SAS硬盘位已经成为大多数OEM服务器厂商的选择。另外，对于预算不高无法更换现有服务器的企业来说，亦可采用SAS和SATA硬盘共存的升级方式，SAS接口良好的向下兼容性使得企业用户可以将它们用在不同的应用场合。比如SATA硬盘可用于一般事务性处理，而SAS硬盘则可专注于数据量大、数据可用性极为关键的应用中。如图所示为上亿信息（SNT）推出的ST-1042SAS-D7硬盘抽取盒，它就完美地混合支持SAS和SATA硬盘共存，且可以搭配SAS或SATA硬盘控制卡来支持RAID 0、1、5磁盘阵列模式。

640 (28).jpg

比起同容量的Ultra 320 SCSI硬盘，SAS 硬盘要贵一些，这主要还是缘由其更好的扩展性、兼容性以及更可靠的容错能力。而从从服务器市场来看，国内外主力服务器厂商都已经纷纷推出采用SAS硬盘的机型，只是具体产品的应用和市场状况有所不同。比如定位于部门级应用的惠普 ProLiant DL380 G5、适用于流媒体服务及电子商务的IBM System x3650 M2 等，都提供了SAS硬盘的全面支持。

四、应用高端的光纤接口

光纤通道（FC，Fibre Channel）是一种为提高多硬盘存储系统的速度和灵活性才开发的接口，其可大大提高多硬盘系统的通信速度。对于大型的ERP系统，或是在线实时交易系统等需要更大传输量、更快反应速度的应用环境而言，此类接口的服务器硬盘是最好的选择；当然其产品价格自然也就更高于前面几种。

总结起来看，不同接口技术的服务器硬盘也决定了它们各自更好的适用环境。单独存在的SATA硬盘服务器产品如今并不多见，大多是一些针对入门应用的塔式服务器中。而SCSI及SAS由于具有CPU占用率低、连接设备多等诸多特点，性能上明显优于SATA接口硬盘，因此可以在企业数据中心、安全服务器等应用环境中部署。目前看来，市面上的服务器硬盘或服务器产品，也大多呈现两种形态：Ultra320 SCSI及SAS/SATA。

不可否认的是，2009年SAS已经成为服务器界主流硬盘平台，近期有服务器硬盘升级需求的企业用户，还是多倾向于选择SAS平台为好，虽然其价格要明显高出一截，但带来的实际应用效果却是更好的。

服务器硬盘和普通硬盘区别在哪

第一， HDD for Server 和 HDD for PC 当然不一样， Server 一般采用 SCSI 接口硬盘（现在 SAS已经取代了 SCSI ），而 PC 一般采用 ATA 接口硬盘（现在 SATA 已经取代了 ATA ）， SCSI 硬盘的优势是对系统占用非常小，比如说你将几十 GB 的数据 D 盘拷贝到 E 盘，同时将几十 GB 数据从 E盘拷贝到 D 盘，磁盘资源应该是基本耗净了，再同时运行 CS ，如果在 PC 上面，这两个拷贝动作会占用全部的 CPU 资源， CS 根本无法运行，但是在 Server 上，这两个拷贝动作几乎不会占用任何 CPU 资源， CS 除了刚刚进去略慢之外，一旦读取到了内存，可以非常正常流畅的运行。

普通 PC 机的硬盘相比，服务器上使用的硬盘具有如下四个特点。

1 、速度快

服务器使用的硬盘转速快，可以达到每分钟 7200 或 10000 转，甚至更高；它还配置了较大（一般为 2MB 或 4MB）的回写式缓存；平均访问时间比较短；外部传输率和内部传输率更高，采用 Ultra Wide SCSI 、 Ultra2 Wide SCSI 、 Ultra160 SCSI 、 Ultra320 SCSI 等标准的 SCSI 硬盘，每秒的数据传输率分别可以达到 40MB 、 80MB 、 160MB 、 320MB 。

2 、可靠性高

因为服务器硬盘几乎是 24 小时不停地运转，承受着巨大的工作量。可以说，硬盘如果出了问题，后果不堪设想。所以，现在的硬盘都采用了 S.M.A.R.T 技术（自监测、分析和报告技术），同时硬盘厂商都采用了各自独有的先进技术来保证数据的安全。为了避免意外的损失，服务器硬盘一般都能承受 300G 到 1000G 的冲击力。

3 、多使用 SCSI 接口

多数服务器采用了数据吞吐量大、 CPU 占有率极低的 SCSI 硬盘。SCSI 硬盘必须通过 SCSI 接口才能使用，有的服务器主板集成了 SCSI 接口，有的安有专用的 SCSI 接口卡，一块 SCSI 接口卡可以接7 个 SCSI 设备，这是 IDE 接口所不能比拟的。

4 、可支持热插拔

热插拔（ Hot Swap ）是一些服务器支持的硬盘安装方式，可以在服务器不停机的情况下，拔出或插入一块硬盘，操作系统自动识别硬盘的改动。这种技术对于 24 小时不间断运行的服务器来说，是非常必要的。

关于服务器运用SSD

640 (29).jpg

机械硬盘在读取速度上存在瓶颈早已是不争的事实，而固态硬盘在读取速度上要甩机械硬盘几条街条街。既然，SSD速度解决了计算机（服务器）硬件上的瓶颈，大多数普通用户都在用，很多企业服务器却依然坚守机械硬盘呢？原因无非以下几个方面。

640 (30).jpg

1、最重要的一点是“钱”

普通固态硬盘比机械硬盘贵不少，而企业级固态硬盘更是不便宜，再加上固态硬盘容量普遍小，如果服务器全部用固态硬盘，成本会非常高，这是一般的企业难以负担的。但是随着存储遵循摩尔定律，固态硬盘的成本最终还是要比机械硬盘要低的。

2、硬盘容量

服务器存储的都是重要的海量数据，对硬盘容量有很高的要求。而目前服务器机械硬盘，单块容量可以达到2TB以上，主流大容量服务器机械硬盘达到了10TB左右。

而目前固态硬盘容量普遍不大，大一些的也不过1TB左右，并且价格非常昂贵。显然，固态硬盘容量也是制约服务器领域运用的一个重要原因。

但是一样随着半导体的发展，容量也会指数级增长。

3、安全型

传统的机械硬盘已经使用了几十年了，技术成熟，可靠性极佳，并且机械硬盘损坏还可以维修，数据丢失，还可以通过一些专业数据恢复软件，大概率找回。

而固态硬盘，起步较晚，虽然速度有绝对优势，但由于固态硬盘是芯片级存储，一旦硬盘损坏，数据几乎无法找回。另外，固态硬盘数据丢失，也几乎很难再恢复。

对于企业而言，服务器上的数据可以说是无价的，如果数据丢失，会造成难以估量的损失。因此，在安全性方面，机械硬盘依然有着明显的优势。当然，有人会说，服务器采用多块固态硬盘集群，一份数据存在多块硬盘，这样可以很好的保障数据安全，但这样的成本就非常高，又会回到“钱”的问题上了。

在存储技术飞速发展的二十年间，IT 架构经历了从简单到复杂，从单一性能处理到集群虚拟化发展的阶段。每次重大的技术变革都能给人们的工作和生活带来崭新的变化。回顾这二十年，IT 技术的变化主要体现在三方面：首先，代表计算能力的 CPU 在短短二十年性能将近提升 580 倍；其次，I/O 通道性能提升了近 1000 倍；最后，存储系统介质在二十年中仅仅提升了 20 倍。硬盘已成为计算机系统的性能瓶颈，严重影响整个 IT 架构系统性能的提升，难以满足人们对业务应用需求。而今，一种新型高效节能的硬盘技术 SSD(Solid State Disk 或 Solid State Drive)固态硬盘应运而生。SSD 固态硬盘摆脱了机械硬盘的磁头，盘片转轴及控制电机等机械部件，没有电机加速旋转的过程，内部不存在任何机械活动部件，不会发生机械故障，也不怕碰撞、冲击和振动。所以其相对于 HDD 而言，在性能、可靠性、能耗、轻便性方面有着绝对的优势，目前广泛应用于军事、军载、工控、电力、医疗、航空、导航设备等领域。

640 (31).jpg

SSD硬盘包含：控制器芯片、NAND FLASH、DDR内存。这几个关键组件也就决定了SSD的档次和等级。

640 (32).jpg

SSD硬盘由于具备以下几个特点，替代机械硬盘已经成为必然之势。

高性能

HSSD 盘的性能优势体现在以下两个方面：响应时间短和读写效率高。

（1）响应时间短：硬盘访问时间是由指令到达时间+寻道时间+命中时间+机械延迟组成的。传统硬盘的机械特性导致大部分时间浪费在寻道、查找数据和机械延迟上。数据传输受到严重影响。而 SSD 硬盘由于采用固态芯片（NAND 芯片）作为存储介质，内部没有机械结构，因此没有数据查找时间、延迟时间和寻道时间，数据传输速度较之传统硬盘有近 100 倍的提升。如图：SSD 盘与传统硬盘响应时间比较。

640 (33).jpg

（2）读写效率高：传统硬盘在进行随机读写时需要把磁头不断地移来移去，导致效率低下。现在最快的机械硬盘的磁头平均移动时间是 5ms，也就是说 1 秒钟内磁头最多移动200 次，即最多处理 200 个随机读写请求。而 SSD 没有磁头，省去了机械操作的时间，只需计算数据存放在哪块 Flash 芯片的哪个位置，然后再对该位置进行读写即可。目前，典型的 SSD 硬盘每秒最多可进行 16000 次随机读写，是传统硬盘的 80 倍。

640 (34).jpg

640 (35).jpg

高可靠

部件级抗震

部件级：众所周知，磁盘表面涂有磁性介质，其在显微镜下呈现出来的便是一个个磁颗粒。微小的磁颗粒极性可以被磁头快速的改变，并且在改变之后可以稳定的保持，系统通过磁通量以及磁阻的变化来分辨二进制中的 0 或者 1。也正是因为所有的操作均是在微观情况下进行，所以如果硬盘在高速运行的同时受到外力的震荡，将会有可能因为磁头拍击磁盘表面而造成不可挽回的数据损失。此外，硬盘驱动器磁头的

飞行悬浮高度低、速度快，一旦有小的尘埃进入硬盘密封腔内，或者一旦磁头与盘体发生碰撞，就可能造成数据丢失，形成坏块，甚至造成磁头和盘体的损坏。而 SSD 硬盘是采用固态芯片作为存储介质，其工作抗震能力达到 15G（10~1000HZ）是传统硬盘的15 倍，抗冲击能力达到 1500G（0.5ms）是传统硬盘的 27 倍。高效地提升了 SSD 盘的稳定性。如图：SSD 盘与传统硬盘防震、抗冲击比较。

640 (36).jpg

盘片级寿命

在软件方面，华为固态硬盘 HSSD 盘拥有业界领先的动静态磨损均衡算法和坏块管理策略，GC 算法等优化的 SSD 管理调度算法，NAND Flash 的内部处理有效的提高了 SSD盘的使用寿命；在硬件方面，实现 ECC 检错、纠错算法，保证数据完整性及一致性。软硬件结合，保证了系统的可靠性。

640 (37).jpg

640 (38).jpg

假设 SSD 上承载的主机业务是数据库类型的业务，且 7×24 小时无休，IOPS 持续在 5K左右，平均 IO 大小为 8KB，读写比例为 40% : 60%。这样的主机业务，每天写入的数据量约为：5K × 60% × 8KB × 60 × 60 × 24 ≈ 2TB 。将上述计算结果使用寿命计算公式，并让写放大系数取值为全随机业务时的 2.5，可以得到不同类型和容量的 HSSD 的使用寿命：

640 (39).jpg

系统级可靠性

内存属于易失性介质，掉电后数据不会保存。如果系统出现异常掉电，硬盘内存的数据就会丢失，此时若存在主机写入内存的数据并未写入永久介质，这部分数据就会丢失，从而造成了数据丢失的问题。

HSSD 可以检测到硬盘异常掉电，在掉电以后，利用备用电源中的能量把内存中更新过的数据写入永久介质，从而为异常掉电时内存的数据提供了保障，实现了更高的可靠性。

另外SSD还有低功耗、易于管理等特点。

什么是Raid?

Raid——Redundant Array of IndependentDisks，独立磁盘冗余阵列

RAID是将同一阵列中的多个磁盘视为单一的虚拟磁盘，数据是以分段的方式顺序存放于磁盘阵列中

RAID技术主要有以下两个特点：

　　（1）提高数据访问速度

　　硬盘数据条带化

　　多硬盘同时读取

　　（2）数据冗余保护

　　硬盘镜像

　　奇偶校验　

由于RAID技术的存在，服务器的机械硬盘的速率比SSD速率慢还没有充分暴露，也是有些服务器仍然可以选择机械硬盘的一个原因。

Raid技术的三大特点：

1、通过对硬盘上的数据进行条带化，实现对数据成块存取，减少硬盘的机械寻道时间，提高数据存取速度；

2、通过对一阵列中的几块硬盘同时读取，减少硬盘的机械寻道时间，提高数据存取速度；

3、通过镜像或者存储奇偶校验信息的方式，实现对数据的冗余保护

640 (40).jpg

640 (41).jpg

640 (42).jpg

640 (43).jpg

640 (44).jpg

640 (46).jpg

640 (47).jpg

640 (48).jpg

640 (49).jpg

640 (50).jpg

640 (51).jpg

存储相关的内容比较多，也比较复杂，此处不继续展开。

电源

服务器的电源标准有两类：

ATX标准 ——用于低端服务器或工作站。输出功率一般在125瓦～350瓦之间。通常采用20Pin(20针)的双排长方形插座给主板供电。

SSI标准 ——SSI（Server System Infrastructure）规范是IA服务器的电源规范，SSI规范的推出是为了规范服务器电源技术，降低开发成本，延长服务器的使用寿命而制定的，主要包括服务器电源规格、背板系统规格、服务器机箱系统规格和散热系统规格

SSI （Server System Infrastructure，服务器系统结构）规范是Intel联合一些主要的IA服务器生产商推出的新型服务器电源规范。根据使用的环境和规模的不同，SSI规范又可以分为EPS、TPS、MPS、DPS四种子规范

小贴士：通常将采用Intel（英特尔）处理器的服务器称之为IA（Intel Architecture）服务器，又称CISC（Complex Instruction Set Computer，复杂指令集）架构服务器。

1、EPS规范（Entry Power Supply Specification）

特点：基于ATX电源的服务器升级版本

EPS规范主要为单电源供电的中低端服务器设计，设计中秉承了ATX电源的基本规格，但在电性能指标上存在一些差异。EPS规范电源和ATX电源最直观的区别在于提供了24Pin的主板电源接口和8Pin的CPU电源接口（注：目前的PC主板也开始有24Pin的电源接口和8Pin的CPU电源接口）。

在EPS规范中只对电源的容量、引脚等作出了规定，而且没指定确定的电源额定功率，电源开发商可以根据各自不同的开发平台设计不同额定功率的电源，但必须在300W～400W范围内。后来该规范发展到EPS12V（2.0版本），适用的额定功率达到450W～650W。

2、TPS规范（Thin Power Supply Specification）

特点：适合冗余工作方式

TPS规范电源具有PFC（功率因数校正）、自动负载电流分配功能。电源系统最多可以实现4组电源并联冗余工作，由系统提供风扇散热。TPS规范电源对热插拔和电流均衡分配要求较高，它可用于“N+1”冗余工作，有冗余保护功能。

小贴士：PFC，功率因数校正，功率因数指有效功率与总功率的比值。功率因数值越大，代表电力利用率越高。

3、MPS规范（Midrange Power Supply Specification）

特点：适合高端的服务器使用

这种规范的电源针对4路以上CPU的高端服务器系统。MPS电源适用于额定功率在375W～450W的电源，可单独使用，也可冗余使用。它具有PFC、自动负载电流分配等功能。采用这种规范的电源元件的电压、电流规格设计和半导体、电容、电感等器件工作温度的设计余量超过15%，在环境温度25℃以上、最大负载、冗余工作方式下MTBF（平均无故障时间）可达到150000小时。

小贴士：MTBF，即平均无故障时间，指相邻两次故障之间的平均工作时间，也称为平均故障间隔。可用产品在总的使用阶段累计工作时间与故障次数的比值表示，单位为“小时”。

4、DPS规范（Distributed Power Supply Specification）

特点：简化服务器供电方式

DPS规范电源是单48V直流电压输出的供电系统，提供的最小功率为800W，输出为+48V和+12VSB。DPS规范电源采用二次供电方式，输入交流电经过AC-DC转换电路后输出48V直流电，48VDC再经过DC-DC转换电路输出负载需要的+5V、+12V、+3.3V直流电。制定这一规范主要是为简化电信用户的供电方式，便于机房供电，使IA服务器电源与电信所采用的电源系统接轨。

服务器与PC不同，通常支持多个CPU，使用多个SCSI硬盘，内存容量一般超过2GB，因此功耗要比普通PC大得多。因此功率起步标准也比普通电源要高。对1U机箱服务器来说，电源实际功率一般应达到300W，2U机箱服务器应达到350W，而机架式服务器则一般都配备400W以上电源，甚至有的服务器配备了1000W电源。功率越大的电源工作时的发热量便会越高，因此服务器电源的两端都装有风扇，具有良好的散热性能。

电源冗余特性：

1+1,此时每个模块承担50%的输出功率,当一个模块拔出时,另一个模块承担100%输出功率；

2+1,有三个模块,每个模块承担输出功率的1/3,当拔出一个模块,其余两个模块各承担50%的输出功率。

热插拔的概念：

热插拔（hot-plugging或Hot Swap）功能就是允许用户在不关闭系统，不切断电源的情况下取出和更换损坏的硬盘、电源或板卡等部件，从而提高了系统对灾难的及时恢复能力、扩展性和灵活性。

常见的热插拔设备：硬盘，电源，PCI设备，风扇等。

什么是IPMI

IPMI（Intelligent Platform Management Interface）—智能平台管理接口，是使硬件管理具备“智能化”的新一代通用接口标准。用户可以利用 IPMI 监视服务器的物理特征，如温度、电压、风扇工作状态、电源供应以及机箱入侵等。IPMI最大的优势在于它是独立于 CPU、

BIOS 和 OS 的，所以用户无论在开机还是关机的状态下，只要接通电源就可以实现对服务器的监控。IPMI 是一种规范的标准，其中最重要的物理部件就是BMC(Baseboard Management Controller)，它是一种嵌入式管理微控制器，相当于整个平台管理的“大脑”，通过它 IPMI就可以监控各个传感器的数据并记录各种事件的日志。

BMC的作用

一般来说，BMC具有以下功能：

1、通过系统的串行端口进行访问

2、故障日志记录和 SNMP 警报发送

3、访问系统事件日志 (System Event Log ,SEL) 和传感器状况

4、控制包括开机和关机

5、独立于系统电源或工作状态的支持

6、用于系统设置、基于文本公用程序和操作系统控制台的文本控制台重定向

服务器硬件自检启动过程

1、电源上电（启动电源，电源正常工作后，输出Power Good信号）

2、关键部件检测（CPU、芯片组、BIOS、基本内存等关键部件初始化自检）

3、检测显卡（屏幕上显示显卡信息）

4、显示BIOS的厂家和版本，显示CPU信息，检测全部内存，初始化IPMI和USB

5、检测外部设备（如:光驱、硬盘、HBA卡、RAID卡等）

6、根据BIOS启动项设置，加载操作系统

什么是BIOS?

BIOS是基本输入/输出系统（Basic Input Output System）的缩写。BIOS是开机过程中的关键组成部分。它负责将计算机系统的各种硬件组件寻址和映射到内存，使操作系统能够和硬件进行沟通。如果没有BIOS，计算机将无法启动并进入到操作系统。

BIOS的作用

1. 自检及初始化

2. 程序服务处理

3. 硬件中断处理

4.引导操作系统