工程师必备的性能数字

一、前言

对于性能工程师来说，常见系统的性能数据量级需要烂熟于心，记住这些数字的好处是，每次看到一个性能相关的数据的时候，我们立刻就能知道这个性能数据有没有问题。

举个简单例子，如果我们看到一个硬盘的IO读写延迟经常在500毫秒左右，我们立刻就知道这里面有性能问题。反之，如果硬盘IO读写延迟小于1毫秒，我们可以马上推断——这些IO读写并没有到达硬盘那里，是被操作系统缓存挡住了。这就是大家常说的“对数字有感觉”。

二、存储硬件

存储有很多种，常用的是传统硬盘（HDD,）和固态硬盘（SSD），SSD的种类很多，按照技术来说有单层（SLC）和多层（MLC，TLC等）。按照质量和性能来分，有企业级和普通级。根据安装的接口和协议来分，有SAS、SATA、PCIe和NVMe等。

对所有的存储来说，有三个基本的性能指标。

IO读写延迟。一般是用4KB大小的IO做基准来测试；

IO带宽，一般是针对比较大的IO而言；

IOPS，就是每秒钟可以读写多少个小的随机IO。

SSD的随机IO延迟比传统硬盘快百倍以上，IO带宽也高很多倍，随机IOPS更是快了上千倍。

三、CPU和内存硬件

几个基本的指标：

CPU的时钟频率，也就是主频。主频反映了CPU工作节拍，也就直接决定了CPU周期大小。

CPI和IPC：CPI衡量平均每条指令的平均时钟周期个数。它的反面是IPC。虽然一个指令的执行过程需要多个周期，但IPC是可以大于1的，因为现代CPU都采用流水线结构。一般来讲，测量应用程序运行时的IPC，如果低于1，这个运行的系统性能就不是太好，需要做些优化来提高IPC。

MIPS：每秒执行的百万指令数。我们经常会需要比较不同CPU硬件的性能，MIPS就是一个很好的指标，一般来讲，MIPS越高，CPU性能越高。MIPS可以通过主频和IPC相乘得到，也就是说MIPS=主频×IPC。

CPU缓存：一般CPU都有几级缓存，分别称为L1、L2、L3。L3是最后一级缓存。

值得一提的是现在的NUMA处理器会有本地和远端内存的区别，当访问本地节点的内存是会快一些。

四、操作系统和应用程序相关

我们刚刚谈了硬件方面，下面看看软件，也就是操作系统和应用程序。

1、几个重要概念和指标

指令分支延迟：CPU需要先获取指令，然后才能执行。获取下一条指令时需要知道指令地址，如果这个地址需要根据现有的指令计算结果才能决定，那么就构成了指令分支。CPU通常会采取提前提取指令这项优化来提高性能，但是如果是指令分支，那么就可能预测错误，预先提取的指令分支并没有被执行。

互斥加锁和解锁：互斥锁（也叫Lock）是在多线程中用来同步的，可以保证没有两个线程同时运行在受保护的关键区域。

上下文切换：多个进程或线程共享CPU的时候，就需要经常做上下文切换。这种切换在CPU时间和缓存上都很大代价；尤其是进程切换。

2、Linux平均负载

系统过载并超过1.0的负载值有时不是问题，因为即使有一些延迟，CPU也会处理队列中的作业，负载将再次降低到1.0以下的值。但是如果系统的持续负载值大于1，则意味着它无法吸收执行中的所有负载，因此其响应时间将增加，系统将变得缓慢且无响应。高于1的高值，尤其是最后5分钟和15分钟的负载平均值是一个明显的症状，要么我们需要改进计算机的硬件，通过限制用户可以对系统的使用来节省更少的资源，或者除以多个相似节点之间的负载。

因此，我们提出以下建议：

=0.70：没有任何反应，但有必要监控CPU负载。如果在一段时间内保持这种状态，就必须在事情变得更糟之前进行调查。

=1.00：存在问题，您必须找到并修复它，否则系统负载的主要高峰将导致您的应用程序变慢或无响应。

=3.00：你的系统变得非常慢。甚至很难从命令行操作它来试图找出问题的原因，因此修复问题需要的时间比我们之前采取的行动要长。你冒的风险是系统会更饱和并且肯定会崩溃。

=5.00：你可能无法恢复系统。你可以等待奇迹自发降低负载，或者如果你知道发生了什么并且可以负担得起，你可以在控制台中启动kill-9process_name之类的命令，并祈求它运行在某些时候，以减轻系统负荷并重新获得其控制权。否则，你肯定别无选择，只能重新启动计算机。

五、网络相关

网络的传输延迟是和地理距离相关的。网络信号传递速度不可能超过光速，一般光纤中速度是每毫秒200公里左右。如果考虑往返时间（RTT），那么可以大致说每100公里就需要一毫秒。

在机房里面，一般的传输RTT不超过半毫秒。如果是同一个机柜里面的两台主机之间，那么延迟就更小了，小于0.1毫秒。

另外要注意的是，传输延迟也取决于传输数据的大小，因为各种网络协议都是按照数据包来传输的，包的大小会有影响。比如一个20KB大小的数据，用1Gbps的网络传输，仅仅网卡发送延迟就是0.2毫秒。

六、中间件相关

具体的数值和机器配置以及测试案例有关，但大概的量级不会变化很大。

如果是业务系统，由于业务复杂度差异很大，有的每秒500请求可能就是高性能了，因此需要针对业务进行性能测试，确立性能基线，方便后续测试做比较。

七、网站规模

这里就大致根据理论最大TPS，给网站做几个分类：

小网站：没什么好说的，简单的小网站而已，你可以用最简单的方法快速搭建，短期没有太多的技术瓶颈，只要服务器不要太烂就好。

DB极限型：大部分的关系型数据库的每次请求大多都能控制在10ms左右，即便你的网站每页面只有一次DB请求，那么页面请求无法保证在1秒钟内完成100个请求，这个阶段要考虑做Cache或者多DB负载。无论那种方案，网站重构是不可避免的。

带宽极限型：目前服务器大多用了IDC提供的“百兆带宽”，这意味着网站出口的实际带宽是8MByte左右。假定每个页面只有10KByte，在这个并发条件下，百兆带宽已经吃完。首要考虑是CDN加速／异地缓存，多机负载等技术。

内网带宽极限＋cache极限型：由于Key/value的特性，每个页面对cache的请求远大于直接对DB的请求，cache的悲观并发数在2w左右，看似很高，但事实上大多数情况下，首先是有可能在次之前内网的带宽就已经吃光，接着是在8KQPS左右的情况下，cache已经表现出了不稳定，如果代码上没有足够的优化，可能直接将压力穿透到了DB层上，这就最终导致整个系统在达到某个阀值之上，性能迅速下滑。

FORK/SELECT，锁模式极限型：一句话：线程模型决定吞吐量。不管你系统中最常见的锁是什么锁，这个级别下，文件系统访问锁都成为了灾难。这就要求系统中不能存在中央节点，所有的数据都必须分布存储，数据需要分布处理。总之，关键词：分布

C10K极限：尽管现在很多应用已经实现了C25K，但短板理论告诉我们，决定网站整体并发的永远是最低效的那个环节。

八、服务器规模

我们可以来算一下，根据行业内的经验，可以估计如下的投入：

可以看到，十万用户到上亿用户，也就多了100倍，为什么服务器需要1000倍？这完全不是呈线性的关系。

这时因为，当架构变复杂了后，你就要做很多非功能的东西了，比如，缓存、队列、服务发现、网关、自动化运维、监控等。

九、总结

今天分享了几组性能数字，希望起到抛砖引玉的效果。你可以在此基础上，在广度和深度上继续扩展。