Category Archives: 架构

LB 负载均衡的层次结构

一月 3, 2017Tomcat, Web, 架构负载均衡dotte

作为后端应用的开发者，我们经常开发、调试、测试完我们的应用并发布到生产环境，用户就可以直接访问到我们的应用了。但对于互联网应用，在你的应用和用户之间还隔着一层低调的或厚或薄的负载均衡层软件，它们不显山不露水默默的发挥着重要的作用，以至于我们经常忽略了它们的存在。因为负载均衡层通常不在一般开发人员的问题域内，而且它们一般都是现成且成熟的解决方案，以至于我们习惯性的忽略和认为乏善可陈。其实不然，本文就写写我对负载均衡层次结构的认知和理解。

硬负载

所谓「硬负载」就是采用硬件设备来提供负载均衡。

在七、八年前那时我在做 Java 的企业软件开发，开发出来的企业级 Java 应用程序就部署在像 Weblogic 之类的应用容器中。而这类应用容器软件又跑在 Unix 的小型机上。把硬件和软件一体打包作为企业应用解决方案卖给客户。这类应用部署的方案十分简单，层级也比较浅。为了保证可靠性，使用两套小型机上各部署一个 Weblogic Server，在应用服务前面使用像 F5 之类的硬件负载均衡器，如下图所示。

由于小型机和前面的 F5 负载均衡硬件都比较贵，所以出于可靠性、可维护性和成本的综合考虑，一般应用部署两套跑在两台小型机上，在前面共享一个 F5 做负载均衡。而一般 F5 和小型机这类硬件设备都至少是 5 个 9 的可靠性保障，所以整体的系统可靠性基本有保障。

进入互联网时代后，应用开发拥抱开源，部署使用更廉价的 PC Server 和免费开源的应用容器。负载均衡也逐步从硬负载向软负载变迁，由于互联网应用的海量特性和部署规模的急剧膨胀，前端负载均衡也开始变得丰富起来。

软负载

进入互联网公司后，我们刚开始开发应用时，业务规模小用户量还不大，机器数量也少（<10）。所以一开始的负载均衡的结构也是很简单的，类似硬负载只是把硬件换成了免费的开源软件并跑在可用性是有 3 个 9 的廉价 PC Server 上。

前面一个 LVS 后面跟着几个应用服务，后来为了方便做按域名的分流和适配切流量上线，中间又加了一层 Nginx。

这样就变成了两层软负载结构了，LVS 负责 4 层，Nginx 负责 7 层。但 Nginx 只负责了单机内多实例的负载均衡，这里主要是因为当时 PC Server 是物理机，CPU 16/32 core，内存 32/64G 不等，为了更充分的利用资源，一台物理机上都部署了多个应用服务实例，而考虑到 Nginx 工作在 7 层的开销远高于 LVS/DR 模式，所以一般在一个 Nginx 后面挂的实例数也不会超过 10 个。

但随着业务发展和用户流量上升，机器规模也在不断扩张，导致一个网段内的 IP 都不够用了，这套负载结构又遇到了横向扩展的瓶颈，因为 LVS/DR 模式下跨不了网段。所以后来又在 LVS 和 Nginx 之间加了一层 HAProxy，负载结构就变成了下面这样。

其实加了 HAProxy 之后，它也是工作在 7 层，这样 Nginx 这层看起来就不是很有必要。但三层的负载结构能支撑更大规模的集群，而原本在 Nginx 层做了一套方便研发切流量上线的运维管理系统，所以牺牲一点性能换取现在的可维护性和将来扩展性，Nginx 这层就一直保留下来了。而且 Nginx 相比 HAProxy 不是纯粹的负载均衡器，它还能提供 cache 功能，对于某些 HTTP 请求实际只走到 Nginx 这层就可以通过缓存命中而返回。

DNS负载

随着业务发展，公司开始了多个 IDC 的建设，考虑到 IDC 级别的容灾，集群开始部署到多个 IDC。跨 IDC 的负载均衡方案可以简单通过 DNS 轮询来实现，但可控性不好。所以我们没有采用这种，而是采用一主加多子域名的方式来基于业务场景实现动态域名调度和负载。主域名下实际是一个动态流量调度器，跨多个 IDC 部署，对于 HTTP 请求基于重定向方式跳子域名，对于 TCP 方式每次建立长连接前请求分配实际连接的子域名，如下图所示。

CDN负载

最后再加上互联网应用必不可少的 CDN 将静态资源请求的负载分流，那么整个负载的层次结构就完整了。

SSL 带来的负载结构变化

随着互联网的普及，安全问题益发严重，原本早期只有银行网银等使用 HTTPS 方式访问，现在电商类网站也开始启用全站 HTTPS 了。引入 SSL 后对负载结构带来了什么影响么？SSL 属于应用层的协议，所以只能在 7 层上来做，而 HAProxy 也是支持 SSL 协议的，所以一种方式是只需简单的让 HAProxy 开启 SSL 支持完成对内解密对外加密的处理。

但 HAProxy 的作者不太赞同这种方案，因为引入 SSL 处理是有额外的性能开销的。那么在承担确定流量的情况下，假设原本需要 M 台 HAProxy，在开启了 SSL 后可能需要 M + N 台 HAProxy。随着流量增长，这种方式的横向扩展成本较高（毕竟 SSL 证书按服务器数量来收费的）。他给出的解决方案是再独立一层 SSL 代理缓存层，像下面这样。

L4 和 L7 之间独立的 SSL 代理缓存层只负责 SSL 协议的处理，把 HTTPS 转换成 HTTP，并检查本地缓存是否命中。若未命中再转发请求到后端的 L7 层应用负载均衡层。这样的好处是每个层次都可以根据流量来独立伸缩，而且 SSL 层显然可以跨多个应用共享，更节省成本。如果按这个思路来重新调整我们前面的负载均衡结构层次，将会演变成下面这样。

其实，这时我觉得应用前面的那层 Nginx 可能就显得多余了点，不是必需的。但如果现实这么演进下来很可能就会有这么一层冗余的东西存在很长一段时间，这就是理想和现实之间的差距吧。

总结

好了，本文到此为止。作为一名后台开发我其实对上面提及的各类开源软件如何配置、调优和管理并不熟悉，这属于运维开发的问题域范畴。但这并不妨碍我去了解我所开发的应用所处的整个环境是怎样的，多了解些你工作领域范围边界外的 What 和 Why，有时也能帮助我们更好的设计和解决自身问题域内的问题，别为自己设限而最终画地为牢。

本来以为负载均衡这个古老的课题已经定型了，在写本文时又看到新闻，在近日举办的第十三届网络系统设计与实现 USENIX 研讨会上，来自 Google 的工程师又分享了其自研的 Maglev 负载均衡器。刚下了论文还没看，回头看了再来写写。

参考

[1] HAProxy Documentation. HAProxy Management Guide
[2] HAProxy Documentation. HAProxy Starter Guide
[3] Willy Tarreau. Making applications scalable with Load Balancing
[4] LVS wiki. Load balancing
[5] Wikipedia. Virtual Router Redundancy Protocol
[6] shuming. LVS 工作模式以及工作原理

from:http://www.cnblogs.com/mindwind/p/5339657.html

Facebook Architecture

十二月 22, 2016架构Facebook, 架构dotte

refer:http://stackoverflow.com/questions/3533948/facebook-architecture

架构师到底是做什么的？

十二月 12, 2016架构架构师dotte

我要成为一个软件架构师。

对一个年轻的工程师来说，这是一个很好的目标。

我要领导一个团队，还要做所有关于数据库、框架和Web服务器的重要决定。

好吧，如果是这样，你就没必要成为一个软件架构师了。

当然有必要了！我要成为一个能够做所有重要决定的人。

这样很好，只是你没有列出哪些才是重要的决定。你刚才说的那些跟重要的决定没有什么关系。

你说什么？难道数据库不重要？你知道我们在数据库上面花了多少钱吗？

可能很多。不过数据库仍然不是最重要的。

你怎么能这么说呢？数据库可是整个系统的心脏啊！所有的数据都保存在这里，它们在这里被排序，被索引，被访问。如果没有数据库，整个系统就无法运作！

数据库只不过是一个IO设备，它提供了一些有用的工具对数据进行排序、查询，并生成报表，但这些工具都只是整个系统的附属品。

附属品？真是不可思议。

是的，附属品。你的系统业务逻辑或许会用到这些工具，但这些工具并非业务逻辑固有的组成部分。如果有必要，你可以随时替换掉这些工具，但业务逻辑还是那些业务逻辑。

好吧，不过如果把这些工具替换掉，我们就要重新实现业务逻辑了。

那是你的问题。

为什么这么说？

你认为业务逻辑依赖数据库，但实际上不是这样的。如果你的架构足够好，最起码业务逻辑不应该依赖数据库。

这太疯狂了。我怎么可能创建出不使用这些工具的业务逻辑？

我并没有说业务逻辑不要使用数据库工具，我的意思是它们不应该依赖这些工具。业务逻辑不应该知道使用的是哪一种数据库。

如果业务逻辑对数据库一无所知，它怎么使用这些工具呢？

依赖反转。你要让数据库依赖业务逻辑，而不是让业务逻辑依赖数据库。

你的话让人费解。

费解吗？我讲的可是软件架构。这个就是依赖反转原则，让下层策略来依赖上层策略。

那就更加费解了！既然上层策略（假设你指的是业务逻辑）要调用下层策略（假设你指的是数据库），那么就应该是上层策略依赖依赖下层策略，就像调用者依赖被调用者一样。这是众所周知的！

在运行时确实是这样的，但在编译时我们要把依赖反转过来。上层策略的代码里不要引用任何下层策略的代码。

拜托！不引用代码就无法调用它们。

当然可以调用了。面向对象就可以做到。

面向对象对真实世界进行建模，把数据和函数组合到对象里，把代码组织成直观的结构。

这是他们告诉你的吗？

所有人都知道的，这不是很明显的事情吗？

确实如此。不过，面向对象是可以做到不引用也能调用的。

好吧，那它是怎么做到的？

你应该知道，在面向对象系统里对象会给其它对象发送消息的，对吧？

是的，当然。

那么你就该知道，消息发送者是不知道消息接收者是什么类型的。

这要看使用的是哪一种语言了。在Java里，发送者最起码要知道接收者的基本类型。在Ruby里，发送者知道接收者一定会处理它所发送的消息。

是的。不过不管是哪一种情况，发送者都不知道接收者具体的类型。

嗯，是的。

所以发送者可以给接收者传递一个函数，让接收者执行这个函数，这样发送者就不需要知道接收者是什么类型了。

没错。我了解你的意思。不过发送者仍然依赖接收者。

在运行时确实是的，但在编译时不是这样的。发送者的代码里并没有引用接收者的代码。实际上，是接收者的代码依赖了发送者的代码。

啊！但发送者仍然会依赖接收者的类。

看来需要用代码来说明了，我用Java来写些代码。首先是发送者代码：

package sender;
public class Sender {
  private Receiver receiver;
  public Sender(Receiver r) {
    receiver = r;
  }
  public void doSomething() {
    receiver.receiveThis();
  }
  public interface Receiver {
    void receiveThis();
  }
}

下面是接收者代码：

package receiver;
import sender.Sender;
public class SpecificReceiver implements Sender.Receiver {
  public void receiveThis() {
    //这里会做一些有趣的事情
  }
}

可以看到，接收者代码依赖了发送者代码，也就是说SpecificReceiver依赖了Sender。同时可以看到，发送者代码对接收者代码一无所知。

哈，你作弊了。你把接收者的接口放到了发送者的类里了。

你开始明白了。

明白什么？

当然是架构原则啊。发送者持有接收者必须实现的接口。

如果这意味着我要使用内部类，那么……

使用内部类只是方法之一，还有其它的方法。

请等一下。最开始我们讨论的是数据库，那这些跟数据库又有什么关系呢？

让我们来看一下其它代码吧。首先是一个简单的业务逻辑

package businessRules;
import entities.Something;
public class BusinessRule {
  private BusinessRuleGateway gateway;
  public BusinessRule(BusinessRuleGateway gateway) {
    this.gateway = gateway;
  }
  public void execute(String id) {
    gateway.startTransaction();
    Something thing = gateway.getSomething(id);
    thing.makeChanges();
    gateway.saveSomething(thing);
    gateway.endTransaction();
  }
}

这个业务逻辑没有做什么事情啊。

这只是个例子。在实际实现业务逻辑的时候，不会有很多类似这样的类的。

好吧。那么Gateway是用来做什么的呢？

它为业务逻辑提供了所有访问数据的方法。下面是它的代码：
package businessRules;
import entities.Something;
public interface BusinessRuleGateway {
  Something getSomething(String id);
  void startTransaction();
  void saveSomething(Something thing);
  void endTransaction();
}
要注意，这个接口是在businessRules包里面的。

好吧。那Something这个类又是用来做什么的呢？

它代表一个简单的业务对象。我把它放在另一个叫entities的包里。
package entities;
public class Something {
  public void makeChanges() {
    //...
  }
}
最后需要实现BusinessRuleGateway接口，这个实现类会知道相关的数据库细节：

package database;
import businessRules.BusinessRuleGateway;
import entities.Something;
public class MySqlBusinessRuleGateway implements BusinessRuleGateway {
  public Something getSomething(String id) {
    // 从MySQL里读取一些数据
  }
  public void startTransaction() {
    // 开始一个事务
  }
  public void saveSomething(Something thing) {
    // 把数据保存到MySQL
  }
  public void endTransaction() {
    // 结束事务
  }
}

可以看到，业务逻辑是在运行时对数据库进行调用的。而在编译时，是database包引用了businessRules包。

好吧，我想我明白了。你用多态性隐藏了数据库实现。不过在业务逻辑里，仍然引用了数据库的工具接口。

不，不是这样的。我们并没有打算为业务逻辑提供所有的数据库工具接口，而是业务逻辑创建了它们所需要的接口。在实现这些接口的时候，可以调用相应的工具。

嗯，这样的话，如果业务逻辑需要所有的工具，那么你必须把所有工具都放到Gateway接口里。

哈，我觉得你还是没有明白。

不明白什么？我觉得已经很清楚了。

每个业务逻辑只定义它所需要的接口。

等等，什么意思？

这个叫作接口分离原则。每个业务逻辑只使用一部分数据库工具，所以每个业务逻辑只定义能够满足需要的接口。

这样的话，你就会有很多接口，而且有很多实现类。

哈，是的。你开始明白了。

这样子很浪费时间！我为什么要这样做呢？

这样做是为了让代码更干净，并且节省时间。

算了吧，这样只会增加更多的代码。

相反，这其实是很重要的架构决定，这跟你之前所说的那些所谓的重要决定是不一样的。

什么意思？

还记得你刚开始说你要成为一个软件架构师吗？你还想要做所有重要的决定？

是啊，我是这么想过。

你想做所有关于数据库、Web服务和框架的决定。

是啊，而你却说它们都不重要，还说它们其实跟重要的决定不相干。

没错，它们确实跟重要的决定不相干。一个软件架构师真正要做的重要决定都在数据库、Web服务器和框架之外。

但首先要先决定用什么数据库、Web服务器或框架啊！

what-architect-do 架构师

不，实际上应该在开发后期才开始做这些事情——在你掌握了更多信息之后。
哀，当架构师草率地决定要使用一个数据库，后来却发现使用文件系统效率更高。
哀，当架构师草率的决定使用一个Web服务器，后来却发现团队需要的不过是一个socket借口。
哀，当架构师草率地决定使用一个框架，后来却发现框架提供的功能是团队不需要的，反而给团队带来了诸多约束。
幸，当架构师在掌握了足够多的信息后才决定该用什么数据库、Web服务器或框架。
幸，当架构师为团队鉴别出运行缓慢、耗费资源的IO设备和框架，这样他们就可以构建飞速运行的轻量级测试环境。
幸，当架构师把注意力放在那些真正重要的事情上，并把那些不重要的事情放在一边。

我完全不知道你在说什么了。

from:http://www.infoq.com/cn/news/2016/12/What-architect-do

InfoQ2016北京架构峰会

十二月 9, 2016架构InfoQdotte

http://bj2016.archsummit.com/schedule

IPC(Inter-process communication)进程间通讯

十月 21, 2016操作系统, 架构, 计算理论IPCdotte

进程间通讯方式

Method	Short Description	Provided by (operating systems or other environments)
File	A record stored on disk, or a record synthesized on demand by a file server, which can be accessed by multiple processes.	Most operating systems
Signal; also Asynchronous System Trap	A system message sent from one process to another, not usually used to transfer data but instead used to remotely command the partnered process.	Most operating systems
Socket	A data stream sent over a network interface, either to a different process on the same computer or to another computer on the network. Typically byte-oriented, sockets rarely preserve message boundaries. Data written through a socket requires formatting to preserve message boundaries.	Most operating systems
Message queue	A data stream similar to a socket, but which usually preserves message boundaries. Typically implemented by the operating system, they allow multiple processes to read and write to the message queue without being directly connected to each other.	Most operating systems
Pipe	A unidirectional data channel. Data written to the write end of the pipe is buffered by the operating system until it is read from the read end of the pipe. Two-way data streams between processes can be achieved by creating two pipes utilizing standard input and output.	All POSIX systems, Windows
Named pipe	A pipe implemented through a file on the file system instead of standard input and output. Multiple processes can read and write to the file as a buffer for IPC data.	All POSIX systems, Windows, AmigaOS 2.0+
Semaphore	A simple structure that synchronizes multiple processes acting on shared resources.	All POSIX systems, Windows, AmigaOS
Shared memory	Multiple processes are given access to the same block of memory which creates a shared buffer for the processes to communicate with each other.	All POSIX systems, Windows
Message passing	Allows multiple programs to communicate using message queues and/or non-OS managed channels, commonly used in concurrency models.	Used in RPC, RMI, and MPI paradigms, Java RMI, CORBA, DDS, MSMQ, MailSlots, QNX, others
Memory-mapped file	A file mapped to RAM and can be modified by changing memory addresses directly instead of outputting to a stream. This shares the same benefits as a standard file.	All POSIX systems, Windows

The following are messaging and information systems that utilize IPC mechanisms, but don’t implement IPC themselves:

9P (Plan 9 Filesystem Protocol)
Common Object Request Broker Architecture (CORBA)
D-Bus
Distributed Computing Environment (DCE)
Message Bus (Mbus) (specified in RFC 3259)
MCAPI Multicore Communications API
ONC RPC
XML XML-RPC or SOAP
JSON JSON-RPC
SIMPL The Synchronous Interprocess Messaging Project for Linux (SIMPL)
Thrift
ZeroC‘s Internet Communications Engine (ICE)
ØMQ
Enduro/X Middleware
YAMI4

Interprocess communication for Windows in C#

refer:Inter-process communication

Dotte博客

大数据、云计算、架构、语言的本质、计算的未来