actor模型漫谈

2012-09-07

摘要

这篇文章，从go语言的channel，讲到我自己写的线程库task，从分发/订阅模式，讲到actor模型。算是一个漫谈吧，都是围绕actor模型相关的东西，目前我的一些模糊的理解。

go语言中的actor

go语言中，通过channel + goroutine配合使用，就能达到actor模型效果了

Actor行为:

var c = make(chan bool)
func Actor() {
<-c
//begin to do the thing
}

func Main() {
go Actor() //观察者在后台开始准备
c <- true //通知观察者
}

一个goroutine就是一个actor，通信是通过语言提供的管道完成的。go语言的goroutine是非常轻量级的，又可以充分发挥多核的优势。actor模式的核心就在这里，无锁+充分利用多核，actor之间通过消息通信共同工作。

actor模型分类

Actor模型的任务调度方式分为“基于线程（thread-based）的调度”以及“基于事件（event-based）的调度”两种。

基于线程的

基于线程的调度为每个Actor分配一个线程，在接受一个消息（如在Scala Actor中使用receive）时，如果当前Actor的“邮箱（mail box）”为空，则会阻塞当前线程直到获得消息为止。

基于线程的调度实现起来较为简单，例如在.NET中可以通过Monitor.Wait/Pulse来轻松实现这样的生产/消费逻辑。

不过基于线程的调度缺点也是非常明显的，由于线程数量受到操作系统的限制，把线程和Actor捆绑起来势必影响到系统中可以同时的Actor数量。

而线程数量一多也会影响到系统资源占用以及调度，而在某些情况下大部分的Actor会处于空闲状态，而大量阻塞线程既是系统的负担，也是资源的浪费。

因此基于线程的调度是一个拥有重大缺陷的实现，现有的Actor Model大都不会采取这种方式。

基于事件的

于是另一种Actor模型的任务调度方式便是基于事件的调度。“事件”在这里可以简单理解为“消息到达”事件，而此时才会为Actor的任务分配线程并执行。

很容易理解，我们现在便可以使用少量的线程来执行大量Actor产生的任务，既保证了运算资源的充分占用，也不会让系统在同时进行的太多任务中“疲惫不堪”，这样系统便可以得到很好的伸缩性。

在Scala Actor中也可以选择使用“react”而不是“recive”方法来使用基于事件的方式来执行任务。

线程级actor模型的实现

go语言中的goroutine和channel自是不用说。goroutine是非常轻量，而且调度器会使用多核。这个语言的设计就是打算这么干的。

lua语言中的coroutine协程，在某种程度上也可以完成actor模型的工作，就是不太好用。是手动的yield和resume的，没有channel而是通过yield和resume的参数来传递消息。

我自己写过一个[[https://github.com/tiancaiamao/task][线程库]]，类似coroutine做的事情，有点像lua和go中的coroutine的一个结合。像lua一样单线程又像go一样支持channel。可以像线程级actor模型这么用。

当然，只是玩具代码，通过swapcontext保存上下文实现的，轻量还算是轻量。这么用还是有问题，主要二个:

不像go语言，我写的这个东东不能线程的栈自动扩张
用户级的线程库，完全没有用到多核

第二点太要命了，actor模型的出发点就是充分利用多核优势的。当然出发点不一样，我本来也不是写个actor框架的。

要是真的用C语言搞一个这种东西，搞到最后就是go语言的一个拙劣的模仿品。消息队列和一些数据结构倒是蛮有用。后面再考虑自己写一个actor的框架玩玩吧...等有时间了。

RPC与分发/订阅

本文是actor模型漫谈，为什么会谈到RPC和分发/订阅呢？

还是因为中间有相似的东西。先看RPC，想一想RPC的流程，client做一个RPC调用，其实是向server发一个消息，让server做某事，server做完后回client一条消息。

整个过程就像client在调用某个函数一样，只管给个输入，调用一个函数，返回后得到一个结果。它不用在乎过程如何实现的，即这个函数发生在本地还是远程。

换一个角度看，其实RPC就是一种actor模型。client和server都是一个actor，前者通知后者去做某事，不去管后者是如何做的，两个actor之间通过消息通信进行协作。

当然真正的RPC实现中会复杂的多。首先涉及到序列化和反序列化的工作，专业术语叫marshall和unmarshall。

这个解决的是调用参数的问题。比如参数传一个结构体，或是传一个int又或是string，要序列化为一条消息才能通过网络上传输到server那边去。marshall就做这个事。

完了server收到消息，又需要unmarshall出client发过来的参数，再调用自己对应的函数。

server如何知道要调用哪个函数？client又如何知道哪个server提供了哪些服务函数呢？这里就要讲到分发/订阅了。

首先要有一个中心server，它做两件事情：

接受注册事件。某个server提供什么函数，就向中心server注册一下。这就是发布过程。
响应查询事件。某个client可以向中心server查到谁谁谁，提供了什么样的RPC调用。

当然中间有点不同的地方。分发/订阅是client消息直接发到中心server，由中心server再发到其它server去执行，其它server充当的是worker的角色。
而RPC的中心server只是提供一个查询，返回结果中包含了比如server的端口等一些信息，后面是由client去发消息的。

actor模型

前面废话了这么久，最后，想一想怎么设计一个actor模型的编程框架。

其实云风的[[https://github.com/cloudwu/skynet][skynet]]从某种意义上看，就是一个这种框架。把actor如何通过消息通信弄出来由框架实现的，它上面每个skynet_context就是一个actor，完成某种特定的服务。

橫看成岭侧成峰，你可以说它是一个消息通信的框架，每个服务完成自己的任务，它就是actor，等待消息来然后做对应的处理。至于消息怎么来它不管，由框架做了。

框架做的事情也很专一：分发消息，调用对应actor的回调函数。有个线程池，actor不等于线程。这是一个基于事件的actor模型。

不管是基于线程，或者是基于事件，总结规律，看它们的共同特点:

都有一个回调函数
都有消息队列

线程自然是有回调函数，这个就是线程启动后执行的函数。至于基于事件的，它的回调函数就很像RPC中server注册回调函数那样了。回调函数只是一个入口，消息会有类型，然后再解包消息，像protol buffer什么的。

消息队列是都有的。明显，因为actor处理消息的速度可能达不到消息来的速度，这样就必须搞个消息队列排队，并阻塞发送者。

再看不同点。最核心的就是"消息队列"是隐式的还是显式的。这个决定了和使用上的不同。

显式比如通道这东西。actor之间不是直接传消息而是一个传给actor，而是一个写通道，另一个读通道，这个通道就是消息队列。

隐式的就没有把消息队列暴露出来，而是actor自己私有的。比如skynet中是由框架调度发给具体的actor的消息队列。

这个不同之处有多大影响呢？主要影响了编程的模式。

像skynet感觉这么搞编程模式就有一点麻烦。自己写模块，向框架注册回调函数，有消息到来的回调函数就会被执行。