nodejs 多核处理模块cluster

来源:互联网 发布:软件侵权被起诉 编辑:程序博客网 时间:2024/05/16 14:47
1. cluster介绍
cluster是一个nodejs内置的模块,用于nodejs多核处理。cluster模块,可以帮助我们简化多进程并行化程序的开发难度,轻松构建一个用于负载均衡的集群。

2.cluster的简单使用

const cluster = require('cluster');const http = require('http');if (cluster.isMaster) {     console.log(`Master process ${process.pid} is running`);    //keep track of http request    let numReqs = 0;    // setInterval(()=>{    //     console.log(`numReqs=${numReqs}`);    // },1000);    //count request    function messageHandler(msg) {        if(msg.cmd && msg.cmd === 'notifyRequest') {            numReqs += 1;                    }    }    //Start workers and listen for messages containing notifyRequest    const numCPUs = require('os').cpus().length;    for(let i=0;i<numCPUs;i++) {        cluster.fork();    }        //cluster.fork();    for(const id in cluster.workers) {        console.log('work process id:'+id);        cluster.workers[id].on('message', messageHandler);    }    cluster.on('listening',function(worker,address){        console.log('[master] '+'listening:worker'+worker.id+",pid:"+worker.process.pid+",address:"+address.address+":"+address.port);    });} else {    //Worker processes have a http server    http.createServer(function(req,res){        res.writeHead(200,{'Content-Type':'text/plain;charset=utf-8'});        res.end('Worker'+cluster.worker.id+',PID:'+process.pid+'\n');               //notify master about the request        process.send({'cmd':'notifyRequest'});    }).listen(6000);    console.log(`Worker ${process.pid} started`);}


在Linux环境下运行此程序,本例会生成四个工作进程来处理客户端的请求,而且能够实现请求任务的负载均衡。

具体运行命令:node cluster.js

然后出现如下运行结果:



3.用cluster实现负载均衡
在Linux环境下通过curl方式访问来测试,请求是否会被四个worker进程来处理,
以下是实际测试结果图;



4.cluster负载均衡压力测试
压力测试我使用的siege工具,分别测试了一些1个工作进程和4个工作进程的效果,发现差别还是有的,但是不大。
具体测试图如下:
1个worker进程压力测试,50个并发:


4个worker进程压力测试,也是50个并发:



5. cluster的工作原理

每个worker进程通过使用child_process.fork()函数,基于IPC(Inter-Process Communication,进程间通信),实现与master进程间通信。

当worker使用server.listen(...)函数时 ,将参数序列传递给master进程。如果master进程已经匹配workers,会将句柄传递给工作进程。如果master没有匹配好worker,那么会创建一个worker,再将句柄传递给worker。

在边界条件,有3个有趣的行为:
注:下面server.listen(),是对底层“http.Server-->net.Server”类的调用。

1. server.listen({fd: 7}):在master和worker通信过程,通过传递文件,master会监听“文件描述为7”本身,而不是传递“文件描述为7”的引用。
2. server.listen(handle):master和worker通信过程,通过handle函数进行通信,而不用进程联系
3. server.listen(0):在master和worker通信过程,集群中的worker会打开一个随机端口共用,通过socket通信,像上例中的57132
当多个进程都在 accept() 同样的资源的时候,操作系统的负载均衡非常高效。
Node.js没有路由逻辑,worker之间没有共享状态。所以,程序要设计得简单一些,比如基于内存的session。

因为workers都是独立运行的,根据程序的需要,它们可以被独立删除或者重启,worker并不相互影响。只要还有workers存活,则master将继续接受连接。Node不会自动维护workers的数目。我们需要根据需要在应用程序中自己管理这些进程池。


6. cluster的API

官网地址:http://nodejs.org/api/cluster.html#cluster_cluster

cluster对象
cluster的各种属性和函数

cluster.setttings:配置集群参数对象
cluster.isMaster:判断是不是master节点
cluster.isWorker:判断是不是worker节点
Event: 'fork': 监听创建worker进程事件
Event: 'online': 监听worker创建成功事件
Event: 'listening': 监听worker向master状态事件
Event: 'disconnect': 监听worker断线事件
Event: 'exit': 监听worker退出事件
Event: 'setup': 监听setupMaster事件
cluster.setupMaster([settings]): 设置集群参数
cluster.fork([env]): 创建worker进程
cluster.disconnect([callback]): 关闭worket进程
cluster.worker: 获得当前的worker对象
cluster.workers: 获得集群中所有存活的worker对象
worker对象
worker的各种属性和函数:可以通过cluster.workers, cluster.worket获得。

worker.id: 进程ID号
worker.process: ChildProcess对象
worker.suicide: 在disconnect()后,判断worker是否自杀
worker.send(message, [sendHandle]): master给worker发送消息。注:worker给master发送消息要用process.send(message)
worker.kill([signal='SIGTERM']): 杀死指定的worker,别名destory()
worker.disconnect(): 断开worker连接,让worker自杀
Event: 'message': 监听master和worker的message事件
Event: 'online': 监听指定的worker创建成功事件
Event: 'listening': 监听master向worker状态事件
Event: 'disconnect': 监听worker断线事件
Event: 'exit': 监听worker退出事件