介绍 本文主要介绍 RPC 是什么, 为什么要使用 RPC,使用 RPC 需要解决问题及 RPC 使用实例
RPC 是什么 RPC(Remote Procedure Call)远程过程调用协议,一种通过网络从远程计算机上请求服务,而不需要了解底层网络技术的协议。RPC 它假定某些协议的存在,例如 TPC/UDP 等,为通信程序之间携带信息数据。在 OSI 网络七层模型中,RPC 跨越了传输层和应用层,RPC 使得开发,包括网络分布式多程序在内的应用程序更加容易。
简单一点说:就是向远程服务器发送请求,做业务处理或任务计算等 (即程序),就是想要把调用远程服务器中方法的过程和像调用本地方法一样简单。
为什么要使用 RPC 当我们无法在一个进程内,甚至通过本第地调用的方式满足我们的需求时,比如我们的通讯系统,甚至不同的组织间的通讯,由于计算能力需要横向扩展,需要在多台机器组成的集群上部署应用,这才能是我们进行远程的通讯;又或者说电商系统,我们不可能靠着本地调用就能满足我们的需求,例如提交订单的处理方法,库存处理方法等在本地调用,在肯定是不行的,这是用户发起相应的请求由我们远程服务器去做业务处理和计算的。所以 RPC 就显得如此重要了。
使用 RPC 需要解决问题 这里我们来看,我们想象一下当我们在远程调用 (也就是使用 RPC) 的过程中,我们需要执行的函数或者方法在远程机器上,例如我们要调用远程计算机的 add 方法,下面就会有这几个问题:
- Call ID 映射。 我们要怎么告诉远程计算机我们需要调用的是 add 方法,而不是 reduce 方法,mult 方法,divi 方法等,在本地调用中,函数体是直接通过函数指针来指定的,当我们调用本地 add 方法时,编译器会自动给我们调用到它相应的函数指针,而在远程调用中,使用指针明显是不行的,因为两个进程的地址不同。所以,在 RPC 中,所有函数都必须有一个唯一的 ID,这个 ID 在所有进程中都是唯一确定的,客户端在调用时都必须附加上这个 ID,然后我们还需要在客户端和服务端分别维护一个 {函数 <—–> Call ID } 的对应表,两者的表不一定需要完全相同,但相同的函数对应的 Call ID 必须相同,当客户端需要进行远程调用时,它就查一下这个表,找出相应的 Call ID,然后把它传给服务端,服务端也通过查表,来确定客户端需要调用的函数,然后执行相应函数的代码。
- 序列化及反序列化。客户端怎么把参数值传给远程的函数呢?在本地调用中,我们只需要把参数压到栈里,然后让函数自己去栈里读就行。但是在远程过程调用时,客户端跟服务端是不同的进程,不能通过内存来传递参数。甚至有时候客户端和服务端使用的都不是同一种语言(比如服务端用 C++,客户端用 Java 或者 Go)。这时候就需要客户端把参数先转成一个字节流,传给服务端后,再把字节流转成自己能读取的格式。这个过程叫序列化和反序列化。同理,从服务端返回的值也需要序列化反序列化的过程
整个流程如下: 3. 网络传输。远程调用往往用在网络上,客户端和服务端是通过网络连接的。所有的数据都需要通过网络传输,因此就需要有一个网络传输层。网络传输层需要把 Call ID 和序列化后的参数字节流传给服务端,然后再把序列化后的调用结果传回客户端。只要能完成这两者的,都可以作为传输层使用。因此,它所使用的协议其实是不限的,能完成传输就行。尽管大部分 RPC 框架都使用 TCP 协议,但其实 UDP 也可以,而 gRPC 干脆就用了 HTTP2。Java 的 Netty 也属于这层的东西。
解决了上面三个问题,我们就能实现 RPC 了,现在我们再看看,客户端和服务端在 RPC 中的工作是什么:
客户端 (client):
1. 将这个调用映射为Call ID。这里假设用最简单的字符串当Call ID的方法,例如这里可以:http://127.0.0.1:8080/add?a=1&b=1,即直接使用add作为path,又或者http://127.0.0.1:8080/?method=add&a=1&b=1等
2. 将Call ID,a和b序列化。可以直接将它们的值以二进制形式打包
3. 把2中得到的数据包发送给ServerAddr,这需要使用网络传输层
4. 等待服务器返回结果
4. 如果服务器调用成功,那么就将结果反序列化,并赋给total
服务端 (service):
1. 在本地维护一个Call ID到函数指针的映射call_id_map,可以用dict完成
2. 等待请求,包括多线程的并发处理能力
3. 得到一个请求后,将其数据包反序列化,得到Call ID
4. 通过在call_id_map中查找,得到相应的函数指针
5. 将a和rb反序列化后,在本地调用add函数,得到结果
6. 将结果序列化后通过网络返回给Client
注意:
- Call ID 可以是字符串,也可以是整数 ID,映射其实是一个哈希表
- 序列化与反序列化可以自己写,当然也可以使用 Protobuf 或者 FlatBuffers 之类的。
- 网络传输库可以自己实现 socket,也可以使用 asio,ZeroMQ,Netty 之类。
RPC 使用实例 我们来简单模拟一下 RPC 的调用过程,实例介绍:客户端需要调用远程计算机上的计算方法,这里以加法为例 (当然可以非常复杂的大型计算)
客户端的调用时无需关心远程服务端的 add 方法是怎么实现的,我们只需要在客户端对远程调用的 add 方法的过程进行封装:
service:
由于是简单的例子,就不做完整的错误处理了
package main
import (
"encoding/json"
"fmt"
"net/http"
"strconv"
)
func main() {
http.HandleFunc("/add",
func(writer http.ResponseWriter, request *http.Request) {
err := request.ParseForm()
if err != nil {
panic("解码失败")
}
fmt.Println("path:", request.URL.Path)
a, err := strconv.Atoi(request.Form["a"][0])
if err != nil {
panic("转换失败")
}
b, err := strconv.Atoi(request.Form["b"][0])
if err != nil {
panic(err)
}
writer.Header().Set("Content-Type", "application/json")
jData, err := json.Marshal(map[string]int{
"data": a + b,
})
if err != nil {
panic(err)
}
_, err = writer.Write(jData)
if err != nil {
panic("写入失败")
}
})
err := http.ListenAndServe(":8080", nil)
if err != nil {
panic("监听失败")
}
}
启动服务端
client:
这里同样不做完整的错误处理了 这里我们使用第三方包:github.com/kirinlabs/HttpRequest 使用以下命令获取:
go get github.com/kirinlabs/HttpRequest
当然你也可以使用其他相关的方法来连接我们的 service
package main
import (
"encoding/json"
"fmt"
"github.com/kirinlabs/HttpRequest"
)
type ResponseData struct {
data int `json:"data"`
}
func add(a, b int) int {
req := HttpRequest.NewRequest()
res, err := req.Get(fmt.Sprintf("http://127.0.0.1:8080/add?a=%d&b=%d", a, b))
if err != nil {
panic("连接失败")
}
body, err := res.Body()
if err != nil {
panic(err)
}
var resData ResponseData
err = json.Unmarshal(body, &resData)
if err != nil {
panic("解码失败")
}
return resData.data
}
func main() {
fmt.Println(add(1, 4))
}
打印结果:
{"data":5}
Process finished with the exit code 0
当然我们也可以直接在浏览器里访问:
|