| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 网络协议 -> WebIM原理解析 -> 正文阅读 |
|
[网络协议]WebIM原理解析 |
什么是IM
IM历史最早人们的通信靠的是邮件,需要人去邮局寄信,然后邮递员再经过漫长的旅程送达对方。从前车马很慢,一生只够爱一个人,咳咳。从邮件到传呼机再到有线电话,无线电话,最后随着互联网的发展IM迎来了它的新生。 最早的即时通信软件叫做ICQ,他是四名以色列青年于1996年7月成立的Mirabilis公司推出的产品。然后腾讯接着推出了OICQ。 图片取自网络以及现在主流的聊天应用
IM特性IM的四大特性,有效性、实时性、一致性以及安全性,这四点可以总结为两个字, IM通信协议为了保证可靠,传输层我们一般使用TCP协议,它是面向连接,可靠的流协议,实行“顺序控制”和“重发机制”,还有“流(流量)控制”、“拥塞控制”、提高网络利用率等众多功能。 在PC的早期时代,IM采用的是http短轮询的模式(图1),它会定期、高频地轮询服务器端消息。 图1它的缺点也很明显,会有大量无用的请求,用户端也会非常耗电耗流量,而服务端面对高频QPS,内存资源压力也会非常大 对于短轮询的优化,就出现了长轮询(图2)。相对短轮询,它大幅降低了无用轮询导致的网络与功耗开销,但是服务端悬挂住请求,只是降低了入口请求的QPS,并没有降低服务器的资源开销,假如有1000个请求在等待,那就意味着有1000个线程挂起,被轮询占用消息存储资源。 图2为了更好的解决实时性问题,IM领域经历过几次技术的迭代升级,从简单、低效的短轮询逐步升级到相对效率可控的长轮询,然后随着h5的出现, 服务器的压力也不再是连接数,而是每一条消息事物。 应用层可靠在底层协议的保障后,我们的消息就完全可靠了吗?那肯定不是,我们的服务大致是这样的,用户发送消息给服务端,服务端存储消息,再返回给用户,并把该条消息推给另一个用户,在下图(图4)流程中,每个环节都可能存在消息丢失的风险。
ack机制为了解决用户1到服务端的可靠性问题,我们参考TCP协议的握手、重传机制,来保障应用层消息的可靠性,在发送消息后会有一个定时超时,在超时后根据需要,从ack队列中取出消息重推(图5)。一般情况显示发送失败,交由用户手动重发(比如消息左边一个红色感叹号)。 图5用户发送消息,服务端收到消息后,生成该条消息的唯一id,以ack的形式回传给用户侧,用户侧再更新该条消息id值,后续IM功能中的撤回,去重 ,重发等逻辑都会用到该id。 重发与去重机制在服务端推送消息时,如出错或超时,会有相应的重发机制。比如,设置错误或超时重试三次。 有时因为一些网络或其他情况。服务端会有相应的重发逻辑,在推送消息出现重发时,用户端设置对应的去重逻辑。我们会对消息列表的最新的5条消息进行排序和去重。只取最新5条主要考虑到排序与去重的效率,用户的焦点主要在最新的几条消息,如果因为一些网络原因在消息列表较远处插入消息,会造成用户的困惑与遗漏,另外5条消息的时间差基本满足大多数异常情况的消息丢失场景。如果还有消息遗漏的情况,用户在刷新消息列表时会以http的形式拉取历史消息(当前会话的消息)。 断线重连(Qos机制)websocket 有error和close事件,我们在监听这两个事件后进行相应的重连逻辑,其中在close事件里不对状态码1000(正常关闭)做重连处理。 具体逻辑如下
首先我们有个重连锁,在正在进行重连时不重复触发重连逻辑,在保证ws完全关闭的情况下,会以重连次数的二次幂作为重连的时间间隔,并且在重试时间达到30s后不再递增。这样处理的逻辑一是为了保证在断线或者异常时能马上进行重连的尝试,但是会逐渐减缓重连尝试,假如是服务器负载等问题造成的断开,也避免一直频繁连接给服务器造成压力。 消息就不会丢了吗我们的ack+超时重传+消息去重,能解决大部分消息推送丢失的问题,但比如服务器宕机,电脑手机息屏,手机切换后台等等造成连接断开,通道不可用(图6)。服务端在这个期间推送消息,那如何保证用户能收到完整的消息? 图6一般在这个时候,我们会在重连或者用户窗口可视时对消息进行完整性检查,会以http的形式拉取这段时间的消息,以最后一条消息的时间戳作为参数拉取这个时间段的消息,或者拉取后端会话(session)维度的消息。 心跳机制websocket的连接是无感知的虚拟连接,中间链路出现一些异常情况断开时两边不会感知到,为了保证服务的可靠性,以及降低服务器的开销,我们会有对应的心跳机制(图7),来检测连接是否正常,从而保持连接高可用。 图7在心跳的基础上,能及时支持客户端的心跳断线重连,比如两次心跳没有ack,或者心跳超时没有收到ack(图8)。 图8心跳除了用于重连,还可用于及时释放服务器以及业务资源,取决于IM的场景与策略。比如一些客服聊天场景,客服要尽可能接待更多的用户,为及时释放客服资源,服务端在用户达到固定未收到心跳时间,及时断开客服聊天,释放相应资源。 除此之外,心跳还有连接保活的功能。有时会遇到NAT(Network Address Translator)超时的情况。运营商维护NAT映射表时,为了节约资源和降低 自身网关压力,会定时清除没有数据收发的连接,具体不在这里详情阐述。但这个过程服务端和用户端都无法感知,从而会影响消息收发。下图(图9)是一些运营商的NAT超时时间 图9常用心跳方案
TCP的keepalive 作为系统层TCP/IP协议的已有实现,操作系统默认是关闭的,需要应用层开启,默认配置项周期是2小时,失败后重试9次,超时75s,但是灵活性较差,所以我们一般不采用。应用层心跳能灵活控制,更能结合业务,具体策略如下图(图10) 图10心跳的发送间隔,最简单的就是采用固定心跳时间,另外由于NAT超时时间以及网络环境切换的不确定性,会有一些智能心跳方案,这里分享一下安卓版微信的智能心跳方案。
消息协议好,通信上已经基本没有问题了,有了上述的策略后,IM的消息通信就基本能满足大多数场景了,现在是消息协议的选型,也就是通信的数据格式,我们需要考虑的点有以下。
业界常用的数据格式有以下
一般我们会选择Protobuf,它是Google公司内部的混合语言数据标准,用pb序列化后的大小是json的10分之一,xml格式的20分之一,是二进制序列化的10分之一,并且基本上主流语言都已支持。不过考虑到上手的简单以及易调试,json也不是一个很坏的选择,毕竟现在http的数据基本都是json,明文的数据包在调试上也会方便许多。 创建websocekt实例websocket现在主流浏览器早已支持很久,并且在移动端也基本没有兼容性问题,官方提供的API十分简单,具体不在这里阐述,基本就四个事件,我们上述说到的功能都可以基于这四个事件去做。 展望IM需要考虑的还有很多,不仅是前端,还有更多的是与服务端配合的策略。其他的还有一些IM里面常用功能,比如撤回、已读未读,以及自定义消息类型,多媒体消息之类的实现,ws降级,群组消息推送等问题,受篇幅限制,这里不再仔细展开。 升华一下,人类社会发展,需要协作产出,需要沟通交流。随着5g的发展以及普及,即时通讯必然会往更广的方向延伸,并且并不局限于简单的聊天。 |
|
网络协议 最新文章 |
使用Easyswoole 搭建简单的Websoket服务 |
常见的数据通信方式有哪些? |
Openssl 1024bit RSA算法---公私钥获取和处 |
HTTPS协议的密钥交换流程 |
《小白WEB安全入门》03. 漏洞篇 |
HttpRunner4.x 安装与使用 |
2021-07-04 |
手写RPC学习笔记 |
K8S高可用版本部署 |
mySQL计算IP地址范围 |
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/25 17:49:34- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |