-
Notifications
You must be signed in to change notification settings - Fork 7.7k
XX Net 1.0.3 开发笔记
xxnet edited this page Jan 28, 2015
·
2 revisions
-
OpenSSL
测试Google ip时,发现OpenSSL库的连接性能比ssl库要稳定很多。 连接成功能力高40% 因此全部采用OpenSSL,不再用ssl
-
连接池
测试发现,建立跟GWS(Google Web Server)的tcp连接,如果没有传输内容,约15秒就失效了。 如果已经ssl握手成功,这个链接可以在240秒后才失效。 而使用过的ssl连接,如果是正常结束,还可以下次接着用,而不必再重新建连接。 一个ssl 连接,如果要复用Reuse,所连接的host必须相同。
一次tcp连接时间是300ms,而ssl握手时间2倍,是600秒,一次小型请求的耗时是300ms。 所以一次正常的请求耗时需要1.2秒。
如果建立连接池,在需要的时候,已经有握手好的连接可以用,那么就只需要300ms,差别4倍。
因此建立了ssl的连接池,同时更改了appid的机制:一段时间内,只使用同一个appid,直到这个appid失效。
-
建立appid的管理
appid有时会超出限额,限额有一天范围内的,也有短时间内的。超出限额的,先暂时剔除,等全部剔除完后, 再重新加回来,重新开始。
-
tcp连接
不传数据,只能存活15秒 15秒内用户还没有点下一个网页,这些连接就失效了。 干脆就不要连接池,只
-
ip选优策略
每次连接tcp和ssl握手, 会向ip管理器报告耗时。如果连接失败,也会报告异常。 tcp连接耗时大约是握手的一半,因此都折算为握手时间。
每10秒会根据耗时重新排序。 系统会保持最多100个可用ip,每次使用会在前5个最好的ip里随机挑选。 保持ip多样性,避免某个ip突然失效,影响正常使用。
如果连接失败,连接时间会增加300ms。 这样做的原因是避免某一次连接失败,直接删除一个优质的ip。毕竟网络丢包是经常发生的事情。 增加300ms,能够让该ip 马上排到后面去,但属于可用ip。
下次启动时会重新检查所有ip,好的ip会重新排到前面,而差的ip就会被删除,从而去寻找更好的ip。
为了避免在网络不好时,把辛辛苦苦找到的ip给删了,ip删除只在一个线程里,在删除前检查 baidu.com是否能够访问,如果不能访问,说明网络不行。 等网络恢复了,再检查一遍,如果还能连接,就会加回ip池,否则才真正删除。
-
代码清理
连接只有2种:直连GWS的Google服务,不需要经过GoogleAppEngine代理的。 另一种就是基本非Google的,需要经过GoogleAppEngine进行代理中转。
不需要经过代理中转的,就只建立一个tcp连接,后面就直接交给浏览器去握手加密和复用了。 需要经过代理中转的,就是ssl握手,然后把请求封装好,发给appEngine
文件名、类名、函数名都进行了重构,更容易通过名字知道其功能。
无用的代码、无用的参数都删除了,让代码更容易理解。
-
对于CPU性能
暂时感觉还不是太严重,而gevent不熟悉,就没有引入。 哪天需要了再加进来吧
-
服务端部署
前面说了,tcp连接没有握手,只能存活15秒。 部署服务端的库,执行很慢,它来请求连接,到真正去握手,还需要几秒时间。如果不够 “新鲜”的连接,就会失效,导致上传失败。 因此,tcp 连接要给足够新鲜的,这样可以保证上传成功的概率
-
服务端兼容
3.2的服务端跟之前的版本不兼容。 为了方便一些用户在新老版本之间切换,我把新、老版本的服务端都放进去了。 这样同一个appid,就能够给新、老两个版本用了。
-
证书问题
某些网站,GoogleChrome对证书要求比较严格,比如".twitter.com"的证书,about.twitter.com无法使用。 而FireFox 是正常的。 包括Youtube也有这样的现象出现。 而专门给about.twitter.com制作一个https证书,就OK了。
解决方案,就是在检测到浏览器对证书拒绝时,生成一个全版的证书,再通过自动重试机制, 让这个过程感觉不出来。