funchile 发表于 2015-9-6 07:38:04

zookeeper session tracker机制分析

  说到zookeeper session管理 ,免不了要问

[*]  什么是session?
[*]  session id/session是如何产生的?
[*]  session 信息如何存储?
  本文以session tracker线程【详见SessionTrackerImpl】的运行机制作为主线,并尝试解答一些相关问题
  
1)session基础
  
  在介绍session tracker线程之前先回答几个问题
  
1.1) 什么是session?
  
  zookeeper中session意味着一个物理连接,客户端connect成功之后,会发送一个connect型请求,此时就会有session 产生(下面会具体讲)
  
1.2)sessionid是如何产生的?
  
  在SessionTrackerImpl实例化的时候就会调用下面的函数【详见SessionTrackerImpl.initializeNextSession】


1
2
3
4
5
6

public static long initializeNextSession(long id) {
       long nextSid = 0;
       nextSid = (System.currentTimeMillis() << 24) >> 8;
       nextSid =nextSid | (id <<56);
       return nextSid;
   }  产生的值会存入nextSessionId属性,以后一旦有新的连接(session)产生,就会nextSessionId++
  
1.3)session是如何产生的?
  
  接到一个连接类型的请求【详见ZooKeeperServer.processConnectRequest】


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28

int sessionTimeout = connReq.getTimeOut();
      byte passwd[] = connReq.getPasswd();
      int minSessionTimeout = getMinSessionTimeout();
      if (sessionTimeout < minSessionTimeout) {
            sessionTimeout = minSessionTimeout;
      }
      int maxSessionTimeout = getMaxSessionTimeout();
      if (sessionTimeout > maxSessionTimeout) {
            sessionTimeout = maxSessionTimeout;
      }
      cnxn.setSessionTimeout(sessionTimeout);
      // We don't want to receive any packets until we are sure that the
      // session is setup
      cnxn.disableRecv();
      long sessionId = connReq.getSessionId();
      if (sessionId != 0) {
            long clientSessionId = connReq.getSessionId();
            LOG.info("Client attempting to renew session 0x"
                  + Long.toHexString(clientSessionId)
                  + " at " + cnxn.getRemoteSocketAddress());
            serverCnxnFactory.closeSession(sessionId);
            cnxn.setSessionId(sessionId);
            reopenSession(cnxn, sessionId, passwd, sessionTimeout);
      } else {
            LOG.info("Client attempting to establish new session at "
                  + cnxn.getRemoteSocketAddress());
            createSession(cnxn, passwd, sessionTimeout);
      }  
1.3.1)确定session的timeout和id
  【详见SessionTrackerImpl.createSession】
  


1
2
3
4

synchronized public long createSession(int sessionTimeout) {
      addSession(nextSessionId, sessionTimeout);
      return nextSessionId++;
    }  可见产生session需要两个元素,一个是sessionid,一个是timeout

[*]  timeout由客户端确定,但必须在服务器规定的最大的timeout(ticktime*20)和最小的timeout(ticktime*2)之间
[*]  如果客户端没有指定sessionid,那么就会产生一个新的session【详见ZooKeeperServer.createSession】,否则会reopen【详见ZooKeeperServer.reopenSession】
[*]  sessionid的产生上面解释过了
1.3.2)实例化session及相关关系存放
  【详见SessionTrackerImpl.addSession】


1
2
3
4
5
6
7
8
9
10

sessionsWithTimeout.put(id, sessionTimeout);
      if (sessionsById.get(id) == null) {
            SessionImpl s = new SessionImpl(id, sessionTimeout, 0);
            sessionsById.put(id, s);
            if (LOG.isTraceEnabled()) {
                ZooTrace.logTraceMessage(LOG, ZooTrace.SESSION_TRACE_MASK,
                        "SessionTrackerImpl --- Adding session 0x"
                        + Long.toHexString(id) + " " + sessionTimeout);
            }
      }

[*]  一个重要的数据结构sessionsWithTimeout存放sessionid和timeout的映射
[*]  另一个重要的数据结构sessionsById存放sessionid和SessionImpl实例的映射
1.3.3)确定session实例的tickTime及sessionSets关系维护
  【详见SessionTrackerImpl.touchSession】
  
  


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

long expireTime = roundToInterval(System.currentTimeMillis() + timeout);
      if (s.tickTime >= expireTime) {
            // Nothing needs to be done
            return true;
      }
      SessionSet set = sessionSets.get(s.tickTime);
      if (set != null) {
            set.sessions.remove(s);
      }
      s.tickTime = expireTime;
      set = sessionSets.get(s.tickTime);
      if (set == null) {
            set = new SessionSet();
            sessionSets.put(expireTime, set);
      }
      set.sessions.add(s);  

[*]  根据当前时间和timeout计算本session 的expireTime即tickTime
[*]  一个重要的数据结构sessionSets 存放过期时间和一组session实例(相同过期时间)的映射的建立及维护
[*]  session实例的tickTime的确定
  
  
2)session tracker线程的机制
  
  在zookeeper服务体系中,专门有一个线程(session tracker)维护session【详见SessionTrackerImpl.run】,重要代码如下


1
2
3
4
5
6
7
8
9
10
11
12
13
14

currentTime = System.currentTimeMillis();
if (nextExpirationTime > currentTime) {
    this.wait(nextExpirationTime - currentTime);
    continue;
}
SessionSet set;
set = sessionSets.remove(nextExpirationTime);
if (set != null) {
    for (SessionImpl s : set.sessions) {
      sessionsById.remove(s.sessionId);
      expirer.expire(s);
    }
}
nextExpirationTime += expirationInterval;  
  可见SessionTrackerImpl这个线程会一直轮询的清除过期session

[*]  每次轮询都会比较currentTime和nextExpirationTime,如果还未到nextExpirationTime,就等,否则往下走
[*]  将sessionSets中的以nextExpirationTime为key的那组session移出
[*]  遍历session,从sessionsById移除session,并调用相关的过期处理(下面会讲)
[*]  调整下载比较的时间,即nextExpirationTime += expirationInterval;
  
3) session维护相关问题
  
3.1)清除session如何实现?
  【详见ZooKeeperServer.close】


1
2
3

private void close(long sessionId) {
       submitRequest(null, sessionId, OpCode.closeSession, 0, null, null);
   }3.1.1)构造一个Request实例
3.1.2)调用PrepRequestProcessor.processRequest放入submittedRequests队列
3.1.3)PrepRequestProcessor线程的处理


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34

request.hdr = new TxnHeader(request.sessionId, request.cxid, zxid,
                            zks.getTime(), type);
                                                   
switch (type) {
                                                   
    //省略N行代码......
                                                   
    case OpCode.closeSession:
      // We don't want to do this check since the session expiration thread
      // queues up this operation without being the session owner.
      // this request is the last of the session so it should be ok
      //zks.sessionTracker.checkSession(request.sessionId, request.getOwner());
      HashSet<String> es = zks.getZKDatabase()
                .getEphemerals(request.sessionId);
      synchronized (zks.outstandingChanges) {
            for (ChangeRecord c : zks.outstandingChanges) {
                if (c.stat == null) {
                  // Doing a delete
                  es.remove(c.path);
                } else if (c.stat.getEphemeralOwner() == request.sessionId) {
                  es.add(c.path);
                }
            }
            for (String path2Delete : es) {
                addChangeRecord(new ChangeRecord(request.hdr.getZxid(),
                        path2Delete, null, 0, null));
            }
                                                   
            zks.sessionTracker.setSessionClosing(request.sessionId);
      }
                                                   
      LOG.info("Processed session termination for sessionid: 0x"
                + Long.toHexString(request.sessionId));
      break;  
  



[*]  设置request.hdr,这个很重要,

[*]  在FinalRequestProcessor.processRequest会有相应的处理





1
2
3
4
5
6

if (request.hdr != null) {
            TxnHeader hdr = request.hdr;
            Record txn = request.txn;
   
            rc = zks.processTxn(hdr, txn);
         }  ​


[*]  一旦某个session关闭,与session相关的EPHEMERAL类型的节点都得清除
[*]  并且通过调用sessionTracker.setSessionClosing将session设置为关闭,使得后续此session上的请求无效

3.1.4)SessionTrackerImpl相关数据结构的清理
  【详见SessionTrackerImpl.removeSession】


1
2
3
4
5
6
7
8
9
10
11
12

synchronized public void removeSession(long sessionId) {
    SessionImpl s = sessionsById.remove(sessionId);
    sessionsWithTimeout.remove(sessionId);
    if (LOG.isTraceEnabled()) {
      ZooTrace.logTraceMessage(LOG, ZooTrace.SESSION_TRACE_MASK,
                "SessionTrackerImpl --- Removing session 0x"
                + Long.toHexString(sessionId));
    }
    if (s != null) {
      sessionSets.get(s.tickTime).sessions.remove(s);
    }
}  分别对sessionsById、sessionsWithTimeout、sessionSets进行处理
  
3.2)session owner咋回事?
  如果不是在集群环境,即没有LearnerHandler线程,session 的owner就是一个常量实例ServerCnxn.me
  
3.3)sessionsWithTimeout这个数据结构的用途?
  sessionsWithTimeout存放的是sessionid和timeout,此数据结构会和ZKDatabase中相通,会被持久化
  如果某个session timeout为60s,如果空闲了30s,意味着还能空闲30s,此时服务重启,那么此session的timeout又变为60s
  
3.4)touch session是干吗的?
  每次一旦该session有请求,就会touch,意味着session的过期时间变为(基本等于当前时间+timeout)
  具体算法为
  


1
2
3
4

private long roundToInterval(long time) {
      // We give a one interval grace period
      return (time / expirationInterval + 1) * expirationInterval;
    }  time为System.currentTimeMillis() + timeout
  expirationInterval默认为ticktime
  
3.5)check session是干吗的
  基本上所有的事务型操作,都会调用用来验证当前请求的session是否关闭,owner是否正确
  
4)小结

[*]  SessionTrackerImpl作为一个单独的线程专门处理过期session
[*]  SessionTrackerImpl有3个重要的数据结构sessionsById、sessionSets、sessionsWithTimeout,其中sessionsWithTimeout会被持久化
[*]  SessionTrackerImpl提供了几个常用的API

[*]  createSession
[*]  addSession
[*]  touchSession
[*]  removeSession
[*]  checkSession
[*]  setOwner
[*]  dumpSessions
[*]  

页: [1]
查看完整版本: zookeeper session tracker机制分析