研究网狐的内核框架发现经常有以下错误:
SocketEngine Index=0,RountID=18,OnRecvCompleted 发生“数据包效验码错误”异常
因为不是必现的问题,非常不好排查,而网狐的东西也相对较稳定,不知如何下手,然后就仔细看内核相关的代码,看到了内存数据队列;WHDataQueue队列的实现其实还是非常巧妙的,用变量标志就在一个内存块上实现了环形的队列,越是巧妙的东西,就越容易出错,也就越需要打磨,虽然研究网狐框架代码的人很多,但不知道为什么我在网上各种找资料,就是找不到这个问题的解决方案,可能这是个偶发的问题,在服务端跑的时候,也极少出现,就算出现也只是影响某个玩家,所以问题就被隐藏了吧。
int nIndex = 0; TCHAR szInfo[4096] = TEXT(""); int nLen = 0; //写入0字节, 让gDataQueue内存块大小为 40, 实际上是写入4字节,因为里面还有个数据头 rand_str(szInfo, 0); gDataQueue.InsertData(++nIndex, szInfo, 0); tagDataHead head; //取出,之后 m_dwDataQueryPos 变成4 gDataQueue.DistillData(head, szInfo, sizeof(szInfo)); //写入16个字节 rand_str(szInfo, 7); nLen = CountStringBuffer(szInfo); gDataQueue.InsertData(++nIndex, szInfo, nLen); std::cout << nLen <<", " << nIndex << endl; //取出,之后 m_dwDataQueryPos 变成24, m_dwDataSize=0 gDataQueue.DistillData(head, szInfo, sizeof(szInfo)); std::cout << head.wDataSize << ", " << head.wIdentifier<< endl; std::cout << "" << endl; //写入20字节, //因为写入到结束位置,写入位置+写入长度大于总长,查询位置大于写入长度, //基于以上三点原因,说明可以写从头开始再入,所以会把 m_dwInsertPos 设置为0 rand_str(szInfo, 9); nLen = CountStringBuffer(szInfo); gDataQueue.InsertData(++nIndex, szInfo, nLen); std::cout << nLen << ", " << nIndex << endl; //再写入10字节 rand_str(szInfo, 3); nLen = CountStringBuffer(szInfo); //写入10字节之后, //实际上gDataQueue就变成m_dwDataQueryPos = 24(因为没有读取操作) //m_dwDataSize = 38, m_dwInsertPos = 38 //到这一步貌似也还没有问题,但是如果后续的操作不是读取而是继续写入,那么就有出现问题 gDataQueue.InsertData(++nIndex, szInfo, nLen); std::cout << nLen << ", " << nIndex << endl; rand_str(szInfo, 28); nLen = CountStringBuffer(szInfo); //为了测试问题,这一步继续写入,因为总长是40,再写入,则会重新分配空间 //重新分配空间时,需要将原有内存数据拷贝到新内存,问题就出现这个拷贝上,步骤如下: //1. 判断是否存在末尾还有未读完的数据:m_dwTerminalPos-m_dwDataQueryPos=14 //2. 先将末尾数据拷贝:CopyMemory(pNewQueueServiceBuffer, m_pDataQueueBuffer + m_dwDataQueryPos, dwPartOneSize); //3. 再从头开始拷贝:CopyMemory(pNewQueueServiceBuffer + dwPartOneSize, m_pDataQueueBuffer, m_dwInsertPos); //这个步骤理论上是没有错的,但是结合上面的写入数据的顺序,则忽略了一个细节: 写入的数据长度已经覆盖了查询标记 gDataQueue.InsertData(++nIndex, szInfo, nLen); std::cout << nLen << ", " << nIndex << endl; std::cout << "" << endl; gDataQueue.DistillData(head, szInfo, sizeof(szInfo)); std::cout << head.wDataSize << ", " << head.wIdentifier << endl; gDataQueue.DistillData(head, szInfo, sizeof(szInfo)); std::cout << head.wDataSize << ", " << head.wIdentifier << endl; gDataQueue.DistillData(head, szInfo, sizeof(szInfo)); std::cout << head.wDataSize << ", " << head.wIdentifier << endl;
修复代码:
在bool CWHDataQueue::RectifyBuffer(DWORD dwNeedSize)函数中加上一行:
try { //缓冲判断 if ((m_dwDataSize+dwNeedSize)>m_dwBufferSize) throw 0; //重新开始 if ((m_dwInsertPos==m_dwTerminalPos)&&((m_dwInsertPos+dwNeedSize)>m_dwBufferSize)) { if (m_dwDataQueryPos>=dwNeedSize) m_dwInsertPos=0; else throw 0; } //缓冲判断 if ((m_dwInsertPos<m_dwTerminalPos)&&((m_dwInsertPos+dwNeedSize)>m_dwDataQueryPos)) throw 0; //头追上尾或尾追上头 if (m_dwInsertPos + dwNeedSize > m_dwDataQueryPos && m_dwDataQueryPos >= m_dwInsertPos) { //尾追上头 if (m_dwDataSize > 0) throw 0; } }