隐藏在内部的Bug KsMarketDataRepatchInterfaceReceiver

来源:互联网 发布:桌面视频录制软件 编辑:程序博客网 时间:2024/05/01 16:55

楔子: 奇怪的现象, UDP发送的数据似乎丢失很多 , 但是其他同样接收方就完全没有问题.

          于是从表层一步一步往下查,

          1. 先查询是不是由于写数据库缓慢,导致的数据丢失,或者是延迟

              结果发现,数据最多也就堆积了42个,大概42*400 大约50KB, 否定

           2.接着看看是不是组件AsyncEvent写错,有bug,于是在 RepatchinterfaceReceiver 部分,也就是接收的源头计数

              结果发现,源头这里收到的数据就少了, 外面其他接收方收到了600多个,这里才40个左右

              接着,开始怀疑源代码是不是给改坏了,于是reflector, 已经上线的正常的其他接收方, 发现是一样的.

      这就非常奇怪了, 然后摸着脑袋Debug

              也没发现什么问题,  突然!  发现! 在一个应该是只有单线程访问的函数的thread内部,竟然有2个线程在交替访问, 如下:

             

     public void Start()        {            lock (_lock)            {                              var thread = new Thread(() =>                {                    var clsKsTickConvertor = new StructConvertor_TS<ksftquota_pubdata_item_tag>();                    var clsDbTickConvertor = new StructConvertor_TS<CommonDataTypeLibrary.TickData>();                    int nSearchStartIndex = 0;                    int nShouldReverseCount = 0;                    byte[] datas = null;                    DataRepatchPackHead packhead = new DataRepatchPackHead();                    while (true)                    {                        datas = _GetData(datas, nShouldReverseCount);                        int nDataStartIndex = _GetDataStartIndex(datas, nSearchStartIndex, ref nShouldReverseCount, ref packhead);                        if (nDataStartIndex > 0)                        {                            if (DataRepatchDataType.KsTickData == packhead.DataRepatchDataType)                            {                                var o = clsKsTickConvertor.BytesToStruct(datas, nDataStartIndex);                                                                                           _aeGetKsDataAsync.CallEvent(OnGetKsDataAsync, o);                                                           }                            else if (DataRepatchDataType.DbTickData == packhead.DataRepatchDataType)                            {                                var o = clsDbTickConvertor.BytesToStruct(datas, nDataStartIndex);                                _aeGetDbDataAsync.CallEvent(OnGetDbDataAsync, o);                            }                        }                        else if (nDataStartIndex < 0)                        {                            datas = null;                        }                    }                });                thread.IsBackground = true;                thread.Start();            }                 }

这个函数应该是被lock ,而且thread只存在一个的. 

同时这个类的对象只有一个:

  public static KsMarketDataRepatchInterfaceReceiver KsDataReceiver = new KsMarketDataRepatchInterfaceReceiver(20104);

我们看到这是一个单例.......

后来才发现, 虽然是单例, 但是在两个地方调用 KsDataReceiver.Start , 于是出现了2个thread


后来对Start这个public函数做了改写:

  lock (_lock)            {                if (_bStarted)                    return;                else                    _bStarted = true;                var thread = new Thread(() =>                {


   这样就不再害怕多次Start

   以上的bug出现问题是因为对Public 函数的麻痹大意, 没有按照设计概念编码, 而是图简单,快速, 认为我知道该怎么用, 殊不知时间一长,谁都忘了