Kinect v2.0原理介绍之十二：音频获取

来源：互联网发布：报刊编辑排版软件编辑：程序博客网时间：2024/05/22 02:07

~~有兴趣的小伙伴，加kinect算法交流群：462964980。

这次获取Kinect里面流数据中最后一种：音频流。

我们可以从录音设备里面看到Kinect:

我们可以用一般获取录音一样获取音频流，请注意，从这里获取的音频流是原始数据：麦克风列阵获取的多声道音频，并且

没有利用麦克风列阵进行降噪处理。代码可以查看SDK自带的获取原始数据的例子，因为与通用设备打交道，很麻烦，这里

不做说明。

这里说的是利用自带的方法，获取经处理的音频数据。

经过处理的数据信息如下：

编码: 32位标准浮点(IEEE FLOAT)

声道: 1

采样率: 16000Hz

嗯，16KHz，不是熟悉的44.1KHz。毕竟根据奈奎斯特的采样理论，针对人声已经足够了。

SDK中获取处理后的音频流有两种方法，一种是音频帧，和之前的各种帧差不多：

[cpp] view plaincopy
<span style="font-size:14px;">    // 获取音频源(AudioSource)  
    if (SUCCEEDED(hr)){  
        hr = m_pKinect->get_AudioSource(&pAudioSource);  
    }  
    // 再获取音频帧读取器  
    if (SUCCEEDED(hr)){  
        hr = pAudioSource->OpenReader(&m_pAudioBeamFrameReader);  
    }  
    // 注册临帧事件  
    if (SUCCEEDED(hr)){  
        m_pAudioBeamFrameReader->SubscribeFrameArrived(&m_hAudioBeamFrameArrived);  
    }</span>  

这样初始化。使用后，像之前那样

根据事件获取 AudioBeamFrameArrivedEventArgs

再获取 AudioBeamFrameReference 音频帧引用

再获取 AudioBeamFrameList 音频帧链表

目前链表只有一个元素，直接获取 AudioBeamFrame音频帧。

音频帧可能包含复数 AudioBeamSubFrame 音频副帧(比如本人这里包含2个)

这个东西才能获取音频流的真正信息。

还有就是IStream，前面的这不是指C++标准库的输入流，而是COM组件的“流接口”，可读可写。

初始化代码如下：

[cpp] view plaincopy
<span style="font-size:14px;">    if (SUCCEEDED(hr))  
    {  
        hr = m_pKinectSensor->get_AudioSource(&pAudioSource);  
    }  
  
    if (SUCCEEDED(hr))  
    {  
        hr = pAudioSource->get_AudioBeams(&pAudioBeamList);  
    }  
      
    if (SUCCEEDED(hr))  
    {  
        hr = pAudioBeamList->OpenAudioBeam(0, &m_pAudioBeam);  
    }  
  
    if (SUCCEEDED(hr))  
    {          
        hr = m_pAudioBeam->OpenInputStream(&m_pAudioStream);  
    }</span>