當前位置:首頁 > 開發教程 > 手機開發 >

直播系統開發中視頻采集的技術分析

時間:2019-09-23 11:04 來源: 作者:山東布谷科技 瀏覽: 收藏 挑錯 推薦 打印

直播系統開發中視頻的采集涉及兩方面數據的采集:音頻采集和圖像采集,它們分別對應兩種完全不同的輸入源和數據格式。
采集是整個視頻推流過程中的第一個環節,它從系統的采集設備中獲取原始視頻數據,將其輸出到下一個環節。直播系統開發中視頻的采集涉及兩方面數據的采集:音頻采集和圖像采集,它們分別對應兩種完全不同的輸入源和數據格式。
采集內容:
1、音頻采集
音頻數據既能與圖像結合組合成視頻數據,也能以純音頻的方式采集播放,后者在很多成熟的應用場景如在線電臺和語音電臺等起著非常重要的作用。音頻的采集過程主要通過設備將環境中的模擬信號采集成 PCM 編碼的原始數據,然后編碼壓縮成 MP3 等格式的數據分發出去。常見的音頻壓縮格式有:MP3,AAC,OGG,WMA,Opus,FLAC,APE,m4a 和 AMR 等。
在音頻采集階段,參考的主要技術參數有 :
采樣率(samplerate):
采樣就是把模擬信號數字化的過程,采樣頻率越高,記錄這一段音頻信號所用的數據量就越大,同時音頻質量也就越高;
位寬:
每一個采樣點都需要用一個數值來表示大小,這個數值的數據類型大小可以是:4bit、8bit、16bit、32bit 等等,位數越多,表示得就越精細,聲音質量自然就越好,而數據量也會成倍增大。我們在音頻采樣過程中常用的位寬是 8bit 或者 16bit;
聲道數(channels):
由于音頻的采集和播放是可以疊加的,因此,可以同時從多個音頻源采集聲音,并分別輸出到不同的揚聲器,故聲道數一般表示聲音錄制時的音源數量或回放時相應的揚聲器數量。聲道數為 1 和 2 分別稱為單聲道和雙聲道,是比較常見的聲道參數;
音頻幀(frame):
音頻跟視頻很不一樣,視頻每一幀就是一張圖像,而從上面的正玄波可以看出,音頻數據是流式的,本身沒有明確的一幀幀的概念,在實際的應用中,為了音頻算法處理/傳輸的方便,一般約定俗成取 2.5ms~60ms 為單位的數據量為一幀音頻。這個時間被稱之為“采樣時間”,其長度沒有特別的標準,它是根據編解碼器和具體應用的需求來決定的;
2、圖像采集
圖像采集的圖片結果組合成一組連續播放的動畫,即構成視頻中可肉眼觀看的內容。圖像的采集過程主要由攝像頭等設備拍攝成 YUV 編碼的原始數據,然后經過編碼壓縮成 H.264 等格式的數據分發出去。常見的視頻封裝格式有:MP4、3GP、AVI、MKV、WMV、MPG、VOB、FLV、SWF、MOV、RMVB 和 WebM 等。
在圖像采集階段,參考的主要技術參數有:
圖像傳輸格式:
通用影像傳輸格式(Common Intermediate Format)是視訊會議(video conference)中常使用的影像傳輸格式;
圖像格式:
通常采用 YUV 格式存儲原始數據信息,其中包含用 8 位表示的黑白圖像灰度值,以及可由 RGB 三種色彩組合成的彩色圖像;
傳輸通道:
正常情況下視頻的拍攝只需 1 路通道,隨著 VR 和 AR 技術的日漸成熟,為了拍攝一個完整的 360° 視頻,可能需要通過不同角度拍攝,然后經過多通道傳輸后合成;
分辨率:
隨著設備屏幕尺寸的日益增多,視頻采集過程中原始視頻分辨率起著越來越重要的作用,后續處理環節中使用的所有視頻分辨率的定義都以原始視頻分辨率為基礎。視頻采集卡能支持的最大點陣反映了其分辨率的性能;
采樣頻率:
采樣頻率反映了采集卡處理圖像的速度和能力。在進行高度圖像采集時,需要注意采集卡的采樣頻率是否滿足要求。采樣率越高,圖像質量越高,同時保存這些圖像信息的數據量也越大。
直播系統開發中視頻采集的技術分析轉載http://www.glgbknaa.icu/jiaocheng/shoujikaifa/43865.html
下一篇:沒有了

手機開發閱讀排行

最新文章

内蒙古十一选五助手下载