摘要:行人的空間尺度差異是影響行人檢測性能的主要瓶頸之一.針對這一問題,提出了跨尺度特征聚合網絡(TS-FAN)有效檢測多尺度行人.首先,鑒于不同尺度空間呈現出的特征差異性,引入一種基于多路徑區域建議網絡(RPN)的尺度補償策略,其在多尺度卷積特征層上自適應地生成一系列與其感受野大小相對應的候選目標尺度集.其次,考慮到不同層次卷積特征在視覺語義上的互補性,提出了跨尺度特征聚合網絡模塊,其通過橫向連接、自上而下路徑和由底向上路徑,有效地聚合具有語義魯棒性的高層特征和具有精確定位信息的低層特征,實現對卷積層特征的增強表示.最后,聯合多路徑RPN尺度補償策略和跨尺度特征聚合網絡模塊,構建了一種尺度自適應感知的多尺度行人檢測網絡.實驗結果表明,所提方法與當前一流的行人檢測方法TLL-TFA相比,在整個Caltech公開測試數據集上(All:行人高度大于20像素)的行人漏檢率降低到26.21%(提高了11.94%),尤其對于Caltech小尺寸行人子數據集上(Far:行人高度在20~30像素之間)的行人漏檢率降低到47.30%(提高了12.79%),同時在尺度變化劇烈的ETH數據集上的效果也取得顯著提升.