博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
hog行人检测
阅读量:5020 次
发布时间:2019-06-12

本文共 2956 字,大约阅读时间需要 9 分钟。

本文主要介绍下opencv中怎样使用hog算法,因为在opencv中已经集成了hog这个类。其实使用起来是很简单的,从后面的代码就可以看出来。本文参考的资料为opencv自带的sample

   关于opencv中hog的源码分析,可以参考本人的另一篇博客:

  开发环境:opencv2.4.2+Qt4.8.2+ubuntu12.04+QtCreator2.5.

 

  实验功能:

  单击Open Image按钮,选择需要进行人检测的一张图片,确定后自动显示出来。该图片的大小没限制。

  单击People Detect按钮,则程序会自动对该图片进行行人检测,且将检测到的效果显示出来,即用1个矩形框将行人框出来。

  单击Close按钮,退出程序。

 

  实验说明:

  1. hog描述子在opencv中为HOGDescriptor

  2. 可以调用该描述子setSVMDetector方法给用于对hog特征进行分类的svm模型的系数赋值,这里的参数为HOGDescriptor::getDefaultPeopleDetector()时表示采用系统默认的参数,因为这些参数是用很多图片训练而来的。  

  3. 对输入图片进行行人检测时由于图片的大小不一样,所以要用到多尺度检测。这里是用hog类的方法detectMultiScale。参数解释如下:

HOGDescriptor::detectMultiScale(const GpuMat& img, vector<Rect>& found_locations, doublehit_threshold=0, Size win_stride=Size(), Size padding=Size(), double scale0=1.05, int group_threshold=2)

  该函数表示对输入的图片img进行多尺度行人检测 img为输入待检测的图片;found_locations为检测到目标区域列表;参数3为程序内部计算为行人目标的阈值,也就是检测到的特征到SVM分类超平面的距离;参数4为滑动窗口每次移动的距离。它必须是块移动的整数倍;参数5为图像扩充的大小;参数6为比例系数,即滑动窗口每次增加的比例;参数7为组阈值,即校正系数,当一个目标被多个窗口检测出来时,该参数此时就起了调节作用,为0时表示不起调节作用。

4.  最后对检测出来的目标矩形框,要采用一些方法处理,比如说2个目标框嵌套着,则选择最外面的那个框。   5.  因为hog检测出的矩形框比实际人体框要稍微大些,所以需要对这些矩形框大小尺寸做一些调整。 实验结果: 图片1效果:

  

图片2效果:

  

图片3效果:

  

图片4效果:

  

实验主要部分代码(附录有工程code下载链接):
#include "dialog.h"#include "ui_dialog.h"#include 
#include
Dialog::Dialog(QWidget *parent) : QDialog(parent), ui(new Ui::Dialog){ ui->setupUi(this);}Dialog::~Dialog(){ delete ui;}void Dialog::on_openButton_clicked(){ QString img_mame = QFileDialog::getOpenFileName(this, "Open img", "../people", tr("Image Files(*.png *.jpg *.bmp *.jpeg)")); img = imread( img_mame.toAscii().data() ); imwrite("../hog_test.jpg", img); ui->textBrowser->setFixedSize(img.cols, img.rows); ui->textBrowser->append("
");}void Dialog::on_detectButton_clicked(){ vector
found, found_filtered; cv::HOGDescriptor people_dectect_hog; //采用默认的已经训练好了的svm系数作为此次检测的模型 people_dectect_hog.setSVMDetector(cv::HOGDescriptor::getDefaultPeopleDetector()); //对输入的图片img进行多尺度行人检测 //img为输入待检测的图片;found为检测到目标区域列表;参数3为程序内部计算为行人目标的阈值,也就是检测到的特征到SVM分类超平面的距离; //参数4为滑动窗口每次移动的距离。它必须是块移动的整数倍;参数5为图像扩充的大小;参数6为比例系数,即测试图片每次尺寸缩放增加的比例; //参数7为组阈值,即校正系数,当一个目标被多个窗口检测出来时,该参数此时就起了调节作用,为0时表示不起调节作用。 people_dectect_hog.detectMultiScale(img, found, 0, Size(8, 8), Size(32, 32), 1.05, 2); //从源码中可以看出: //#define __SIZE_TYPE__ long unsigned int //typedef __SIZE_TYPE__ size_t; //因此,size_t是一个long unsigned int类型 size_t i, j; for (i = 0; i < found.size(); i++ ) { Rect r = found[i]; //下面的这个for语句是找出所有没有嵌套的矩形框r,并放入found_filtered中,如果有嵌套的 //话,则取外面最大的那个矩形框放入found_filtered中 for(j = 0; j
textBrowser->clear(); ui->textBrowser->append("
");}void Dialog::on_closeButton_clicked(){ close();}
实验总结:从实验的结果来看,图片检测的准确率一般,当人体遮挡情况比较严重,且背景比较复杂时,有些误检和漏检。不过程序的检查速度还行,因为源码中用做了些优化处理。

 附:

 

转载于:https://www.cnblogs.com/alexanderkun/p/4204581.html

你可能感兴趣的文章
转载【微信支付】jsapi支付之传参问题(使用微信官方SDK之PHP版本) V3之WxpayPubHelper 亲测有效,V3WxpayAPI_php_v3.zip版未测试,理论上也是一样的。...
查看>>
邮件中的样式问题
查看>>
AJAX 状态值与状态码详解
查看>>
php面向对象编程(oop)基础知识示例解释
查看>>
1.在数组中找到与给定总和的配对
查看>>
树的子结构
查看>>
关于根据Build Platform或者OS 加载x86或者x64 dll的问题
查看>>
程序员高效开发的几个技巧
查看>>
js-权威指南学习笔记19.2
查看>>
hexo 搭建博客
查看>>
关于 UIWebView 几个高级用法
查看>>
maven创建的项目中无法创建src/main/java 解决方案
查看>>
华为软件开发云测评报告二:代码检查
查看>>
集合1
查看>>
js 原生 ajax
查看>>
关键词 virtual
查看>>
建造者模式(屌丝专用)
查看>>
UVALive 4730 Kingdom +段树和支票托收
查看>>
公布windows的&quot;Universal Apps&quot; Unity3D游戏
查看>>
Data Guard 三种模式解释
查看>>