vlambda博客
学习文章列表

人工智能园 | 图像识别技术介绍


浙江财经大学人工智能体验园由视频展示介绍区、机器感知区、互动体验区、机器执行区、虚拟现实区、综合应用区和互动编程体验区等六部分构成。本篇文章就来介绍与视频展示介绍区的人脸融合与视频融合相关的图像识别技术。



人工智能园 | 图像识别技术介绍


图像识别的概念:图像识别是指识别图像中的位置,徽标,人物,物体,建筑物以及其他几个变量的技术。

图像识别技术的原理:图像识别是将原始光学信息进行逻辑分类处理的过程。


人工智能园 | 图像识别技术介绍


图像识别的基本步骤


图像识别过程主要包括收集和组织数据,建立预测模型并使用它来识别图像。



01

收集和组织数据


对于机器学习模型而言计算机将图像视为光栅图像或矢量图像。栅格图像是一系列像素,这些像素具有离散的颜色数值,而矢量图像是一组带有颜色注释的多边形。


人工智能园 | 图像识别技术介绍


为了分析图像,计算机将几何编码转换为描述物理特征和对象的构造。然后再对这些构造进行逻辑分析,提取重要信息而忽略其余信息来收集并组织数据。



02

建立预测模型


建立预测模型,少不了神经网络的帮助。神经网络是一个类似于我们大脑的硬件和软件系统,用于估计依赖于大量未知输入的函数。


神经网络将需要一种学习算法,用于建立预测模型。



03

识别图像


建立图像识别模型的主要挑战是硬件处理能力和输入数据的清理。对于机器学习模型而言,此过程涉及浮点权重和矩阵的复杂导数。



图像识别的算法


图像识别的算法主要包括两种:一种是基于机器学习,比如卷积神经网络;另一种是基于特征匹配的,比如ORB、SIFT+SURF。

下图是图像识别算法的发展历史:


人工智能园 | 图像识别技术介绍


接下来是图像识别的主要算法:



01

SURF算法


SURF,英文的全称为Speed Up Robust Features,直译为:加速版的具有鲁棒特性的特征算法,是由Bay在2006年首次提出的。该算法对经典的尺度不变特征变换算法(SIFT算法)进行了改进,SIFT算法最大的缺点就是如果不借助硬件或者专门的图像处理器进行加速的话,SIFT算法很难达到实时处理的效果。SURF算法最大的特征在于采用了Haar特征以及积分图像的概念,这大大的加速了程序的运行时间。SURF算法不仅保持了SIFT算法的尺度不变和旋转不变的特性,而且对光照变化和放射变化同样具有很强的鲁棒性。SURF算法一般应用于计算机视觉中的物体识别、图像拼接、图像配准以及3D重建中。


人工智能园 | 图像识别技术介绍


02

HOG特征


方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。Hog特征结合 SVM分类器已经被广泛应用于图像识别中,尤其在行人检测中获得了极大的成功。


人工智能园 | 图像识别技术介绍


03

LBP特征


LBP(Local Binary Pattern,局部二值模式)是一种用来描述图像局部纹理特征的算子;它具有旋转不变性和灰度不变性等显著的优点。并且采用LBP特征谱的统计直方图作为特征向量用于分类识别。


人工智能园 | 图像识别技术介绍
人工智能园 | 图像识别技术介绍


信息力量|即刻出发

文案 | 人工智能协会

编辑 | 赵宏顺

审核 | 应楷