图像识别技术的基本原理
导读:本文为讲解图像识别的基本原理,可谓言简意赅,值得收藏。
何为图像识别技术
文本识别,人脸识别都是图像识别的应用,但是这只是图像识别的基本应用。先进的技术已经能够识别出猫还是狗来了。
它们是怎样做到的?在专门研究图像识别技术的专家的透露出一些原理,本文就综合给大家。
人类在确定物体之前先确定其轮廓,据此原理,图像识别技术也依此理,首先识别的是图像的轮廓。
美国加利福尼亚大学的Adit Deshpande写过一篇《理解卷积神经网络的初学者指南》的文章。在其中,作者以一种相当容易理解的方式介绍了图像识别算法和基本成因。
计算机会将图像转换为数字形式的数组——因此“图像识别”实际上对数字数组的分析。在通常情况下,开发者可以将图像缩小到49*49像素,并将每个像素的彩色信息转换为灰度值,以获得49*49的矩阵,以排除其它信息。
接下来,从左上角逐一取出一小块数组进行计算。如下图示:
请看如下范例:
左边的图是7x7的灰度矩阵,右边的图是曲线。曲线的边缘灰度值较高,其它位置值全为“0”。
从现在开始尝试进行图像识别,以下是只老鼠的图像:
以左上角块为例,将其转换为灰色矩阵,将矩阵重叠处的数字相乘,得出结果为6600,这是一个很大的数字。
而对老鼠的头部矩阵进行运算,其得出的值为0.
小结
针对于图像扫描的结论是,当计算结果值较大时,图像匹配部分也会很多。通常,需要预先准备很多模式,为每个数组块计算最佳模式,最后再判断整体。
来源:21CTO