vlambda博客
学习文章列表

图像识别技术的基本原理

导读:本文为讲解图像识别的基本原理,可谓言简意赅,值得收藏。


何为图像识别技术


文本识别,人脸识别都是图像识别的应用,但是这只是图像识别的基本应用。先进的技术已经能够识别出猫还是狗来了。


它们是怎样做到的?在专门研究图像识别技术的专家的透露出一些原理,本文就综合给大家。


人类在确定物体之前先确定其轮廓,据此原理,图像识别技术也依此理,首先识别的是图像的轮廓。


图像识别技术的基本原理


美国加利福尼亚大学的Adit Deshpande写过一篇《理解卷积神经网络的初学者指南》的文章。在其中,作者以一种相当容易理解的方式介绍了图像识别算法和基本成因。


计算机会将图像转换为数字形式的数组——因此“图像识别”实际上对数字数组的分析。在通常情况下,开发者可以将图像缩小到49*49像素,并将每个像素的彩色信息转换为灰度值,以获得49*49的矩阵,以排除其它信息。


接下来,从左上角逐一取出一小块数组进行计算。如下图示:


图像识别技术的基本原理

请看如下范例:


图像识别技术的基本原理


左边的图是7x7的灰度矩阵,右边的图是曲线。曲线的边缘灰度值较高,其它位置值全为“0”。


从现在开始尝试进行图像识别,以下是只老鼠的图像:


图像识别技术的基本原理

图像识别技术的基本原理

以左上角块为例,将其转换为灰色矩阵,将矩阵重叠处的数字相乘,得出结果为6600,这是一个很大的数字。


而对老鼠的头部矩阵进行运算,其得出的值为0.


小结


针对于图像扫描的结论是,当计算结果值较大时,图像匹配部分也会很多。通常,需要预先准备很多模式,为每个数组块计算最佳模式,最后再判断整体。


来源:21CTO


关于21CTO

21CTO.com是中国互联网第一技术社交与学习平台。为CTO、技术总监,技术专家,架构师、技术经理,高级研发工程师、PM等提供学习成长,教育培训,工作机会、人脉影响力等高价值的在线教育和社交网站。