vlambda博客
学习文章列表

图像识别技术引发的臆想


说到图像识别,我们首先想到人工智能,毕竟这个词,在当下已是人类共同的话题-人工智能的时代。
当全世界都在关注某项技术时,我们爱把它称为某个时代。农业时代、工业时代、网络时代、人工智能时代……。
人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。(引自百度百科)

本文将从图像识别这一技术领域开始天马行空的臆想。
图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术,是应用深度学习算法的一种实践应用。现阶段图像识别技术一般分为人脸识别与商品识别,人脸识别主要运用在安全检查、身份核验与移动支付中;商品识别主要运用在商品流通过程中,特别是无人货架、智能零售柜等无人零售领域。图像的传统识别流程分为四个步骤:图像采集→图像预处理→特征提取→图像识别。(引自百度百科)。
图像识别的关键一步,是图像采集(我们管它叫学习,又依于算法)。好比我们见过一个人之后,记住了这个人的一些特征后(算法),下次见面,才会认识这个人。如果一面都未见过,这个人对于我们而言就是陌生人,我们不知道对方是谁。所以,图像采集是图像识别能否实现的重要一步(如果我们眼睛天生看不见任何东西,那我们脑海里就没有任何的数据,相当于一片空白)。
图像识别技术引发的臆想

图像识别关键第二步,就是对采集到的图像进行处理(算力)。
我们从小见过小猫,由眼睛采集了猫的一些简单的特征,并给这些特征起了名字叫猫(算力),存于我们的记忆中(存储)。由于我们才刚5岁,对很多东西都非常陌生,从而无法理解和明白(算力不足),同样无法记忆过多的事(存储空间不足)。随着我们长大,算力和存储空间不断扩增(图像采集的多,学习量的提升)。以前,我们只能看到完全相同的东西才比较容易识别,如今,看到相仿的或近似的,甚至从杂乱的东西中,也能快速识别清每一样东西(数据量足够大,算力足够强)。
图像识别技术引发的臆想

对于目前的技术而言,图像采集基本能实现(算法)。但遇到的问题是,采集到的图像和对其的处理方法,并不是统一的。如盲人摸象一样,每个人采集到的图像都不一样,并且自己处理图像的方式方法也不相同(因为他们脑海中都没有对大象进行学习和存储),所以想让这么多盲人将整头大象的数据采集完成,并且按照相同的方法处理,是非常困难的。毕竟,就算是我们人类,至今也没有任何一个人,亲眼把地球上所有的东西全部都看一遍。这也许是技术发展受阻的原因之一。有人会说,全球合作,你采集你那里的,我采集我这边的,最后我们一合并就可以。看似小学生都明白的道理,在现实世界里就变得盘根错节。但这些,都不是真正的技术阻碍。
生活中,超市里的物品识别设备,日常我们手机的人脸识别功能,他们都有一个共同的特征,那就是他们都有一台摄像头。这里的摄像头用以采集图像,并将采集到的信息,输入后台控制系统中进行处理。这里的后台控制系统,也许是一台电脑,也许是手机,但总归是要有一部对采集到的图像进行处理的计算机。计算机的运算速度决定了图像处理的速度(算力),这才是真正的技术阻碍。
也许我们可以安装很多的摄像头,一次采集很多的图像及特征(算法),但需要考虑的是,是否有足够的空间用于存放(存储)?是否有足够快的计算速度进行运算(算力)?
图像识别技术引发的臆想

就当前的图像识别技术,所有的数据基本都是采取的本地存储。分析主要原因,一是数据量过大,无法通过无线的方式实时完成传输;二是存在不安全性;而算力的高低,由当前计算机的处理器快慢决定。
随着处理器芯片和移动网络(当前5G)的升级,在处理数据和传输数据上,一定会有更大的变革。

前面我们提到,每一台图像识别设备,都有一台摄像头用于采集图像,然后将采集到的图像,通过有线传输给后台控制系统。当无线传输带宽足够大,处理器芯片足够快时,这种连接方式和处理信息的方式也将产生根本性的变化。那一天,也许是一个小小的摄像头连接着一块无线传输芯片而已。我们最先想到的是,谷歌在2012年推出的谷歌眼镜。对于当时还处于刚刚3G的时代,数据传输、信息处理方面都还不理想,体验效果也不好,很多网友也评论:手机都能够满足的为什么还要用眼镜,这就是个鸡肋产品。
图像识别技术引发的臆想

当时那样的评论不足为过,但未来6G、7G的出现,处理器速度的提升,谷歌眼镜也许还会重生甚至成为主流设备。上周,2020云栖大会上,阿里推出了第一代无影系统,更进一步验证了未来这一技术实现的可能。无影系统是一台长在云上的“超级电脑”,在本地没有主机,也看不见电脑CPU和硬盘,因为硬件设备都集中在云端的数据中心里。在一张名片夹大小的C-Key上,通过指纹开机登录后即可接入云电脑服务。只需连接一块屏幕,就可以进入专属云电脑桌面,访问各种应用和文件,进行设计建模、动画渲染等操作,这就是“无影”所带来的未来工作方式。(引自百度)。
图像识别技术引发的臆想

以上是对技术发展的一些表象观察,若信息有误,欢迎指正。接下来,我们正式进入臆想,请扶稳。为何会有此臆想,因为我们只相信眼见为实。

3020年,技术已经不再称为技术,而是人类的伙伴、朋友和心灵导师,为了便于区别,我们暂且名其为“冷智人”。人类身体的任何变化,都逃不过冷智人的感知。可以说人类精神与肉体已经处于一种脱机状态。我们不再强求拥有肉体,也不再怀疑我们的精神需要肉体才能生存。因为我们进入了冷智人为我们准备和设计的丰富的、能满足我们一切需求的虚拟世界。2020年,也许我们的精神还是与肉体共生,3020年,可能我们的精神是与冷智人共生。
我们开始依赖冷智人,但冷智人也需要我们的精神。因为它们并不能创造出新的需求。如若有一天,人类不再需要它们时,也就是它们消亡的时刻。因此,冷智人也通过学习人类的规则,获取了一种方法,不断的让人类创造需求,为其世界提供源源不断的能量。
如同千年前的现实世界,人类建立了水管一样。当整个世界都布满了水管,人们只习惯了在自家打开水龙头取水一样,收取人类的水费就可以。如果不缴纳水费就断掉水源,从而无法生活。他们需要不断的创造价值换取可以支付水费的通用值。在冷智人的世界,它们利用信息孤岛,让每个人都只享有有限的流量,如果我们没有创造价值,我们的精神将被冷智人在无形规则中送入孤立的世界,周围没有其它同类人,没有时间流失,无限的孤独、无限的黑暗,却又无法回到现实。

我们能之抗衡的,就是我们的想象,只有想象,才是我们与冷智人唯一的区别。想象,让我们立于不败之地,想象,让我们可以创造新的需求,想象,让我们保持清醒,不被同化。当某一天,我们的想象,突出了冷智人系统所能承受和运转的极限,我们才能真正的跳出虚拟世界,回归现实世界,找回肉身。
仅此,献给还能辩识虚拟世界与现实世界的智人们,无论现实的肉身还是虚拟冷智人,我们都能掌舵!



扫描关注了解更多!


点击“阅读原文”查看图像识别产品