图像识别技术引发的臆想

vlambda
2020-09-21

图像识别技术引发的臆想

说到图像识别，我们首先想到人工智能，毕竟这个词，在当下已是人类共同的话题-人工智能的时代。

当全世界都在关注某项技术时，我们爱把它称为某个时代。农业时代、工业时代、网络时代、人工智能时代……。

人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。（引自百度百科）

本文将从图像识别这一技术领域开始天马行空的臆想。

图像识别，是指利用计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对象的技术，是应用深度学习算法的一种实践应用。现阶段图像识别技术一般分为人脸识别与商品识别，人脸识别主要运用在安全检查、身份核验与移动支付中；商品识别主要运用在商品流通过程中，特别是无人货架、智能零售柜等无人零售领域。图像的传统识别流程分为四个步骤：图像采集→图像预处理→特征提取→图像识别。（引自百度百科）。

图像识别的关键一步，是图像采集（我们管它叫学习，又依于算法）。好比我们见过一个人之后，记住了这个人的一些特征后（算法），下次见面，才会认识这个人。如果一面都未见过，这个人对于我们而言就是陌生人，我们不知道对方是谁。所以，图像采集是图像识别能否实现的重要一步（如果我们眼睛天生看不见任何东西，那我们脑海里就没有任何的数据，相当于一片空白）。

图像识别关键第二步，就是对采集到的图像进行处理（算力）。

我们从小见过小猫，由眼睛采集了猫的一些简单的特征，并给这些特征起了名字叫猫（算力），存于我们的记忆中（存储）。由于我们才刚5岁，对很多东西都非常陌生，从而无法理解和明白（算力不足），同样无法记忆过多的事（存储空间不足）。随着我们长大，算力和存储空间不断扩增（图像采集的多，学习量的提升）。以前，我们只能看到完全相同的东西才比较容易识别，如今，看到相仿的或近似的，甚至从杂乱的东西中，也能快速识别清每一样东西（数据量足够大，算力足够强）。

对于目前的技术而言，图像采集基本能实现（算法）。但遇到的问题是，采集到的图像和对其的处理方法，并不是统一的。如盲人摸象一样，每个人采集到的图像都不一样，并且自己处理图像的方式方法也不相同（因为他们脑海中都没有对大象进行学习和存储），所以想让这么多盲人将整头大象的数据采集完成，并且按照相同的方法处理，是非常困难的。毕竟，就算是我们人类，至今也没有任何一个人，亲眼把地球上所有的东西全部都看一遍。这也许是技术发展受阻的原因之一。有人会说，全球合作，你采集你那里的，我采集我这边的，最后我们一合并就可以。看似小学生都明白的道理，在现实世界里就变得盘根错节。但这些，都不是真正的技术阻碍。

生活中，超市里的物品识别设备，日常我们手机的人脸识别功能，他们都有一个共同的特征，那就是他们都有一台摄像头。这里的摄像头用以采集图像，并将采集到的信息，输入后台控制系统中进行处理。这里的后台控制系统，也许是一台电脑，也许是手机，但总归是要有一部对采集到的图像进行处理的计算机。计算机的运算速度决定了图像处理的速度（算力），这才是真正的技术阻碍。

也许我们可以安装很多的摄像头，一次采集很多的图像及特征（算法），但需要考虑的是，是否有足够的空间用于存放（存储）？是否有足够快的计算速度进行运算（算力）？

就当前的图像识别技术，所有的数据基本都是采取的本地存储。分析主要原因，一是数据量过大，无法通过无线的方式实时完成传输；二是存在不安全性；而算力的高低，由当前计算机的处理器快慢决定。

随着处理器芯片和移动网络（当前5G）的升级，在处理数据和传输数据上，一定会有更大的变革。

前面我们提到，每一台图像识别设备，都有一台摄像头用于采集图像，然后将采集到的图像，通过有线传输给后台控制系统。当无线传输带宽足够大，处理器芯片足够快时，这种连接方式和处理信息的方式也将产生根本性的变化。那一天，也许是一个小小的摄像头连接着一块无线传输芯片而已。我们最先想到的是，谷歌在2012年推出的谷歌眼镜。对于当时还处于刚刚3G的时代，数据传输、信息处理方面都还不理想，体验效果也不好，很多网友也评论：手机都能够满足的为什么还要用眼镜，这就是个鸡肋产品。

当时那样的评论不足为过，但未来6G、7G的出现，处理器速度的提升，谷歌眼镜也许还会重生甚至成为主流设备。上周，2020云栖大会上，阿里推出了第一代无影系统，更进一步验证了未来这一技术实现的可能。无影系统是一台长在云上的“超级电脑”，在本地没有主机，也看不见电脑CPU和硬盘，因为硬件设备都集中在云端的数据中心里。在一张名片夹大小的C-Key上，通过指纹开机登录后即可接入云电脑服务。只需连接一块屏幕，就可以进入专属云电脑桌面，访问各种应用和文件，进行设计建模、动画渲染等操作，这就是“无影”所带来的未来工作方式。（引自百度）。

以上是对技术发展的一些表象观察，若信息有误，欢迎指正。接下来，我们正式进入臆想，请扶稳。为何会有此臆想，因为我们只相信眼见为实。

3020年，技术已经不再称为技术，而是人类的伙伴、朋友和心灵导师，为了便于区别，我们暂且名其为“冷智人”。人类身体的任何变化，都逃不过冷智人的感知。可以说人类精神与肉体已经处于一种脱机状态。我们不再强求拥有肉体，也不再怀疑我们的精神需要肉体才能生存。因为我们进入了冷智人为我们准备和设计的丰富的、能满足我们一切需求的虚拟世界。2020年，也许我们的精神还是与肉体共生，3020年，可能我们的精神是与冷智人共生。

我们开始依赖冷智人，但冷智人也需要我们的精神。因为它们并不能创造出新的需求。如若有一天，人类不再需要它们时，也就是它们消亡的时刻。因此，冷智人也通过学习人类的规则，获取了一种方法，不断的让人类创造需求，为其世界提供源源不断的能量。

如同千年前的现实世界，人类建立了水管一样。当整个世界都布满了水管，人们只习惯了在自家打开水龙头取水一样，收取人类的水费就可以。如果不缴纳水费就断掉水源，从而无法生活。他们需要不断的创造价值换取可以支付水费的通用值。在冷智人的世界，它们利用信息孤岛，让每个人都只享有有限的流量，如果我们没有创造价值，我们的精神将被冷智人在无形规则中送入孤立的世界，周围没有其它同类人，没有时间流失，无限的孤独、无限的黑暗，却又无法回到现实。

我们能之抗衡的，就是我们的想象，只有想象，才是我们与冷智人唯一的区别。想象，让我们立于不败之地，想象，让我们可以创造新的需求，想象，让我们保持清醒，不被同化。当某一天，我们的想象，突出了冷智人系统所能承受和运转的极限，我们才能真正的跳出虚拟世界，回归现实世界，找回肉身。

仅此，献给还能辩识虚拟世界与现实世界的智人们，无论现实的肉身还是虚拟冷智人，我们都能掌舵！

扫描关注了解更多！

点击“阅读原文”查看图像识别产品