vlambda博客
学习文章列表

智能交互|图像识别/计算机视觉

    由于机器学习上的突破,图像识别在过去几年中取得了飞跃。机器人已经可以使用图像处理服务来识别图像,分析照片中人物的情绪,以及从图像中提取文本。

    当用户在对话界面中上传图像,并且机器人必须根据图像执行操作时,图像识别就尤为重要。

    大多数图像识别服务已经用许多常见对象训练过了,所以机器人构建者不需要提前做训练。将这张图像上传给该服务,你就会得到它识别出的一组对象和预测的精准度。

    机器学习也可用于光学字符识别(OCR)。例如,当用户向财务机器人或费用机器人上传收据或账单时,就可能要使用这个功能。

    识别手写字体要复杂一些,通常对手写字体识别的结果比对打印文本的识别结果更差,但是这方面的技术一直在进步,而且如果有足够的训练数据,识别结果会非常完美。

    请注意,你不必支持图像识别,如果用户在不支持图像识别的用例中上传图像,机器人会有一个默认的错误处理流程,我们稍后将会讨论。