智能交互|图像识别/计算机视觉

由于机器学习上的突破，图像识别在过去几年中取得了飞跃。机器人已经可以使用图像处理服务来识别图像，分析照片中人物的情绪，以及从图像中提取文本。

当用户在对话界面中上传图像，并且机器人必须根据图像执行操作时，图像识别就尤为重要。

大多数图像识别服务已经用许多常见对象训练过了，所以机器人构建者不需要提前做训练。将这张图像上传给该服务，你就会得到它识别出的一组对象和预测的精准度。

机器学习也可用于光学字符识别（OCR）。例如，当用户向财务机器人或费用机器人上传收据或账单时，就可能要使用这个功能。

识别手写字体要复杂一些，通常对手写字体识别的结果比对打印文本的识别结果更差，但是这方面的技术一直在进步，而且如果有足够的训练数据，识别结果会非常完美。

请注意，你不必支持图像识别，如果用户在不支持图像识别的用例中上传图像，机器人会有一个默认的错误处理流程，我们稍后将会讨论。

vlambda博客
学习文章列表