Github获星3000+，文字识别开源神器，超轻量级中文OCR！

vlambda
2020-03-22

Github获星3000+，文字识别开源神器，超轻量级中文OCR！

随着人工智能发展，OCR可以说是应用最多的技术之一。不管是身份证信息录入、车牌识别、快递单识别、还是拍照翻译都离不开它。

OCR，即Optical Character Recognition，光学字符识别，是指利用如扫描仪、数码相机等电子设备检查纸上打印的字符，并确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。

近日，Github上开源了一个超轻量级中文OCR 项目： chineseocr_lite ，目前已获星 3000+。

chineseocr_lite 基于 chineseocr 与 psenet 实现了中文自然场景文字检测及识别，它支持竖排文字识别，支持 ncnn 推理，psenet (8.5M) + crnn (6.3M) + anglenet (1.5M) 总模型仅 17M。此外，该项目支持linux/macos/windows 平台。

项目地址：

https://github.com/ouyanghuiyu/chineseocr_lite

支持的功能

提供轻量的 backone 检测模型

psenet（8.5M）
crnn_lstm_lite (9.5M)
行文本方向分类网络（1.5M）

任意方向文字检测，识别时判断行文本方向
crnn\crnn_lite lstm\dense 识别
支持竖排文本识别
ncnn 实现 (支持lstm) nihui大佬实现的crnn_lstm推理
提供竖排文字样例以及字体库（旋转90度的字体）
psenet ncnn核扩展实现，有效解决粘连文本检测问题

竖排字体样式

生成的竖排文本样例

识别效果展示

ncnn 检测识别展示