vlambda博客
学习文章列表

Github获星3000+,文字识别开源神器,超轻量级中文OCR!

随着人工智能发展,OCR可以说是应用最多的技术之一。不管是身份证信息录入、车牌识别、快递单识别、还是拍照翻译都离不开它。

OCR,即Optical Character Recognition,光学字符识别,是指利用如扫描仪、数码相机等电子设备检查纸上打印的字符,并确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

近日,Github上开源了一个超轻量级中文OCR 项目 chineseocr_lite ,目前已获星 3000+。

chineseocr_lite 基于 chineseocr 与 psenet 实现了中文自然场景文字检测及识别,它支持竖排文字识别,支持 ncnn 推理,psenet (8.5M) + crnn (6.3M) + anglenet (1.5M) 总模型仅 17M。此外,该项目支持linux/macos/windows 平台。

项目地址
https://github.com/ouyanghuiyu/chineseocr_lite

   支持的功能

  • 提供轻量的 backone 检测模型
    • psenet(8.5M)

    • crnn_lstm_lite (9.5M)

    • 行文本方向分类网络(1.5M)

  • 任意方向文字检测,识别时判断行文本方向
  • crnn\crnn_lite lstm\dense 识别
  • 支持竖排文本识别
  • ncnn 实现 (支持lstm) nihui大佬实现的crnn_lstm推理 
  • 提供竖排文字样例以及字体库(旋转90度的字体)
  • psenet ncnn核扩展实现,有效解决粘连文本检测问题


   竖排字体样式

Github获星3000+,文字识别开源神器,超轻量级中文OCR!


   生成的竖排文本样例


Github获星3000+,文字识别开源神器,超轻量级中文OCR!

   识别效果展示
Github获星3000+,文字识别开源神器,超轻量级中文OCR!


   ncnn 检测识别展示


Github获星3000+,文字识别开源神器,超轻量级中文OCR!

   
     
     
   
为您推荐