Created
Aug 19, 2024 12:48 AM
Favorite
Favorite
Priority
备注
推荐
类型
  • 戳上方蓝字“开源先锋”关注我
推荐阅读:
大家好,我是开源君!
我们每天都要处理海量的文字信息,而很多信息都藏在图片里,要把它们批量提取出来总是不那么容易。
今天分享一个非常牛的OCR图片文字识别项目 - EasyOCR,能帮助我们轻松搞定图片文字识别问题。
notion image

项目简介

EasyOCR 是由 JaidedAI 开发的开源项目,它基于 PyTorch,采用了最新的深度学习模型,可以识别 80 多种语言的文字,不仅能识别英文、中文、日文,还能搞定一些稀有语言,比如泰米尔语、藏语等。
notion image
不同于其他复杂的OCR工具,EasyOCR提供了一个超简洁的API,让即便是编程小白也能轻松上手,享受文字识别的乐趣。
目前在Github上面收获了23.3K star!
notion image

性能特色

  • 多语言支持:除了常见的英文和中文,支持多达 80 多种语言,基本上世界上大多数语言都能用它来识别。
  • 高精度识别:得益于其基于深度学习的模型,文字识别准确度非常高,甚至对一些模糊、扭曲的图片文字也有不错的识别效果。
  • 轻量级设计:相较于某些臃肿的 OCR 库,EasyOCR 的模型相对轻量,不需要一台高配计算机也可以顺畅运行。
  • 灵活的使用场景:无论是单张图片识别,还是批量处理,它都可以轻松应对,适合用在很多自动化处理流程中,比如批量文件扫描、网页截图文字识别等。
  • 跨平台支持:支持多种操作系统,无论是Windows、macOS还是Linux,都能轻松驾驭。
  • 丰富的API接口:开发者很方便将其集成到自己的应用程序中,实现文字识别的自动化处理。

快速安装使用

安装EasyOCR很简单,只需要一行命令:
注:EasyOCR 的模型是基于 pytorch 框架训练的,在 easyocr 下载同时会下载一些其它附加 python 包,例如 pytorch, torchvision 等,时间需要久一点。
另外,官方提示win系统要预先安装好torch 和 torchvision。
安装好后接着可以用下面几行代码搞定图片的文字识别了:
是不是相当简单?只需要提供图片文件的路径,EasyOCR 就能自动识别并输出文字内容。这里用的是中文和英文的模型,换成其他语言也一样方便。

识别效果展示

notion image
notion image
notion image
notion image
如果觉得识别效果不好,还可以使用我们自己的数据集来训练识别模型。
notion image
EasyOCR 是一款非常不错的开源 OCR 工具,低调却实力强劲,凭借着超强的多语言支持、优秀的识别性能和简单的使用方式,极大地方便了开发者的工作。无论批量处理文件,还是做一些简单的图片文字提取,EasyOCR 都可以轻松胜任。
更多细节功能,感兴趣的可以到项目地址查看:
项目地址:
https://github.com/JaidedAI/EasyOCR
Loading...