大家好,我是Echa。
光学字符识别(Optical Character Recognition, OCR)是指对文本资料的图像文件进行剖析识别处理,获取笔墨及版面信息的过程。亦即将图像中的笔墨进行识别,并以文本的形式返回。
OCR技能的特点

提高效率:OCR技能比较传统的人工办法,能够更快实现信息录入。
降落本钱:以机器代替人工,能够节省人力本钱的开销。
适用性强:OCR技能能够实现多场景和多措辞的识别,还能通过提取图像中的文本分析其所包含的语义信息,为机器理解图像供应高层语义线索。
OCR技能的特点
OCR的运用处景
卡片证件识别类:身份证识别、银行卡识别、驾驶证识别、行驶证识别、港澳通畅证识别、护照识别、户口簿识别、业务执照识别;票据类识别:增值税发票识别、支票识别、承兑汇票识别、银行票据识别、业务执照识别、物流快递识别;笔墨信息构造化视频类识别:紧张有字幕识别和笔墨跟踪;其他识别:二维码识别、一维码识别、车牌识别、数学公式识别、物理化学符号识别、音乐符号识别、工程图识别、流程图识别、古迹文献识别、手写输入识别;除了以上列举的之外,还有自然场景下的笔墨识别、菜单识别、横幅检测识别、图章检测识别、广告类图文识别等环绕审核干系的业务运用。OCR的运用处景
前一段韶光
12个完备免费的OCR开源项目
盘点18个精良图像识别开源项目
借此机会,
先容
基于spring boot + maven + opencv 实现的图像深度学习Demo项目,包含车牌识别、人脸识别、证件识别等功能,贯穿样本处理、模型演习、图像处理、工具检测、工具识别等技能点
功能特点
蓝、绿、黄车牌检测及车牌号码识别网上常见的轮廓提取车牌算法JAVA实现hsv色彩分割提取车牌算法JAVA实现harrcascade特色识别算法 JAVA实现基于svm算法的车牌检测演习JAVA实现基于ann算法的车牌号码识别演习JAVA实现人脸检测 接下来将实现人脸识别图片工具: 目前实现了HSV色彩切割,后续将添加更多利用的图片处理工具,用于赞助算法优化证件笔墨识别系统截图
EasyPR - 是一个中文的开源车牌识别系统Gitee:https://gitee.com/liuruoze/EasyPR
先容
EasyPR是一个开源的中文车牌识别系统,其目标是成为一个大略、高效、准确的非限定场景(unconstrained situation)下的车牌识别库。
比较于其他的车牌识别系统,EasyPR有如下特点:
它基于openCV这个开源库。这意味着你可以获取全部源代码,并且移植到opencv支持的所有平台。它能够识别中文。例如车牌为苏EUK的图片,它可以准确地输出std:string类型的"苏EUK"的结果。它的识别率较高。图片清晰情形下,车牌检测与字符识别可以达到80%以上的精度。例子
假设我们有如下的原始图片,须要识别出中间的车牌字符与颜色:
经由EasyPR的第一步处理车牌检测(PlateDetect)往后,我们得到了原始图片中仅包含车牌的图块:
接着,我们对图块进行OCR过程,在EasyPR中,叫做字符识别(CharsRecognize)。我们得到了一个包含车牌颜色与字符的字符串:
“蓝牌:苏EUK”
截图:
meihu-meiyan - 美狐直播美颜系统
Gitee:https://gitee.com/MeiHuSDK/meihu-meiyan
先容
美狐美颜sdk,知足客户在直播平台实现美颜效果、短视频系统自带美颜殊效等浩瀚音视频软件业务场景的美化需求的第三方美颜api,因此人脸识别、人脸关键点技能为核心,供应专业级实时美颜、大眼瘦脸、美颜滤镜、动态贴纸、美白磨皮、美型、萌颜等殊效的接口,以打造多功能视频美颜软件为目标。
截图
dface - 是个开源的深度学习人脸检测和人脸识别系统
Gitee:https://gitee.com/kuaikuaikim/dface
先容
基于多任务卷积网络(MTCNN)和Center-Loss的多人实时人脸检测和人脸识别系统。
DFace 是个开源的深度学习人脸检测和人脸识别系统。所有功能都采取 pytorch 框架开拓。pytorch是一个由facebook开拓的深度学习框架,它包含了一些比较有趣的高等特性,例如自动求导,动态构图等。DFace天然的继续了这些优点,使得它的演习过程可以更加大略方便,并且实现的代码可以更加清晰易懂。 DFace可以利用CUDA来支持GPU加速模式。
HyperLPR - 高性能中文车牌识别管理系统
Gitee:https://gitee.com/zeusees/HyperLPR
先容
HyperLRP是一个开源的、基于深度学习高性能中文车牌识别库,支持PHP、C/C++、Python措辞,Windows/Mac/Linux/Android/IOS 平台。
特性
速率快 720p,单核 Intel 2.2G CPU (MaBook Pro 2015)均匀识别韶光低于100ms基于端到真个车牌识别无需进行字符分割识别率高,卡口场景准确率在95%-97%旁边轻量,总代码量不超1k行可识别和待支持的车牌的类型
单行蓝牌单行黄牌新能源车牌白色警用车牌使馆/港澳车牌教练车牌武警车牌民航车牌双层黄牌双层武警双层军牌双层农用车牌双层个性化车牌截图
idCardCv - 证件识别管理系统Gitee:https://gitee.com/endlesshh/idCardCv
先容
idCardCv 身份证号码识别,适用于web端身份证识别做事器,前端进行身份证号码定位,后端精准处理识别,准确率在96旁边,对付自治区的身份证前面有其他笔墨的一样可以识别。
verification-decoder - 验证码CNN识别库
Gitee:https://gitee.com/kdldbq/verification-decoder
先容
通过演习CNN(卷积神经网络)对4位验证码识别,个中字符有0-9a-zA-Z共计62种,但是预测结果不区分大小写,以是终极预测结果为36种。验证码由多个字体、颜色、滋扰线随机天生。
利用TensorFlow,CNN识别4位字符验证码,60万次演习,90.02%精确率
结果
以下是对100万张演习验证码进行演习,20万张不参与演习的测试验证码测试出的结果
一样平常的验证码系统都会去掉类似的字符(例如:i, l, o, 1, 0...),为了更全面的测试,以是我选择将这些难以识别的字符也添加进去测试,可以看出有这些难以辨别的字符时,连人类也很难去完备预测精确(下图,第一行为预测值,第二行为真实值)
演习60万次时的结果:
medicine-identification - 中药图像识别系统
Gitee:https://gitee.com/xiaohaoo/medicine-identification
先容
中药识别系统紧张采取APP端拍照上传的办法,构建卷积神经网络(CNN)对图像进行识别,具有识别效率高,准确度高的特点。APP真个功能包括但不限于拍照识别、中药问答(付费咨询)、检索查询、中药性状以及功效查看、方剂智能推举【开拓中】等;本系统包含APP端以及做事器端。
系统截图
face-search - 人脸搜索采集管理系统Gitee:https://gitee.com/open-visual/face-search
先容
本项目是阿里云视觉智能开放平台的人脸搜索M:N的开源替代,项目中利用的模型均为开源模型,项目支持opensearch、milvus和proxima向量存储库,并具有较高的自定义能力。
系统架构图
截图
PaddleDetection - 目标检测管理系统
Gitee:https://gitee.com/paddlepaddle/PaddleDetection
先容
PaddleDetection是一个基于PaddlePaddle的目标检测端到端开拓套件,在供应丰富的模型组件和测试基准的同时,看重端到真个家当落地运用,通过打造家当级特色模型|工具、培植家当运用范例等手段,帮助开拓者实现数据准备、模型选型、模型演习、模型支配的全流程打通,快速进行落地运用。
截图
red5-rtmp-push - 天网人脸识别系统
Gitee:https://gitee.com/endlesshh/red5-rtmp-push
先容
天网人脸识别系统,获取视频流 进行人脸识别后推送到流媒体做事器实时展示
全体系统共有两个项目组成
red5_hls 流媒体做事器是对red5做事器进行springboot构建,同时支持hls,rtsp等流的播放支持red5-rtmp-push 接管视频流并推送到做事器系统截图
open-anpr - 智能车牌识别管理系统,支持14种中文车牌类型。Gitee:https://gitee.com/open-visual/open-anpr
最全车牌识别
最全车牌识别算法,支持14种中文车牌类型。项目利用纯Java开拓,免去利用Python带来的做事不稳定性。欢迎大家贡献代码,如果你以为项目还不错,请给个star。Free Offline OCR - 离线的中文文本检测+识别SDK
Gitee:https://gitee.com/microic/tr
一款针对扫描文档的离线文本识别SDK,核心代码全部采取C++开拓,并供应Python接口
car- 车辆检测计数+车牌定位+车牌识别的领悟技能Gitee: https://gitee.com/jiang_maowei/car
先容
基于pytorch深度学习框架,利用开源模型yolov4实现模板检测与yolov5实现车牌检测与LPRNet实现车牌检测
基于win10系统,利用anaconda配置python环境,在anaconda里面下载vscode对项目进行编辑,
截图
document-ocr - 一个相对完全的文档剖析和识别项目
Gitee:https://gitee.com/rockyzheng/document-ocr
先容
一个相对完全的文档剖析和识别项目含以下五部分:
文档剖析数据,识别数据合成工具,文档版面剖析模型,文本行识别模型,单字识别模型数据
数据从网络抓取的公开上市公司年报数据 PDF 文件解析天生,有图片和文本的位置信息
截图
gradio_yolov5_det - 通用目标检测系统
Gitee:https://gitee.com/CV_Lab/gradio_yolov5_det
先容
基于Gradio的YOLOv5通用目标检测演示系统,可自定义检测模型、演示便捷、安装大略
流程图
截图
mobile-lpr - 是一个面向移动真个准商业级车牌识别库
Gitee:https://gitee.com/damone/mobile-lpr
先容
Mobile-LPR 是一个面向移动真个准商业级车牌识别库,以NCNN作为推理后端,利用DNN作为算法核心,支持多种车牌检测算法,支持车牌识别和车牌颜色识别。
特点
超轻量,核心库只依赖NCNN,并且对模型量化进行支持多检测,支持SSD,MTCNN,LFFD等目标检测算法精度高,LFFD目标检测在CCPD检测AP达到98.9,车牌识别达到99.95%, 综合识别率超过99%易利用,只须要10行代码即可完成车牌识别易扩展,可快速扩展各种检测算法流程图
截图
末了一行代码,可能会创造出下一个让人惊叹的产品;一个创新,可能会开启一个全新的科技时期;一份初心,可能会影响到无数人的生活;无论是在大公司事情,还是在小团队奋斗;无论是资深的程序员,还是刚刚入行的新手;每个人的代码,都有力量改变天下。
创作不易,喜好的老铁们加个关注,点个赞,打个赏,后面会不定期更新干货和技能干系的资讯,速速收藏,感激!
你们的一个小小举动便是对
创作文章的初心是:沉淀、分享和利他。既想写给现在的你,也想贪心写给 10 年、20 年后的工程师们,现在的你站在浪潮之巅,面对魔幻的互联网天下,很随意马虎把一条河流算作整片大海。未来的读者已经知道了这段技能的发展历史,但难免会忽略一些细节。如果未来的工程师们真的创造出了韶光旅行机器,可以让你回到现在。那么小编的创作便是你和当年工程师们的接头暗号,你能感知到他们在这个时期的键盘上留下的余温。