Skip to content

Latest commit

 

History

History
33 lines (14 loc) · 1.16 KB

README.md

File metadata and controls

33 lines (14 loc) · 1.16 KB

个人机器学习笔记

查看主页中的各类标签

ocr-overview:ocr算法的一些记录

practice:跑的一些作业

算法结构主要分为文本检测部分和文字识别部分(附带文本框矫正部分用来适应某些不规则文本的场景) 文本检测采用基于分割的DB算法,文本识别采用主流的CRNN

文本框识别

image

文字识别输出

image

文本检测部分算法主要有基于回归:文本检测方法和目标检测算法的方法相似,文本检测方法只有两个类别,图像中的文本视为待检测的目标,其余部分视为背景(CTPN)

                    分割:通过分割方法得到图像中文本区域,再利用opencv,polygon等后处理得到文本区域的最小包围曲线。

文本检测算法属于目标检测算法的子集,常见目标检测算法有RCNN、YOLO、SSD系列

#还在慢慢写中。。。。。。。。。。。。。。。。。。。。。