python矢量图识别

1年前 (2023-09-21)阅读134回复0
钱良钗
钱良钗
  • 注册排名10014
  • 经验值0
  • 级别
  • 主题0
  • 回复0
楼主

矢量图是指由直线、曲线和其他几何图形组成的图形,与像素图相比,其具有无损缩放、清晰度高等优点。然而,对于程序来说,矢量图往往并不方便处理。如果需要对矢量图进行后续处理,比如提取其中的文本、边框等信息,那么需要将矢量图转换为相应的数据结构,如svg等。而这个过程,就需要使用到python矢量图识别。

# 导入依赖库
from PIL import Image
import numpy as np
import pytesseract
import cv2
# 加载矢量图
img = Image.open('./test.svg')
# 将图像转换为numpy数组
img_arr = np.array(img)
# 将图像转换为灰度图
gray = cv2.cvtColor(img_arr, cv2.COLOR_BGR2GRAY)
# 预处理,二值化
thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1]
# OCR识别
text = pytesseract.image_to_string(thresh, lang='fra')
# 输出识别结果
print(text)

上述代码使用了python中常用的三个图像处理相关库——pillow、numpy和opencv,以及OCR识别库pytesseract。该代码将矢量图加载并转换为numpy数组,然后将其转换为灰度图并进行预处理,最后使用OCR识别库pytesseract进行文本识别。通过这样的方式,我们可以较为方便地从矢量图中提取出所需的信息。

本文可能转载于网络公开资源,如果侵犯您的权益,请联系我们删除。

本文地址:https://www.pyask.cn/info/537.html

0
回帖

python矢量图识别 期待您的回复!

取消
载入表情清单……
载入颜色清单……
插入网络图片

取消确定

图片上传中
编辑器信息
提示信息