Скачиваете python,в него грузите библиотеку openCv, затем грузитесь и импортируете библиотеку Keras
image_file = "text.png"
img = cv2.imread(image_file)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
ret, thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY)
img_erode = cv2.erode(thresh, np.ones((3, 3), np.uint8), iterations=1)
# Get contours
contours, hierarchy = cv2.findContours(img_erode, cv2.RETR_TREE, cv2.CHAIN_APPROX_NONE)
output = img.copy()
for idx, contour in enumerate(contours):
(x, y, w, h) = cv2.boundingRect(contour)
# print("R", idx, x, y, w, h, cv2.contourArea(contour), hierarchy[0][idx])
# hierarchy[i][0]: the index of the next contour of the same level
# hierarchy[i][1]: the index of the previous contour of the same level
# hierarchy[i][2]: the index of the first child
# hierarchy[i][3]: the index of the parent
if hierarchy[0][idx][3] == 0:
cv2.rectangle(output, (x, y), (x + w, y + h), (70, 0, 0), 1)
cv2.imshow("Input", img)
cv2.imshow("Enlarged", img_erode)
cv2.imshow("Output", output)
cv2.waitKey(0)
Либо на ютубе вбейте ваш запрос и все
Шрифты специфические, множественные ошибки распознавания неизбежны. В любом случае понадобится человеческая проверка.
Как по мне, проверка и исправление займет куда больше времени. Так не легче ли сделать все вручную?
А как иначе? Я не понимаю на что надеется ТС. Сэкономить время тут не получится.
Процент ошибок от работы человека будет значительно меньше. Достаточно, чтобы отказаться от тотальной перепроверки.
Нанять парочку китайцев, пусть делают по 10 картинок за юань. За пару же дней управятся.