创新互联Python教程:怎么用python实现把图片上的字写入文本文件

将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR)。可以实现OCR 的底层库并不多,目前很多库都是使用共同的几个底层OCR 库,或者是在上面进行定制。

Tesseract 是一个OCR 库,目前由Google 赞助(Google 也是一家以OCR 和机器学习技术闻名于世的公司)。Tesseract 是目前公认最优秀、最精确的开源OCR 系统。

Tesseract的安装与使用:

Tesseract的Windows安装包下载地址为: http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe ,下载后双击直接安装即可。

安装完后,需要将Tesseract添加到系统变量中。在CMD中输入tesseract -v, 如显示以下界面,则表示Tesseract安装完成且添加到系统变量中。

Linux 用户可以通过apt-get 安装:

$sudo apt-get tesseract-ocr

使用示例:

图片路径为:E://figures/other/poems.jpg

输入命令 tesseract E://figures/other/poems.jpg E://figures/other/poems.txt, 则会将poems.jpg中的识别文字写入到poems.txt中


本文题目:创新互联Python教程:怎么用python实现把图片上的字写入文本文件
当前URL:http://www.hxwzsj.com/article/djojecs.html

其他资讯

Copyright © 2025 青羊区翔捷宏鑫字牌设计制作工作室(个体工商户) All Rights Reserved 蜀ICP备2025123194号-14
友情链接: 成都网站制作 网站制作 网站制作报价 成都网站建设公司 网站建设公司 成都网站制作 品牌网站建设 成都网站制作 网站制作 成都网站设计 重庆手机网站建设 成都网站制作 定制网站建设 成都品牌网站设计 成都网站制作 成都网站建设 成都网站建设推广 成都网站建设 手机网站制作设计 成都网站建设 成都做网站建设公司 响应式网站设计