发布于2021-05-29 23:14 阅读(1805) 评论(0) 点赞(17) 收藏(3)
一、电脑中安装 tesseract ;可以参考另一篇文章:https://blog.csdn.net/wang_jing_jing/article/details/117333990
二、下载 tess4j
https://sourceforge.net/projects/tess4j/files/latest/download
三、创建一个普通的maven项目
创建项目如果不会的话,可以看我的另一篇springboot 项目创建:https://blog.csdn.net/wang_jing_jing/article/details/115075991
四、项目中倒入 tess4j/lib 下的所有jar包 和 tess4j/dist/tess4j-3.4.8.jar
五、编写测试代码
- package com.tess4jdemo;
-
-
- import java.io.File;
- import java.io.IOException;
-
- import net.sourceforge.tess4j.ITesseract;
- import net.sourceforge.tess4j.Tesseract;
- import net.sourceforge.tess4j.TesseractException;
-
-
-
- /**
- * @ClassName Test
- * @Description 测试类
- * @Author WangJing
- * @Date 2021/5/27 10:49 上午
- * @Version V1.1.0
- */
- public class Test {
-
- public static void main(String[] args){
- long startTime = System.currentTimeMillis();
-
- String imgPath = "/Users/wangjing/Desktop/ocr/test.jpeg";//图片地址
-
- File file = new File(imgPath);
- ITesseract instance = new Tesseract();
-
- String tessData = "/Users/wangjing/Desktop/ocr/Tess4J";//tess4j 解压地址
- File directory = new File(tessData);
- String courseFile = null;
- try {
- courseFile = directory.getCanonicalPath();
- } catch (IOException e) {
- e.printStackTrace();
- }
-
- //设置训练库的位置
- instance.setDatapath(courseFile + "//tessdata");
-
- instance.setLanguage("eng");//chi_sim :简体中文, eng 根据需求选择语言库
- String result = null;
- try {
- result = instance.doOCR(file);
- } catch (TesseractException e) {
- e.printStackTrace();
- }
- System.out.println("result: ");
- System.out.println(result);
- long endTime = System.currentTimeMillis();
- System.out.println("执行时间:" + (endTime - startTime));
- }
-
- }
六、运行查看效果
原图片:
识别效果:
发现左上角仅有的几个汉字没有识别成功;接下来我们要下载汉化包:https://raw.githubusercontent.com/tesseract-ocr/tessdata/master/chi_sim.traineddata
然后放到我们 Tess4j/tessdata 目录下;然后程序中语言改为中文:instance.setLanguage("chi_sim"); 看下效果,非常完美
注:以上内容仅提供参考和交流,请勿用于商业用途,如有侵权联系本人删除!
原文链接:https://blog.csdn.net/wang_jing_jing/article/details/117361691
作者:想要飞翔的天使
链接:http://www.javaheidong.com/blog/article/207875/04fc960553ee6801284c/
来源:java黑洞网
任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任
昵称:
评论内容:(最多支持255个字符)
---无人问津也好,技不如人也罢,你都要试着安静下来,去做自己该做的事,而不是让内心的烦躁、焦虑,坏掉你本来就不多的热情和定力
Copyright © 2018-2021 java黑洞网 All Rights Reserved 版权所有,并保留所有权利。京ICP备18063182号-2
投诉与举报,广告合作请联系vgs_info@163.com或QQ3083709327
免责声明:网站文章均由用户上传,仅供读者学习交流使用,禁止用做商业用途。若文章涉及色情,反动,侵权等违法信息,请向我们举报,一经核实我们会立即删除!