一、创建项目
1.从百度网盘下载Tess4J-3.4.8-src.zip到桌面,并解压到当前文件夹
2.IDEA==左上文件==新建==项目==左侧新建项目==输入OCR==构建系统选择IDEA==点击创建
3.将解压出来的Tess4J文件夹里的==lib+src+tessdata复制到OCR项目里
4.将解压出来的Tess4J文件夹里的==chi_sim.traineddata,放入tessdata文件夹下
5.将Tess4J文件夹里的==dist文件夹下的==tess4j-3.4.8.jar==复制到OCR项目里的lib文件夹下
6.IDEA==选中lib文件夹==右键添加为库==点击确定
7.对着src==右键新建==软件包==com.tys.test
8.对着com.tys.test==右键新建==Java类==TestOCR
二、识别单张图片
1. D盘下创建文件夹,名字叫OCRTest
2. 文件夹下,放入Tess4J文件夹里的测试图片,01-验证码,02-英文,03-中文
3. 图片格式在线转换网址 https://www.gaitubao.com/jpg-gif-png
=========================================================================================
package com.tys.test;
import net.sourceforge.tess4j.*;
import java.io.*;
public class TestOCR {
public static void main(String[] args) {
try {
File imageFile = new File("D:\\OCRTest\\03.png");
ITesseract instance = new Tesseract();
instance.setDatapath("C:\\Users\\Administrator\\IdeaProjects\\OCR\\tessdata");
instance.setLanguage("chi_sim");
String result = instance.doOCR(imageFile);
System.out.print(result);
} catch (Exception e) {
e.printStackTrace();
}
}
}
三、遍历图片
========================================================================================
package com.tys.test;
import net.sourceforge.tess4j.*;
import java.io.*;
public class TestOCR {
public static void main(String[] args) {
File root = new File(System.getProperty("user.dir") + "/imgs");
ITesseract instance = new Tesseract();
instance.setLanguage("chi_sim");
try {
File[] files = root.listFiles();
for (File file : files) {
String result = instance.doOCR(file);
String fileName = file.toString().substring(file.toString().lastIndexOf("\\")+1);
String str="图片名:" + fileName +" 识别结果:"+result;
System.out.print(str);
}
} catch (Exception e) {
e.printStackTrace();
}
}
}
|