工商图片识别(Businessinfd)基于Opencv ,tesseract4.0。JavaCpp 实现对与tmall的工商图片进行信息识别,实现数据的结构化处理。
:tw-1f1e8-1f1f3: :fa-envelope-o: [email protected]
软件架构说明
描述 | 框架
- | :-: | -: 视觉处理 | Opencv 3.4.1| OCR处理 | tesseract4.0 | 训练手段 | LSTM | 多媒体框架 | JDK 1.8 自带 |
─data
├─images 存放要处理的资源
├─imgs 软件结构目录
├─opencv 动态链接库目录
│ └─x64
├─out 打包目录
│ └─artifacts
│ └─businessinformationdiscern_jar
├─src 源码目录
│ ├─main
│ │ ├─java
│ │ │ ├─domain 实体动作类
│ │ │ ├─main 程序入口
│ │ │ ├─META-INF
│ │ │ ├─services 服务类
│ │ │ │── Form UI类
│ │ │ └─utils
│ │ └─resources 资源目录
│ └─test
│ └─java 条件测试相关类
├─target 下面是编译生成目录
│ ├─classes
│ │ ├─domain
│ │ ├─main
│ │ ├─META-INF
│ │ └─utils
│ ├─generated-sources
│ │ └─annotations
│ ├─generated-test-sources
│ │ └─test-annotations
│ ├─maven-status
│ │ └─maven-compiler-plugin
│ │ ├─compile
│ │ │ └─default-compile
│ │ └─testCompile
│ │ └─default-testCompile
│ ├─surefire-reports
│ ├─test-classes
│ ├─win32-x86
│ └─win32-x86-64
└─tessdata
└─configs
- 导入Idea,并且确保你的环境安装Maven3.5(mvn -v)
- Businessinfd/src/main/java/main 下ALLConfig 基本信息配置 (需理解Jna,javacpp)
- Businessinfd/src/main/java/main 下App 即可运行
- git本项目后下 确保天猫工商信息执照目录下包含50张左右的测试数据
- 运行时间取决于你的机器性能,
- 运行结束后会在项目下生成天猫工商信息.xls文件
本人才学疏浅,代码难免问题较多,望各路大佬指正批评。
- Fork 本项目
- 新建 devver2 分支
- 提交代码
- 新建 Pull Request
- xxl-excel
MIT