OCR是英文Optical Character Recognition的缩写,意思为光学字符识别,通称为文字识别,它的工作原理为通过扫描仪或数码相机等光学输入设备获取纸张上的文字图片信息,利用各种模式识别算法分析文字形态特征,判断出汉字的标准编码,并按通用格式存储在文本文件中,由此可以看出,OCR实际上是让计算机认字,实现文字自动输入。它是一种快捷、省力、高效的文字输入方法。
TH-OCR的突出特点
1.汉英双语同时混排,识别率最高,居世界领先水平。
2.可以识别黑白、灰度、彩色图像,可以读取多种图像格式。
3.首创对识别结果进行电子文档版面复原功能,所见即所得。
4.首创日文、韩文、日英混排、韩英混排识别功能,识别率98%以上。
TH-OCR的六大优势
1. 是唯一可以识别2万多汉字的多体文字识别系统,汉字识别国内最优。
2. 汉字和英文混排、日文和英文混排、韩文和英文混排同时识别。
3. 汉字识别率最高。文通TH-OCR经过"863"智能专家组对数十万字的指标评测和中国软件评测中心对产品的严格测试,识别正确率超过99.5%,代表了目前印刷体文字识别的最高水平。
4. 支持多种环境接口。文通TH-OCR支持WINDOWS环境和GB、BIG5、GBK、JIS、 SHIFT-JIS和KSC等多种内码,可以用于 WINDOWS NT和WINDOWS 98/2000/XP,适合全球各个地区使用。TH-OCR还具有自学习功能,不论什么生僻字,都可以通过键盘输入进行学习,大大拓宽了OCR系统的识别字符集。
5. 历次国内鉴定均被中国科学院院土和中国工程院院土等专家组成的鉴定委员会评定为“具有世界领先水平”。
广泛的社会认可
1、 多年来为众多著名的扫描仪厂商HP、UNISCAN、EPSON、CANON、 LENOVO等提供TH-OCR普及版作为其扫描仪的捆绑软件。
2、美国MICROSOFT公司将TH-OCR作为东方文字识别捆绑到WINXP 操作系统中。
3、美国MOTOROLA公司确定TH-OCR的部分技术使用权。
4、美国INTEL公司确定TH-OCR为最新的MMX技术支持项目。
5、《计算机世界》市场调查结果,文通TH-OCR市场占有率达65%以上。
6、《中国计算机报》 CIWLAB组织的用户调查认为, TH-OCR是一个性能极好的系统,是一个值得用户信赖的系统(对其他品牌OCR评价为:“是值得用户选择的产品”)。
如何使用清华紫光OCR
应该可以用,我就直接用清华紫光TH-OCR XP版 文件->打开,选择要识别的文件,可以是tif、bmp、jpg格式的 命令->识别,会自动识别的 识别完成后,软件左边的树状栏里会有图像文件名,用鼠标点开哪个加号,就是识别后的文本文件 单击它,软件右边上方是识别后的文本,下方是被识别的图像文件 这时用键盘移动光标,就能查看图像和对应文本,并能直接改动文本二值图像就是只有黑白两色的图像,用windows自带的画图软件就能做出来 先用画图打开图像,图像->属性,将颜色改成黑白,再存盘就得到二值图像了 其它图形图像软件都有这个功能
湘ICP备2022002427号-10湘公网安备:43070202000427号
© 2013~2019 haote.com 好特网