微软公开发布的最新Win10预览版10074今天收到了OCR简体中文语言包更新。用户可以通过设置应用中的Windows更新下载安装该语言包。
OCR更新
OCR(光学字符识别,Optical Character Recognition)是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题,ICR(Intelligent Character Recognition,智能字体识别)的名词也因此而产生。衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。
根据微软提供的更新信息,该语言包用于修复Windows10相关功能问题,安装之后电脑可能需要重启。但实际安装后发现这项更新并不要求重启,而且所谓“修复”问题很可能是为Win10的OCR功能提供简体中文识别能力,现在Win10可以原生支持简体中文的OCR识别功能。