




扫描文档时需使用黑白模式,同时也要注意这种模式下的Threshold值(阈值,表示一个参数范围,大于或小于这个范围都不能产生效应),这是决定何种程度的黑色可被扫描仪视为黑点,这样可以简便地将文字的黑与背景干扰的黑分辨出来,如果调整得当,可加快扫描速度。这个值的调整可以在扫描图像的色调值(tone value)统计直方图(Histogram)中,先区分出两个或以上的波峰,然后将Threshold在两者之间调整,便能找到具备不错区分效果的位置。如果认为这种方式较麻烦,还有另一个简便方法,通过文字大小来决定分辨率。一般来说,200或300dpi的分辨率可以得到相当不错的效果。如果待扫描的文字比报刊文字还要小,可以将分辨率提高,从而得到可放大的扫描文档,提升识别率。
常见的投射能量有一般的可见光、高能光束、超音波与X射线。时差测距(Time-of-Flight)光达(lidar,LIght etection And Ranging的缩写,或称3D激光扫描仪)可用于扫描建筑物、岩层(rock formati)等以制作3D模型。光达的激光光束可扫描相当大的范围:如图中此款的仪器头部可水平旋转360度,而反射激光光束的镜面则在垂直方向快速转动。


目前OCR软件与扫描仪的搭配已经应用到信息化时代的多个领域,如数字化图书馆,各种报表的识别、以及***、税务系统的识别等。在扫描仪市场上,许多类型的扫描仪均配有OCR软件,如 扫描仪就用这款软件,帮助图书馆【图书数字化】、档案馆【成册档案无需拆卷】以及【案卷】完成日常的文稿存档识别工作,将客户相关书刊、档案、案卷通过***的扫描仪进行扫描,随后进行OCR识别或存储成图像文件将图像文件转换成文本文件或WORD文件进行存储。

