OCR 是 Optical Character Recognition 的缩写,中文常译为光学字符识别:指用软件把图片、扫描件或照片中的印刷体或手写文字识别出来,并转换为可编辑、可搜索的文本。
/ˌoʊ siː ˈɑːr/
I used OCR to copy the text from a scanned contract.
我用 OCR 从扫描的合同里提取了文字。
After the archive digitized the newspapers, OCR made them searchable, but it still struggled with old fonts and stains.
档案馆把报纸数字化后,OCR 让它们可以被检索,但它仍然难以处理老字体和污渍。
OCR 属于首字母缩略词(acronym/initialism),来自计算机与文档处理领域:optical(光学的)+ character(字符)+ recognition(识别)。随着扫描仪、数码相机与文档数字化需求普及,这个缩写在办公、出版、档案与信息检索场景中广泛使用。