Tesseract.js
IT技术网
Tesseract.js

一款基开源 OCR库,核心实现源自Tesseract OCR 引擎,并通过 WebAssembly 将其移植到浏览器和 Node.js 环境中,使得前端开发者可以直接在网页或服务器端完成图像文字的提取。

Tesseract.js 是一个基于 JavaScript 的开源 OCR(光学字符识别)库,使用 WebAssembly 将 Google 的 Tesseract OCR 引擎移植到浏览器和 Node.js 环境中。它可以在前端直接对图片进行文字提取,支持 100 多种语言(包括中、英、法、德等),适用于文档扫描、实时视频识别、移动端离线 OCR 等场景。

主要特性

Tesseract.js 通过 WebAssembly 将强大的 Tesseract OCR 引擎带到前端,具备跨平台、多语言、低内存、高性能等优势。只需几行代码即可在浏览器或 Node.js 中完成文字识别,配合 createWorker 与本地语言数据即可实现离线、批量、实时的 OCR 需求。

相关导航