职场网站IT技术网

Tesseract.js

一款基开源 OCR库,核心实现源自Tesseract OCR 引擎,并通过 WebAssembly 将其移植到浏览器和 Node.js 环境中,使得前端开发者可以直接在网页或服务器端完成图像文字的提取。

标签:
海外账号豆包AI扣子

Tesseract.js 是一个基于 JavaScript 的开源 OCR(光学字符识别)库,使用 WebAssembly 将 Google 的 Tesseract OCR 引擎移植到浏览器和 Node.js 环境中。它可以在前端直接对图片进行文字提取,支持 100 多种语言(包括中、英、法、德等),适用于文档扫描、实时视频识别、移动端离线 OCR 等场景。

Tesseract.js插图

主要特性

  • 跨平台:同时支持浏览器(通过 <script>、CDN、Webpack 等)和 Node.js 环境。
  • 多语言:内置 100+ 语言的训练数据,中文(简体/繁体)识别效果良好。
  • WebAssembly 加速:核心 OCR 引擎以 WASM 形式运行,内存占用低、识别速度快。
  • 并行处理:支持 createWorker 多线程工作者,可在后台并行识别多张图片。
  • 模块化:提供 tesseract.js-core、语言数据(tessdata)分离,便于自行托管 CDN,避免网络不稳定导致加载失败。
  • 轻量化:最新的 v6.0.0 进一步压缩文件体积、优化内存管理,适合长时间运行的 Web 应用。

Tesseract.js 通过 WebAssembly 将强大的 Tesseract OCR 引擎带到前端,具备跨平台、多语言、低内存、高性能等优势。只需几行代码即可在浏览器或 Node.js 中完成文字识别,配合 createWorker 与本地语言数据即可实现离线、批量、实时的 OCR 需求。

相关导航

暂无评论

暂无评论...