Thanks to visit codestin.com
Credit goes to github.com

Skip to content

关于扫描版PDF & 图片的说明 #166

@awwaawwa

Description

@awwaawwa

before ...

  • This issue is not about question or bug.
  • I have searched the existing issues

Add a description

关于扫描版 PDF 支持

目前 BabelDOC 技术路线 暂无计划支持扫描版 PDF


关于图片翻译

  • 矢量图:最新版本的 BabelDOC 已经可以识别并翻译图中的文字。
  • 位图:方案仍在探索中,大概率会依赖闭源服务,优先级较低。

为什么不接入其他 OCR 服务?

目前没有计划直接接入第三方 OCR 来处理位图或扫描版 PDF,原因包括:

  1. 不同 OCR 服务的输出格式差异较大,需要大量适配工作。
  2. 想要提升扫描版翻译效果,必须对 OCR 服务进行调优。但调优成本高、周期长,且调优成果无法开源。
  3. 调优后的代码通常会与特定 OCR 服务强绑定,难以保持对多家服务的兼容性。

我目前的精力非常有限,需要优先保障线上服务,因此只能在条件允许的情况下兼顾开源用户体验,还请大家多多理解。

Metadata

Metadata

Assignees

No one assigned

    Labels

    wontfixThis will not be worked on

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions