字體庫基本就是postscript和truetypefont兩種協議,能渲染就說明pdf里的文字glyph是保留的,只要解析一下對應的字體庫,把glyph和unicode對應起來就行,可以避免ocr。
感謝您的支持,請隨意打賞。您的贊賞將鼓勵我繼續創作!