我對它不持態度。做機器學習的似乎都在盼著好解析的PDF。但是代價是什么呢?如果文檔的制作者并不想要讓你拿到更接近原始文檔的內容,那又怎么辦呢?
LaTeX 的話,我覺得與其做 Tagged PDF,不如直接把全套源代碼作為 PDF 附件嵌進去。我記得排樂譜的 LilyPond 好像就帶這個功能。
感謝您的支持,請隨意打賞。您的贊賞將鼓勵我繼續創作!