Ⅰ pdf圖片怎麼轉化為word
pdf已經是圖片格式了 要轉word只能如下 一、「選擇文字工具,選好了貼到word里」 如果PDF文件是用文字製做而不是圖片製做的,可以「在Adobe Acrobat 7.0中有選擇文字的工具,可以選好了貼到word里」。 二、批量截圖 截圖的辦法對於不是很清楚的圖片來說,並不可取,因為它要麼會損失信息,要麼會如樓主所說加大工作量。 建議先用Adobe Acrobat中的導出功能,將這個文件導出為圖像。做法:在上面菜單上選文件>導出>提取圖像為>JPEG文件(其他二種也行,JPEG文件比較小),再按提示,選擇一個適當的文件夾,保存圖像 。 這種方法保存下來的一張張圖片,比你一頁頁截圖省力多了,而且保留了原文件的全部信息。不過500頁可不一個小數,會很慢,但至少不用你親自動手干預了。 三、批量識別 如果想進行編輯,就必須進行OCR識別。關鍵在於如何能夠批量進行這個工作。 好一點的OCR軟體都可以一次導入多幅圖片進行識別,然後輸出。不過,好像500頁的確有點多了,我從來也沒有超過50頁的記錄,通常也就是二、三十頁。就算50頁,也比一頁一頁強,是吧? 用過不少OCR軟體,覺得漢王文本王、清華紫光TH比較好用。它們的識別率都非常高,還可以識別表格、繁體字、英文、豎排文字等;輸出方式也很靈活,可以只輸出文字,也可以按原稿排版格式輸出WORD文件;使用起來也都不復雜。 不知你用的是什麼版本的漢王,識別率會那麼低。我有的時候識別質量很次的報紙上的文章,它的識別率也還是可以接受的。 四、提高識別率 如果底圖質量非常差的話,建議你先在圖片處理軟體中將導出的圖片進行放大、去點、銳化等處理,然後再送到OCR中識別。 我估計,你可能還是送入OCR的圖片損失了部分原文的信息,造成識別率下降。因為你既然能放大,放大後截圖的識別率還可以,那就說明原圖的信息足夠OCR識別了。只是在操作過程中損失了部分東西。 所以,我建議你: 1)先將你的PDF文件導出5-10頁圖片出來 2)用漢王等OCR軟體進行批量識別(識別中注意將不規則的部分框除) 3)輸出成word文檔 如果它們能很順利地被識別出來,那後面的事就不用說了。如果不行,那就真的是底圖的問題了,這就需要對導出的圖片進行批量修正處理。