擷取圖文上的文字,一般會利用X青或其他辨識軟體來處理,
可是這些軟體有時不好取得,另外,
網路上還有流傳一種簡易的辨識軟體,我下載過,
程式小作法也很簡便,但缺點是,必須要做一些電腦設定還有系統限制。
後來終於在網路上找到一個方法,可以輕鬆辨識、複製圖文文字,
且不須下載任何軟體,只需兩步驟即可擷取文字。

這方法會用到兩個內建軟體,一是小畫家,二是window office中的onenote。

先簡單概述方法:
1.先將你要辨識的資料,變成圖檔(這步驟用到小畫家,本來即是圖檔當然就不用換了)。我常用的是擷取PDF上的文字,所以我會先用prtscn,先把畫面拍下來,就可以在小畫家存成圖檔。
2.在onenote 頁面上開啟一節,會有一個方框,點選"插入"→"圖片"後,在圖片上按右鍵選"複製圖片的文字",文字即複製完成。

當然,因為這也是辨識軟體,所以辨識度優劣會依照你給的圖檔是否清晰、背景單純而有差異,通常文字清楚、背景純白,辨識度最佳。建議,辨識完後,一定要核對原文。

以下為詳細步驟圖說:(以PDF檔為例)
1.開啟PDF,按prtscn,把畫面拍下來,開啟小畫家複製貼上畫面:
1

2.擷取你要的段落文字,另存成jpg檔:
2

3.開啟onenote,在上方頁籤處,按左鍵一下開啟"新的節1",下方空白編輯處就會出現一個方框,游標移到方框內,點"插入"→"圖片":
3

4.點圖片,按右鍵選"複製圖片上的文字":
4

5.開啟你的文書軟體,按貼上即可:
5

以這段文字為例,全文185字,辨識結果有5個錯字,錯誤率大概是2%,至少有九成辨識成功,
效能還算不錯,且不需下載任何軟體,僅使用了電腦內建的文書軟體跟小畫家,個人覺得很方便,快來試試看吧。

順便一提,此方法乃據"火星人的天空之城"的介紹,其功不可掩,在此致謝。http://isvincent.blogspot.com/2009/12/ms-office-onenote.html

arrow
arrow
    全站熱搜

    sophine 發表在 痞客邦 留言(1) 人氣()