如何使用CAJViewer7識別PDF

2021-03-04 07:31:27 字數 1100 閱讀 2956

如何使用cajviewer7.1中國知網文件閱讀器將pdf文件內容識別出來

write by k.l

cajviewer7.1中國知網文件閱讀器可以開啟非特殊格式加密列印轉換的pdf 文件,而運用其中較為卓越的ocr光學識別軟體技術,不僅可以將常見的pdf 文件內容識別轉換出來,而且可以將完全採用掃瞄影象格式轉換出來的pdf文件內容可靠識別出來。這可是作者經過多次試驗得出的寶貴經驗。

這裡的ocr識別技術個人感覺比adobe acrobat 官方pdf閱讀器中提供的ocr識別功能要強些,尤其是在識別影象掃瞄格式轉換而成的pdf中文文件時。 在此只對ocr識別方法簡單作下介紹,三步曲完成。

方法如下:

安裝完cajviewer7.1後,直接執行即可

步驟1:使用滑鼠操作依次選取「選單欄」→「檔案」→「開啟」,選擇要操作的pdf檔案

或使用快捷工具圖示(快捷組合鍵ctrl+o)

1接下來做的工作即:將要識別的文件內容一頁一頁的點選出來,複製貼上到word文件裡(這裡需要耐心點,可能費點時間;比較汗顏的是,目前作者還未找到cajviewer批量識別整個pdf文件的方法;這點可能adobe acrobat 官方pdf 閱讀器提供的ocr功能相對更強大點,可以將整個文件一次識別完,當然前提是此文件不是影象掃瞄格式轉換出來的pdf。2個軟體有強有弱,關鍵是適用即可。

識別影象掃瞄格式轉換出來的pdf仍然建議使用cajviewer,總比沒有的好。)

步驟2:使用滑鼠操作使用依次選取「選單欄」→「工具」→「文字識別」

(tips:注意要將整個工具條展開,剛開始「工具」選單項不會馬上顯示出「文字識別」工具,需要用滑鼠點開下拉雙箭頭,才能看到此項,如後頁page3圖如示) ↓

更快的方法即使用快捷工具圖示,左起第5個圖示(帶個閱讀鏡及字的圖示)

步驟3:使用滑鼠拖選待識別文件的區域,確定好待識別區域後,鬆開滑鼠時會自動彈出識

別區域對應的內容,剩下的工作就是將「文字識別結果」視窗中的內容複製到word裡,你

懂的。(好像目前我知道的cajviewer可以支援將開啟的當前頁面整頁內容識別出來,但對於

**樣式不能完整的保留下來。如要完全將文件的**樣式識別出,只能尋找更強大的第3

方工具,但軟體更強加龐大,有的要付費才能使用。)

如何使用PCS7Info工具捕獲PCS 7的系統資料

描述 可以使用pcs7info工具來捕獲來自pcs 7系統的診斷資料,專供西門子能源與自動化部門進行故障查詢和更正。除非西門子的技術支援部門進行了特別說明,否則只需執行以下步驟中的第14個步驟,便可捕獲來自pcs 7系統的診斷資料。1.如果目錄c files不存在,則請先建立該目錄。2.捕獲所有顯示...

如何刪除Windows7最近使用的記錄

這個教程將會教會你如何刪除windows 7最近使用的文件記錄。這其實很簡單,通過一些系統優化軟體就可以輕鬆完成。但是現在向大家介紹兩種無需安裝任何工具軟體即可清除windows 7最近文件使用記錄的方法 方法 1 在開始選單中列出最近的專案都儲存在 appdata microsoft window...

Windows7使用技巧

徽標鍵 l 鎖定計算機或切換使用者。徽標鍵 r 開啟 執行 對話方塊。徽標鍵 t 迴圈切換工作列上的程式。徽標鍵 數字 啟動鎖定到工作列中的由該數字所表示位置處的程式。如果該程式已在執行,則切換到該程式。windows 徽標鍵 數字 啟動鎖定到工作列中的由該數字所表示位置處的程式的新例項。windo...