2014. 5. 13. 22:30

PDF 문서에서 하이라이트 표시 한 텍스트 추출하기 (Export Highlighted Text in a PDF)

아는 분이 문의하여, 필요하겠다 싶어서 찾아보니,

1. 돈 내고 Adobe Acrobat Pro를 구매한 후 관련 Action Script를 사용하면 된다.

2. 또는 Sumnotes라는 웹서비스를 사용하면 된다 

정도가 다수 나오더군요


무료로 사용할 수 있는 도구를 찾아서 공유합니다.

ZotFile이란 오픈소스고, Zotero라는 인용관리 오픈소스 도구의 애드온 이네요. 자세한 사항은 아래 제작사 페이지의 내용을 참고하면 됩니다.

http://zotfile.com/#extract-pdf-annotations



설치(Install)


정리를 해보면 아래 순서인데, 자세한 내용은 위의 페이지를 읽어보면 됩니다.


Step 1. Install Zotero Standalone Version

https://www.zotero.org/download/


Step 2. Download ZotFile Add-on and Install

https://addons.mozilla.org/en-US/firefox/addon/zotfile/


Step 3. Configuration

According to the guide page(http://zotfile.com/#extract-pdf-annotations)


Step 4. Import Highlighted PDF file into Zotero Library then 'Extract Annotations'



설치하여 테스트를 해보니 되는 경우가 있고 안되는 경우가 있네요. PDF문서의 보안설정이나 버전 등 환경적인 요소에 따른 듯 합니다. 당연히 이미지 형태로 되어 있어 Copy가 불가능한 경우엔 안되겠지요. IEEE에서 가져온 논문의 경우 잘 되더군요

글이 도움이 되셨다면 위의 추천 손가락 한방 꾹! 눌러주세요~



Trackback 0 Comment 0