안녕하세요! 오늘은 본격적으로 스캔 작업 후 PDF 파일을 만드는 과정을 보여드릴 건데요.. 

사실 이제 포스팅을 쓰기 민망할 정도로 제가 하는 일이 없어요. 기계와 프로그램이 다 알아서 해주거든요. 


이전에, 가장 원시적이었던 단계부터 잠깐 요약해보면ㅎㅎ

 




1차 시기: HP 일반 평판 복합기 (2008년~2013년 정도)
일단 300쪽 단행복 한 권 스캔하는데 이틀 걸림. 한번에 1쪽씩. 이후 jpg로 하나하나 뜬 스캔본을 후보정. 후보정도 포토샵 액션 돌림;; 후보정 후 OCR 따로 돌림. 완성본 하나 나오는데 일주일은 걸린 듯? 300dpi로 스캔하였으나 오래걸림. 책은 훼손하지 않음. 이 시기에는 스캔한 것이 몇 권 안 됨.. 너무 느려서ㅠ

2차 시기: 삼성 복사기, Scan Tailor 이용 (2014년~2017년)
300쪽 단행본 기준, 책을 해체하여 재단할 경우 한 권에 30~40분? 해체하지 않고 곰발바닥 소발바닥 평판 스캔을 할 경우 한 권에 2시간? 잘 기억 안남. 펼쳐놓고 한번에 2쪽씩. 스캔 시간은 단축되었으나 여전히 후보정과 OCR 따로 필요. 기기에 딸려온 소프트웨어의 OCR 성능이 만족스럽지 않았기 때문임. 후보정은 Scan Tailor 이용. 그나마 가장 만족스러웠으나 시간 오래 걸림. 결국 책 하나당 마음에 드는 스캔완성본 나오는데 여전히 2일~3일 정도 걸림. 

3차 시기: 2018년~현재 
300쪽 단행본 기준, 책을 모두 해체하므로 스캔은 10분이면 끝. 해체는 권당 10분 정도? 한번에 2쪽씩 동시에 양면스캔. 후보정 필요 없고 기기에 딸려온 소프트웨어로 OCR된 PDF 파일을 표지와 결합하여 파일명만 지정해주면 끝남. (원래 표지도 결합 안하거나 자동 급지로 해도 되는데 내가 괜히 따로 하는 것임) 스프링 제본/하드커버 제본으로 책 다시 복원. 하드커버 제본만 풀 마르는 시간 때문에 하루 정도 소요. 소프트커버의 경우 스캔 파일은 총 20분이면 완료. 링제본 복원 따로 20분 소요. 

*그 전에 OCR 소프트웨어 사느라 돈ㅈㄹ 한 거 좀 아깝지만.. 그동안 잘 썼으므로 뭐 많이 아깝진 않음. 그리고 일본어는 여전히 ABBYY FineReader 따로 돌려야 함. 


 

많이 발전했어요ㅋㅋ 그럼 이제 현 단계에서 스캔하는 모습 보여드릴게요!


1. HP 지능형 문서 스캔 소프트웨어 3.8 


스캐너 사면서 딸려온 프로그램이고, 디폴트 값만 몇 가지 설정해서 쓰고 있어요. 여기 OCR 엔진이 좋은거 들어간 것 같아요.. ABBYY인 것 같긴 한데 확실하진 않네요. 보통 양면, 300dpi, 회색조, pdf로 자동저장, 해당 언어 OCR 정도로 세팅해서 쓰고 있어요. 



2. 스캔 영상

스캐너가 스캔하는 속도와, 컴퓨터에 들어오는 속도를 볼 수 있어요. 빠릅니다. 이제 더 낮은 사양으로는.... 못 넘어가.........ㅠㅠ 



3. PDF 파일 생성 

이미 스캔할 때 자동으로 PDF 파일이 생성되지만, 저는 표지는 따로 스캔해요. 그 이유는.. 회색조에서 컬러로 바꾸기 귀찮아서 입니다. 아 그리고 책 날개 자르지 않고 합쳐서 스캔하려고요. 별 이유 없어요ㅋㅋ 자동급지로 스캐너 돌아가는 동안 놀고 있는 평판 스캐너에서 표지만 스캔하면 되거든요. 내용 스캔한 파일과 표지 스캔한 파일을 합치고, 페이지 한 번 쭉 검토해주고 (그런데 이중 급지 감지하는 센서 덕분에 페이지 누락 전혀 없어요), 파일명 설정해서 저장하면 끝입니다! 아 요즘 PDF 프로그램은, 윈도우에서는 PDF-Xchange Editor 이거 써요. 유료버전이요. 유료버전으로 써야 페이지 크롭 기능이랑 페이지 사이즈 조절이 되어서 유료로 씁니당.. 



이 다음 포스트에서는 소프트커버 복원부터 보여드릴게요. 하드커버 복원이 더 재미있는 과정이긴 한데, 풀 마르는거 기다리느라 사진을 아직 다 못 찍었거든요.  


+ Recent posts