메인 콘텐츠로 건너뛰기
Waters Korea

UNIFY를 통해 인쇄된 PDF에 추출 템플릿을 적용할 때, NuGenesis SDMS에 아카이브된 동일 PDF와 다른 결과가 나타나는 이유는 무엇입니까? - WKB56619

Article number: 56619To English version

환경

  • NuGenesis 8 SDMS

답변

인쇄된 PDF와 보관된 PDF에서 텍스트를 추출하면 같은 결과가 생성되지 않을 수 있습니다. PDF 파일이 보관될 때, 원본 데이터 형식은 데이터베이스에 유지되며, 추출 템플릿 빌더는 PDF 리더 라이브러리를 사용하여 PDF에서 텍스트를 구문 분석(parse text)합니다. 같은 파일을 인쇄할 경우, 먼저 EMF (Enhanced Metafiles) 타입 파일로 변환됩니다. UNIFY 프린터는 EMF 타입 프린터로 등록되기 때문에 초기 변환은 인쇄 스풀러(spooler)에 의해 수행됩니다. UNIFY 프린터의 프린터 속성을 열고 고급 탭을 선택한 다음 인쇄 프로세서를 클릭하면 이 메시지가 표시됩니다. UNIFY의 기본값은 NG80print이며 데이터 타입은 "NT EMF 1.003"입니다. 따라서 UNIFY에 전달된 스풀 파일(spool file)에는 EMF 파일이 포함되며, EMF에 실제로 텍스트 레코드가 포함된 경우에만 UNIFY가 EMF에서 텍스트를 가져올 수 있습니다. 대부분의 경우 EMF는 텍스트를 포함하지 않습니다. 여기에 이미지만 있으며 UNIFY는 이미지에 대해 OCR을 수행할 수 없습니다.

따라서 UNIFY로 인쇄된 PDF에서 Extraction Templates를 실행하는 것이 중요한 경우, UNIFY가 관련되기 전에 결과에 영향을 미칠 수 있는 유일한 방법은 스풀 파일을 생성하여 EMF 파일에 텍스트 레코드가 포함되도록 하는 것입니다. 다른 PDF 프로그램을 사용하여 PDF를 UNIFY로 인쇄하여 적합한 결과를 생성하는지 확인합니다.

추가 정보

 

id56619, SDMS, SDMS8, SDMS8NU, SUPISDMS, SUPNG

id56619, SDMS, SDMS8, SDMS8NU, SUPISDMS, SUPNG