PDF / A - PDF/A

PDF / 보관
파일 이름 확장자
.pdf
인터넷 미디어 유형
신청 / pdf
유형 코드 'PDF'(단일 공백 ​​포함)
UTI (Uniform Type Identifier) com.adobe.pdf
매직 넘버 %PDF
개발사 ISO
초판 2005 년 10 월 1 일 ; 15 년 전( 2005-10-01 )
에서 확장 PDF
표준 ISO 19005

PDF / A전자 문서보관 및 장기 보존특화된 PDF ( Portable Document Format )의 ISO 표준 버전입니다 . PDF / A는 글꼴 연결 ( 글꼴 포함 과 반대 ) 및 암호화 와 같이 장기 보관에 적합하지 않은 기능을 금지한다는 점에서 PDF와 다릅니다 . [1] PDF / A 파일 뷰어에 대한 ISO 요구 사항 에는 색상 관리 지침, 포함 된 글꼴 지원 및 포함 된 주석 을 읽기위한 사용자 인터페이스가 포함 됩니다 .

표준

ISO 19005 – 문서 관리 – 장기 보존을위한 전자 문서 파일 형식 (PDF / A)
Abbr. 부제 게시 됨 표준 기반 Ref.
PDF / A-1 1 부 : PDF 1.4 사용 2005-09-28 ISO 19005-1 PDF 1.4 ( Adobe Systems , PDF 참조 , 제 3 판) [2]
PDF / A-2 2 부 : ISO 32000-1 사용 2011-06-20 ISO 19005-2 PDF 1.7 (ISO 32000-1 : 2008) [삼]
PDF / A-3 파트 3 : 포함 된 파일을 지원하는 ISO 32000-1 사용 2012-10-15 ISO 19005-3 PDF 1.7 (ISO 32000-1 : 2008) [4]

배경

PDF는 시스템간에 이식 가능한 "인쇄 된"형식으로 문서를 인코딩하기위한 표준입니다. 그러나 보관 보존을위한 PDF 파일의 적합성은 PDF를 만들 때 선택한 옵션에 따라 다릅니다. 특히 문서를 렌더링하는 데 필요한 글꼴을 포함할지 여부입니다. 암호화 사용 여부; 원본 문서의 추가 정보를 인쇄하는 데 필요한 것 이상으로 보존할지 여부.

PDF / A는 원래 아카이빙을위한 PDF (Portable Document Format) 사용을 정의하는 국제 표준을 개발하기 위해 인쇄, 출판 및 변환 기술 공급 업체 연합 ( NPES )과 정보 및 이미지 관리 협회 간의 새로운 공동 활동 이었습니다. 서류. [5] 목표는 장기간에 걸쳐 내용을 보존하고 이러한 문서를 일관되고 예측 가능한 결과로 검색 및 렌더링 할 수 있도록 문서를 전자적으로 보관해야하는 증가하는 요구를 해결하는 것이 었습니다. 미래에. [6]이러한 요구는 법률 시스템, 도서관, 신문 및 규제 산업을 포함하여 전 세계적으로 다양한 정부, 산업 및 학술 분야에 존재합니다. [7]

기술

PDF / A 표준은 보관 전략이나 보관 시스템의 목표를 정의하지 않습니다. 전자 문서에 대한 "프로필"을 식별하여 향후 다양한 소프트웨어를 사용하여 문서가 정확히 동일한 방식으로 복제 될 수 있도록합니다. 이러한 재현성의 핵심 요소는 PDF / A 문서가 100 % 독립적이어야한다는 것입니다. 동일한 방식으로 문서를 표시하는 데 필요한 모든 정보가 파일에 포함됩니다. 여기에는 모든 콘텐츠 (텍스트, 래스터 이미지 및 벡터 그래픽), 글꼴 및 색상 정보가 포함되지만 이에 국한되지는 않습니다. PDF / A 문서는 외부 소스 (예 : 글꼴 프로그램 및 데이터 스트림)의 정보에 의존하는 것이 허용되지 않지만 외부 문서로 연결되는 주석 (예 : 하이퍼 텍스트 링크)을 포함 할 수 있습니다. [8]

PDF / A 적합성의 기타 핵심 요소는 다음과 같습니다. [9] [10] [11]

  • 오디오 및 비디오 콘텐츠는 금지되어 있습니다.
  • JavaScript 및 실행 파일 실행은 금지되어 있습니다.
  • 모든 글꼴은 포함되어야하며 무제한 범용 렌더링을 위해 합법적으로 포함되어야합니다. 이는 Times 또는 Helvetica 와 같은 소위 PostScript 표준 글꼴 에도 적용됩니다 .
  • 장치 독립적 인 방식으로 지정된 색 공간.
  • 암호화는 금지되어 있습니다.
  • 표준 기반 메타 데이터를 사용해야합니다.
  • 외부 콘텐츠 참조는 금지됩니다.
  • LZW 는 지적 재산 제약으로 인해 금지됩니다. JPEG 2000 이미지 압축 모델은 PDF 1.5에서 처음 도입되었으므로 PDF / A-1 (PDF 1.4 기반)에서 허용되지 않습니다. JPEG 2000 압축은 PDF / A-2 및 PDF / A-3에서 허용됩니다.
  • 투명 개체 및 레이어 (선택적 콘텐츠 그룹)는 PDF / A-1에서는 금지되어 있지만 PDF / A-2에서는 허용됩니다.
  • PAdES (PDF 고급 전자 서명 ) 표준 에 따른 디지털 서명 조항 은 PDF / A-2에서 지원됩니다.
  • PDF / A-1에서는 포함 된 파일이 금지되어 있지만 PDF / A-2에서는 PDF / A 파일을 포함 할 수 있으므로 PDF / A 문서 세트를 단일 파일에 보관할 수 있습니다. PDF / A-3을 사용하면 XML, CAD 및 기타 파일 형식을 PDF / A 문서에 포함 할 수 있습니다.
  • XML 기반 XFA ( XML Forms Architecture ) 양식의 사용은 PDF / A에서 금지되어 있습니다. (XFA 양식 데이터는 XFA 키에서 문서 카탈로그 사전의 이름 사전의 XFAResources 키 값인 이름 트리로 이동하여 PDF / A-2 파일에 보존 될 수 있습니다.)
  • 대화 형 PDF 양식 필드에는 필드의 데이터와 연결된 모양 사전이 있어야합니다. 필드를 렌더링 할 때 외관 사전을 사용해야합니다.

적합성 수준 및 버전

PDF / A-1

표준의 Part 1은 2005 년 9 월 28 일에 처음 발표되었으며 [2] PDF 파일에 대한 두 가지 수준의 적합성을 지정합니다. [12]

  • PDF / A-1b – 레벨 B (기본) 준수
  • PDF / A-1a – 레벨 A (액세스 가능) 준수

수준 B 준수는 문서의 시각적 모양을 안정적으로 재현하는 데 필요한 표준 만 따르도록 요구하는 반면, 수준 A 준수에는 문서의 접근성 을 향상시키기위한 기능 외에도 모든 수준 B 요구 사항이 포함됩니다 .

추가 레벨 A 요구 사항 :

  • 언어 사양
  • 계층 적 문서 구조
  • 태그가 지정된 텍스트 범위 및 이미지 및 기호에 대한 설명 텍스트
  • 유니 코드에 대한 문자 매핑

레벨 A 적합성은 화면 판독기 와 같은 보조 소프트웨어 가 파일의 내용을보다 정확하게 추출하고 해석 할 수 있도록하여 신체 장애가있는 사용자를위한 적합성 파일의 접근성을 높이기위한 것 입니다. [12] 이후의 표준 인 PDF / UA 는 PDF / A의 단점 중 일부로 간주되는 것을 제거하기 위해 개발되었으며, 많은 일반 지침을보다 상세한 기술 사양으로 대체했습니다. [13]

PDF / A-2

2011 년 6 월 20 일에 발행 된 표준 2 부 [3] 에서는 PDF 참조 버전 1.5, 1.6 및 1.7에 추가 된 일부 새로운 기능을 다룹니다. PDF / A-1 파일은 반드시 PDF / A-2를 준수하지 않으며 PDF / A-2 준수 파일은 반드시 PDF / A-1을 준수하지 않습니다.

PDF / A 표준의 Part 2는 PDF 1.4가 아닌 PDF 1.7 (ISO 32000-1)을 기반으로하며 다음과 같은 여러 새로운 기능을 제공합니다.

  • JPEG 2000 이미지 압축
  • 투명 효과 및 레이어 지원
  • 의 내장 오픈 타입 글꼴
  • PDF 고급 전자 서명 – PAdES 표준에 따른 디지털 서명 조항
  • PDF / A 파일을 포함하는 옵션으로 단일 파일로 문서 세트를 쉽게 보관할 수 있습니다. [10]

2 부에서는 세 가지 적합성 수준을 정의합니다. PDF / A-2a 및 PDF / A-2b는 PDF / A-1의 적합성 레벨 a 및 b에 해당합니다. 새로운 적합성 레벨 인 PDF / A-2u는 문서의 모든 텍스트에 유니 코드 매핑이 있어야한다는 추가 요구 사항과 함께 레벨 B 적합성 (PDF / A-2b)을 나타냅니다. [12] [14]

PDF / A-3

2012 년 10 월 15 일에 게시 된 표준의 Part 3, [4] 는 한 가지 측면에서 PDF / A-2와 다릅니다. 임의의 파일 형식 (예 : XML, CSV, CAD, 워드 프로세싱 문서, 스프레드 시트)을 포함 할 수 있습니다. 문서 및 기타)를 PDF / A 준수 문서로 변환합니다. [15]

PDF / A-4

PDF 2.0을 기반으로 한 표준의 파트 4는 2020 년 중반 경에 게시 될 예정입니다. [16]

PDF / A 파일을 만드는 방법

아카이브는 때때로 사용자에게 PDF / A 파일 제출을 요청합니다. 따라서 사용자에게 파일을 PDF / A로 변환하는 방법에 대한 정보를 제공합니다. 링크, 방정식, 벡터 그래프 및 특수 문자를 보존 할뿐만 아니라 계산 시간이 다른 표준 소프트웨어를 사용하는 몇 가지 방법이 있습니다. [17]

문서를 PDF / A로 변환 할 때 시각적 내용의 오류가 흔하므로 육안 검사가 필요합니다. 테스트 샘플에서 생성 된 PDF / A-1b 문서의 11 %에 시각적 인공물이 포함되어 있습니다. 이러한 재현성 오류에는 벡터 그래픽 문제 (투명 개체), 링크 손실, 기타 문서 콘텐츠 손실 (읽을 수없는 문자, 텍스트 누락, 문서 부분 누락), 업데이트 된 필드 (변환 시간 또는 폴더 반영) 및 철자 오류가 포함됩니다. [18] 아카이브 따라서 일반적으로 PDF / A 자체로 변환되지 않습니다. 대신 일부 아카이브는 사용자에게 PDF / A 문서를 제공하도록 요청합니다. 일반적인 컴퓨터 설정은 장단점이 다른 PDF / A로 문서를 변환하는 몇 가지 방법을 제공합니다. [19]

간단한 PDF (버전 1.4까지)를 PDF / A-2로 변환하는 것은 일반적으로 글리프 문제를 제외하고 예상대로 작동합니다 . PDF Association에 따르면 "PDF 생성 전 및 / 또는 생성 중에 문제가 발생할 수 있습니다. PDF / A 파일은 공식적으로 정확할 수 있지만 여전히 잘못된 글리프가 있습니다.주의 깊은 시각적 검사 만이 문제를 발견 할 수 있습니다. 생성 문제도 영향을 미치기 때문입니다. 유니 코드 매핑, 추출 된 텍스트에 대한 시각적 검사를 수행 할 때 문제가 주목을받습니다. PDF / A에서는 텍스트 / 글꼴 사용이 정확하지 않을 수 있도록 고유하게 지정됩니다. 뷰어 또는 프린터가 완전한 지원을 제공하지 않는 경우 인코딩 시스템의 경우 PDF / A와 관련된 문제가 발생할 수 있습니다. " [20] 즉, 문서가 표준을 완전히 준수하려면 내부적으로는 정확하지만 문서를 보거나 인쇄하는 데 사용되는 시스템은 원하지 않는 결과를 생성 할 수 있습니다.

광학 문자 인식 (OCR)을 PDF / A-2 또는 PDF / A-3으로 변환하여 생성 된 문서 notdefglyph플래그를 지원하지 않습니다 . 따라서 이러한 유형의 변환으로 인해 콘텐츠가 렌더링되지 않을 수 있습니다.

PDF / A 표준 문서는 SoftMaker Office 2021 [21] [ circular reference ] , MS Word 2010 이상, Adobe Acrobat Distiller, PDF Creator, OpenOffice 또는 LibreOffice ( 릴리스 3.0 이후), LaTeX (pdfx 또는 pdfTeX 애드온 포함)로 생성 할 수 있습니다. , 또는 가상 PDF 프린터 (Adobe Acrobat Pro, PDF24, FreePDF + Ghostscript)를 사용합니다. [22]

신분증

PDF / A 문서는 "http://www.aiim.org/pdfa/ns/id/"네임 스페이스에있는 PDF / A 특정 메타 데이터를 통해 식별 할 수 있습니다. 이 메타 데이터는 적합성 주장을 나타냅니다. 그 자체로는 적합성을 보장하지 않습니다.

  • PDF 문서는 PDF / A 메타 데이터가없는 경우를 제외하고는 PDF / A 규격 일 수 있습니다. 예를 들어 PDF / A 표준이 정의되기 전에 생성 된 문서에서 장기 보존 문제가있는 기능을 작성자가 알고있는 경우 이러한 상황이 발생할 수 있습니다.
  • PDF 문서는 PDF / A로 식별 될 수 있지만 PDF / A에서 허용되지 않는 PDF 기능을 잘못 포함 할 수 있습니다. 따라서 PDF / A 준수라고 주장하는 문서는 PDF / A 준수 여부를 테스트해야합니다. [23]

확인

PDF / A 문서의 유효성 검사는 생성 된 파일이 실제로 PDF / A 파일인지 여부를 밝히기 위해 시도됩니다. 안타깝게도 PDF / A 표준의 해석이 항상 명확하지는 않기 때문에 PDF / A 검증 인이 동의하지 않는 경우가 많습니다. [18]

Isartor 테스트 스위트

원래 PDF / A Competence Center의 업계 협력으로 2007 년과 2008 년에 Isartor 테스트 스위트가 개발되었습니다. 테스트 스위트는 PDF / A-1b 적합성에 대한 각 요구 사항을 체계적으로 실패하도록 의도적으로 구성된 204 개의 PDF 파일로 구성되어 있습니다. 개발자는 표준의 가장 기본적인 수준의 적합성에 대해 자신의 소프트웨어 기능을 테스트 할 수 있습니다. [24] [25] 2009 년 중반으로 테스트 스위트는 이미 PDF / A 검증 소프트웨어의 일반적인 품질에 상당한 차이를 만들었다. [26]

veraPDF

Open Preservation Foundation [27] 과 PDF Association이 이끄는 veraPDF 컨소시엄 은 PDF / A 형식에 대한 오픈 소스 유효성 검사기를 개발하려는 EU위원회의 PREFORMA 도전 [28] 에 대응하여 만들어졌습니다 . PDF Association은 업계에서 지원하는 PDF / A 유효성 검사기 개발 계획을 명확히하기 위해 2014 년 11 월 PDF 유효성 검사 기술 작업 그룹을 시작했습니다. [29] [ 검증 실패 ]

이후 veraPDF 컨소시엄은 2015 년 4 월 PREFORMA 계약의 2 단계를 획득했습니다. [30] 2016 년 내내 개발이 계속되었으며 [31] 2 단계가 2016 년 12 월에 예정대로 완료되었습니다. 3 단계 테스트 및 승인 기간은 2017 년 7 월에 종료되었습니다. veraPDF는 이제 PDF / A의 모든 부분 (1, 2 및 3)과 적합성 수준 (a, b, u)을 다룹니다.

veraPDF는 PDFBox 기반 또는 "Greenfields"PDF 파서를 사용하여 Windows, macOS 또는 Linux에 설치할 수 있습니다. [32]

PDF / A 뷰어

PDF / A 사양에는 또한 준수해야하는 PDF / A 뷰어에 대한 몇 가지 요구 사항이 나와 있습니다.

  • PDF 및 PDF / A 표준에서 설명하지 않는 데이터는 무시하십시오.
  • 파일에서 제공하는 선형화 정보를 무시하십시오.
  • only use the embedded fonts (rather than any locally available, substituted or simulated fonts);
  • only display using the embedded colour profile;
  • ensure that form fields do not change the rendered presentation and are rendered without regard to the form data;
  • ensure that annotations are rendered consistently.

When encountering a file that claims conformance with PDF/A, some PDF viewers will default to a special "PDF/A viewing mode" to fulfill conforming reader requirements. To take one example, Adobe Acrobat and Adobe Reader 9 include an alert to advise the user that PDF/A viewing mode has been activated. Some PDF viewers allow users to disable the PDF/A viewing mode or to remove the PDF/A information from a file.[33][34]

Reception

A PDF/A document must embed all fonts in use; accordingly, a PDF/A file will often be larger than an equivalent PDF file that does not include embedded fonts.

The use of transparency is forbidden in PDF/A-1. The majority of PDF generation tools that allow for PDF/A document compliance, such as the PDF export in OpenOffice.org or PDF export tool in Microsoft Office 2007 suites, will also make any transparent images in a given document non-transparent. That restriction was removed in PDF/A-2.[9]

Some archivists have voiced concerns that PDF/A-3, which allows arbitrary files to be embedded in PDF/A documents, could result in circumvention of memory institution procedures and restrictions on archived formats.[35]

PDF Association은 출판물 "PDF / A in a Nutshell 2.0"에서 PDF / A에 대한 다양한 오해 [36]다루었습니다 . [37]

또한보십시오

참고 문헌

  1. Oettler, Alexandra (2013 년 2 월 7 일). "PDF / A 사실 – 표준 소개" . PDF 연결 . 만회 2014년 7월 11일을 .
  2. ^ a b "ISO 19005-1 : 2005" . ISO . 2016 년 7 월 27 일에 확인 함 .
  3. ^ a b "ISO 19005-2 : 2011" . ISO . 2016 년 7 월 27 일에 확인 함 .
  4. ^ a b "ISO 19005-3 : 2012" . ISO . 2016 년 7 월 27 일에 확인 함 .
  5. ^ "PDF / A의 짧은 역사" . PDF 연결 . 2013 년 2 월 7 일 . 만회 2014년 7월 11일을 .
  6. Oettler, Alexandra (2013 년 2 월 7 일). "PDF / A를 사용하는 가장 중요한 이유" . PDF 연결 . 만회 2014년 7월 11일을 .
  7. Oettler, Alexandra (2013 년 2 월 7 일). "PDF / A의 일반적인 용도" . PDF 연결 . 만회 2014년 7월 11일을 .
  8. Oettler, Alexandra (2013 년 2 월 7 일). "PDF / A 표준의 기술적 측면" . PDF 연결 . 2015 년 7 월 2 일에 원본 문서에서 보존 된 문서 . 2017 년 87 일에 확인 함 .CS1 유지 보수 : BOT : 원래 URL 상태를 알 수 없음 ( 링크 )
  9. ^ a b "PDF / A – 기술 측면 살펴보기" . 2011 년 7 월 26 일에 원본 문서 에서 보존 된 문서 . 2011 년 7 월 6 일에 확인 함 .
  10. ^ a b "ISO에서 발행 한 PDF / A-2 표준! 새로운 표준에는 뛰어난 기술 향상이 포함됩니다" . 2011-07-01 . 2011 년 7 월 6 일에 확인 함 .
  11. ^ 자주 묻는 질문 (FAQ) – ISO 19005-1 : 2005 – PDF / A-1, 날짜 : 2006 년 7 월 10 일 (PDF) , 2006-07-10 , 2012 년 1 월 18 일에 원본 (PDF) 에서 보관 됨 , 2011 년 7 월 6 일에 검색 됨
  12. ^ a b c "개선 된 PDF / A-1b" . PDF 연결 . 2011-08-05. 2012 년 9 월 15 일 에 원본 문서 에서 보존 된 문서 . 만회 2012년 9월 26일을 .
  13. Oettler, Alexandra (2013 년 2 월 7 일). "PDF / A 및 기타 PDF 표준" . PDF 연결 . 2014 년 7 월 14 일 에 원본 문서 에서 보존 된 문서 . 만회 2014년 7월 12일을 .
  14. PDF / A-2, PDF for Long-term Preservation, Use of ISO 32000-1 (PDF 1.7) , Library of Congress , retrieved 2012-09-26
  15. ^ "PDF 협회, 표준 1 ~ 3을 포함하는 PDF / A에 대한 첫 번째 세미나 개최" . PDF 연결 . 2012 년 3 월 29 일. 2012 년 9 월 15 일 에 원본 문서 에서 보존 된 문서.
  16. ^ PDF / A-4 및 기타 새로운 PDF 표준 (PDF 협회)
  17. ^ "PDF / A 파일은 어떻게 만듭니 까?" . Innovation @ ETH-Bibliothek . 2017-02-15 . 2020429 일에 확인 함 .
  18. ^ a b 수리, Roland Erwin; 모하메드 엘 사드 (2018-06-06). "마이그레이션 중 손실 : PDF / A로 일괄 변환을위한 문서 품질". 도서관 하이테크 (인쇄 전) : LHT–10–2017-0220. 도이 : 10.1108 / LHT-10-2017-0220 . hdl : 20.500.11850 / 269199 . ISSN 0737-8831 .
  19. Suri, Roland (2017 년 2 월 15 일). "PDF / A 파일을 어떻게 만듭니 까?" 도이 : 10.16911 / ethz-IB-2722-드 . 저널 인용 |journal=( help )
  20. PDF / A – A Look at the Technical Side , 검색된 2015-08-14
  21. ^ SoftMaker 사무실
  22. ^ TU 베를린에서 온라인 게시를위한 PDF / A 준수 파일 생성 지침
  23. Oettler, Alexandra (2013 년 2 월 7 일). "검증 : 정말 PDF / A입니까?" . PDF 연결 . 만회 2014년 7월 11일을 .
  24. ^ Isartor 테스트 스위트 (PDF) . PDF / A 역량 센터. 2008 년 8 월 12 일 . 만회 2016년 9월 23일을 .
  25. ^ "Isartor 테스트 스위트" . PDF 연결 . 2011-08-03 . 만회 2016년 9월 23일을 .
  26. ^ "바바리아보고" . PDFlib . 2009. 2015 년 4 월 21 일에 원본 문서에서 보존 된 문서 . 만회 2015년 4월 30일을 .CS1 유지 보수 : 적합하지 않은 URL ( 링크 )
  27. ^ "오픈 보존 재단 veraPDF 프로젝트" . 보존 재단을 엽니 다 . 만회 2015년 4월 30일을 .
  28. ^ PREFORMA, EU위원회 자금 지원 프로젝트
  29. ^ "PDF 협회를 포함한 컨소시엄이 오픈 소스 PDF / A 검증 인을 생성하기위한 EU위원회 입찰의 1 단계에서 승리 합니다. " . PDF 연결 . 2014-11-13. 2015 년 4 월 21 일 에 원본 문서 에서 보존 된 문서 . 만회 2015년 4월 30일을 .
  30. ^ PREFORMA , 프로토 타이핑 단계 시작 , 2015-04-30 검색
  31. "veraPDF 0.22 출시" . 2016 년 923 일에 확인 함 .
  32. ^ "소프트웨어" . veraPDF . 2015 년 6 월 30 일 . 만회 2017년 3월 15일을 . 플랫폼 별 설치 프로그램을 다운로드하기위한 페이지입니다.
  33. ^ "파일에서 PDF / A 정보를 제거하는 방법" . 만회 2014년 4월 10일을 .
  34. ^ "PDF / A보기 모드 변경" . 만회 2014년 4월 10일을 .
  35. ^ 아카이브 : PDF / A-3 용 꽃 없음 , 2014 년 7 월 12 일 검색
  36. ^ PDF / A를 둘러싼 신화와 전설 , 검색된 2018-02-15
  37. "PDF / A in a Nutshell 2.0" .

추가 읽기

외부 링크