PDF / A - PDF/A
파일 이름 확장자 | .pdf |
---|---|
인터넷 미디어 유형 | 신청 / pdf |
유형 코드 | 'PDF'(단일 공백 포함) |
UTI (Uniform Type Identifier) | com.adobe.pdf |
매직 넘버 | %PDF |
개발사 | ISO |
초판 | 2005 년 10 월 1 일 |
에서 확장 | |
표준 | ISO 19005 |
PDF / A 는 전자 문서 의 보관 및 장기 보존 에 특화된 PDF ( Portable Document Format )의 ISO 표준 버전입니다 . PDF / A는 글꼴 연결 ( 글꼴 포함 과 반대 ) 및 암호화 와 같이 장기 보관에 적합하지 않은 기능을 금지한다는 점에서 PDF와 다릅니다 . [1] PDF / A 파일 뷰어에 대한 ISO 요구 사항 에는 색상 관리 지침, 포함 된 글꼴 지원 및 포함 된 주석 을 읽기위한 사용자 인터페이스가 포함 됩니다 .
표준
Abbr. | 부제 | 게시 됨 | 표준 | 기반 | Ref. |
---|---|---|---|---|---|
PDF / A-1 | 1 부 : PDF 1.4 사용 | 2005-09-28 | ISO 19005-1 | PDF 1.4 ( Adobe Systems , PDF 참조 , 제 3 판) | [2] |
PDF / A-2 | 2 부 : ISO 32000-1 사용 | 2011-06-20 | ISO 19005-2 | PDF 1.7 (ISO 32000-1 : 2008) | [삼] |
PDF / A-3 | 파트 3 : 포함 된 파일을 지원하는 ISO 32000-1 사용 | 2012-10-15 | ISO 19005-3 | PDF 1.7 (ISO 32000-1 : 2008) | [4] |
배경
PDF는 시스템간에 이식 가능한 "인쇄 된"형식으로 문서를 인코딩하기위한 표준입니다. 그러나 보관 보존을위한 PDF 파일의 적합성은 PDF를 만들 때 선택한 옵션에 따라 다릅니다. 특히 문서를 렌더링하는 데 필요한 글꼴을 포함할지 여부입니다. 암호화 사용 여부; 원본 문서의 추가 정보를 인쇄하는 데 필요한 것 이상으로 보존할지 여부.
PDF / A는 원래 아카이빙을위한 PDF (Portable Document Format) 사용을 정의하는 국제 표준을 개발하기 위해 인쇄, 출판 및 변환 기술 공급 업체 연합 ( NPES )과 정보 및 이미지 관리 협회 간의 새로운 공동 활동 이었습니다. 서류. [5] 목표는 장기간에 걸쳐 내용을 보존하고 이러한 문서를 일관되고 예측 가능한 결과로 검색 및 렌더링 할 수 있도록 문서를 전자적으로 보관해야하는 증가하는 요구를 해결하는 것이 었습니다. 미래에. [6]이러한 요구는 법률 시스템, 도서관, 신문 및 규제 산업을 포함하여 전 세계적으로 다양한 정부, 산업 및 학술 분야에 존재합니다. [7]
기술
PDF / A 표준은 보관 전략이나 보관 시스템의 목표를 정의하지 않습니다. 전자 문서에 대한 "프로필"을 식별하여 향후 다양한 소프트웨어를 사용하여 문서가 정확히 동일한 방식으로 복제 될 수 있도록합니다. 이러한 재현성의 핵심 요소는 PDF / A 문서가 100 % 독립적이어야한다는 것입니다. 동일한 방식으로 문서를 표시하는 데 필요한 모든 정보가 파일에 포함됩니다. 여기에는 모든 콘텐츠 (텍스트, 래스터 이미지 및 벡터 그래픽), 글꼴 및 색상 정보가 포함되지만 이에 국한되지는 않습니다. PDF / A 문서는 외부 소스 (예 : 글꼴 프로그램 및 데이터 스트림)의 정보에 의존하는 것이 허용되지 않지만 외부 문서로 연결되는 주석 (예 : 하이퍼 텍스트 링크)을 포함 할 수 있습니다. [8]
PDF / A 적합성의 기타 핵심 요소는 다음과 같습니다. [9] [10] [11]
- 오디오 및 비디오 콘텐츠는 금지되어 있습니다.
- JavaScript 및 실행 파일 실행은 금지되어 있습니다.
- 모든 글꼴은 포함되어야하며 무제한 범용 렌더링을 위해 합법적으로 포함되어야합니다. 이는 Times 또는 Helvetica 와 같은 소위 PostScript 표준 글꼴 에도 적용됩니다 .
- 장치 독립적 인 방식으로 지정된 색 공간.
- 암호화는 금지되어 있습니다.
- 표준 기반 메타 데이터를 사용해야합니다.
- 외부 콘텐츠 참조는 금지됩니다.
- LZW 는 지적 재산 제약으로 인해 금지됩니다. JPEG 2000 이미지 압축 모델은 PDF 1.5에서 처음 도입되었으므로 PDF / A-1 (PDF 1.4 기반)에서 허용되지 않습니다. JPEG 2000 압축은 PDF / A-2 및 PDF / A-3에서 허용됩니다.
- 투명 개체 및 레이어 (선택적 콘텐츠 그룹)는 PDF / A-1에서는 금지되어 있지만 PDF / A-2에서는 허용됩니다.
- PAdES (PDF 고급 전자 서명 ) 표준 에 따른 디지털 서명 조항 은 PDF / A-2에서 지원됩니다.
- PDF / A-1에서는 포함 된 파일이 금지되어 있지만 PDF / A-2에서는 PDF / A 파일을 포함 할 수 있으므로 PDF / A 문서 세트를 단일 파일에 보관할 수 있습니다. PDF / A-3을 사용하면 XML, CAD 및 기타 파일 형식을 PDF / A 문서에 포함 할 수 있습니다.
- XML 기반 XFA ( XML Forms Architecture ) 양식의 사용은 PDF / A에서 금지되어 있습니다. (XFA 양식 데이터는 XFA 키에서 문서 카탈로그 사전의 이름 사전의 XFAResources 키 값인 이름 트리로 이동하여 PDF / A-2 파일에 보존 될 수 있습니다.)
- 대화 형 PDF 양식 필드에는 필드의 데이터와 연결된 모양 사전이 있어야합니다. 필드를 렌더링 할 때 외관 사전을 사용해야합니다.
적합성 수준 및 버전
PDF / A-1
표준의 Part 1은 2005 년 9 월 28 일에 처음 발표되었으며 [2] PDF 파일에 대한 두 가지 수준의 적합성을 지정합니다. [12]
- PDF / A-1b – 레벨 B (기본) 준수
- PDF / A-1a – 레벨 A (액세스 가능) 준수
수준 B 준수는 문서의 시각적 모양을 안정적으로 재현하는 데 필요한 표준 만 따르도록 요구하는 반면, 수준 A 준수에는 문서의 접근성 을 향상시키기위한 기능 외에도 모든 수준 B 요구 사항이 포함됩니다 .
추가 레벨 A 요구 사항 :
- 언어 사양
- 계층 적 문서 구조
- 태그가 지정된 텍스트 범위 및 이미지 및 기호에 대한 설명 텍스트
- 유니 코드에 대한 문자 매핑
레벨 A 적합성은 화면 판독기 와 같은 보조 소프트웨어 가 파일의 내용을보다 정확하게 추출하고 해석 할 수 있도록하여 신체 장애가있는 사용자를위한 적합성 파일의 접근성을 높이기위한 것 입니다. [12] 이후의 표준 인 PDF / UA 는 PDF / A의 단점 중 일부로 간주되는 것을 제거하기 위해 개발되었으며, 많은 일반 지침을보다 상세한 기술 사양으로 대체했습니다. [13]
PDF / A-2
2011 년 6 월 20 일에 발행 된 표준 2 부 [3] 에서는 PDF 참조 버전 1.5, 1.6 및 1.7에 추가 된 일부 새로운 기능을 다룹니다. PDF / A-1 파일은 반드시 PDF / A-2를 준수하지 않으며 PDF / A-2 준수 파일은 반드시 PDF / A-1을 준수하지 않습니다.
PDF / A 표준의 Part 2는 PDF 1.4가 아닌 PDF 1.7 (ISO 32000-1)을 기반으로하며 다음과 같은 여러 새로운 기능을 제공합니다.
- JPEG 2000 이미지 압축
- 투명 효과 및 레이어 지원
- 의 내장 오픈 타입 글꼴
- PDF 고급 전자 서명 – PAdES 표준에 따른 디지털 서명 조항
- PDF / A 파일을 포함하는 옵션으로 단일 파일로 문서 세트를 쉽게 보관할 수 있습니다. [10]
2 부에서는 세 가지 적합성 수준을 정의합니다. PDF / A-2a 및 PDF / A-2b는 PDF / A-1의 적합성 레벨 a 및 b에 해당합니다. 새로운 적합성 레벨 인 PDF / A-2u는 문서의 모든 텍스트에 유니 코드 매핑이 있어야한다는 추가 요구 사항과 함께 레벨 B 적합성 (PDF / A-2b)을 나타냅니다. [12] [14]
PDF / A-3
2012 년 10 월 15 일에 게시 된 표준의 Part 3, [4] 는 한 가지 측면에서 PDF / A-2와 다릅니다. 임의의 파일 형식 (예 : XML, CSV, CAD, 워드 프로세싱 문서, 스프레드 시트)을 포함 할 수 있습니다. 문서 및 기타)를 PDF / A 준수 문서로 변환합니다. [15]
PDF / A-4
PDF 2.0을 기반으로 한 표준의 파트 4는 2020 년 중반 경에 게시 될 예정입니다. [16]
PDF / A 파일을 만드는 방법
아카이브는 때때로 사용자에게 PDF / A 파일 제출을 요청합니다. 따라서 사용자에게 파일을 PDF / A로 변환하는 방법에 대한 정보를 제공합니다. 링크, 방정식, 벡터 그래프 및 특수 문자를 보존 할뿐만 아니라 계산 시간이 다른 표준 소프트웨어를 사용하는 몇 가지 방법이 있습니다. [17]
문서를 PDF / A로 변환 할 때 시각적 내용의 오류가 흔하므로 육안 검사가 필요합니다. 테스트 샘플에서 생성 된 PDF / A-1b 문서의 11 %에 시각적 인공물이 포함되어 있습니다. 이러한 재현성 오류에는 벡터 그래픽 문제 (투명 개체), 링크 손실, 기타 문서 콘텐츠 손실 (읽을 수없는 문자, 텍스트 누락, 문서 부분 누락), 업데이트 된 필드 (변환 시간 또는 폴더 반영) 및 철자 오류가 포함됩니다. [18] 아카이브 따라서 일반적으로 PDF / A 자체로 변환되지 않습니다. 대신 일부 아카이브는 사용자에게 PDF / A 문서를 제공하도록 요청합니다. 일반적인 컴퓨터 설정은 장단점이 다른 PDF / A로 문서를 변환하는 몇 가지 방법을 제공합니다. [19]
간단한 PDF (버전 1.4까지)를 PDF / A-2로 변환하는 것은 일반적으로 글리프 문제를 제외하고 예상대로 작동합니다 . PDF Association에 따르면 "PDF 생성 전 및 / 또는 생성 중에 문제가 발생할 수 있습니다. PDF / A 파일은 공식적으로 정확할 수 있지만 여전히 잘못된 글리프가 있습니다.주의 깊은 시각적 검사 만이 문제를 발견 할 수 있습니다. 생성 문제도 영향을 미치기 때문입니다. 유니 코드 매핑, 추출 된 텍스트에 대한 시각적 검사를 수행 할 때 문제가 주목을받습니다. PDF / A에서는 텍스트 / 글꼴 사용이 정확하지 않을 수 있도록 고유하게 지정됩니다. 뷰어 또는 프린터가 완전한 지원을 제공하지 않는 경우 인코딩 시스템의 경우 PDF / A와 관련된 문제가 발생할 수 있습니다. " [20] 즉, 문서가 표준을 완전히 준수하려면 내부적으로는 정확하지만 문서를 보거나 인쇄하는 데 사용되는 시스템은 원하지 않는 결과를 생성 할 수 있습니다.
광학 문자 인식 (OCR)을 PDF / A-2 또는 PDF / A-3으로 변환하여 생성 된 문서 는 notdefglyph
플래그를 지원하지 않습니다 . 따라서 이러한 유형의 변환으로 인해 콘텐츠가 렌더링되지 않을 수 있습니다.
PDF / A 표준 문서는 SoftMaker Office 2021 [21] [ circular reference ] , MS Word 2010 이상, Adobe Acrobat Distiller, PDF Creator, OpenOffice 또는 LibreOffice ( 릴리스 3.0 이후), LaTeX (pdfx 또는 pdfTeX 애드온 포함)로 생성 할 수 있습니다. , 또는 가상 PDF 프린터 (Adobe Acrobat Pro, PDF24, FreePDF + Ghostscript)를 사용합니다. [22]
신분증
PDF / A 문서는 "http://www.aiim.org/pdfa/ns/id/"네임 스페이스에있는 PDF / A 특정 메타 데이터를 통해 식별 할 수 있습니다. 이 메타 데이터는 적합성 주장을 나타냅니다. 그 자체로는 적합성을 보장하지 않습니다.
- PDF 문서는 PDF / A 메타 데이터가없는 경우를 제외하고는 PDF / A 규격 일 수 있습니다. 예를 들어 PDF / A 표준이 정의되기 전에 생성 된 문서에서 장기 보존 문제가있는 기능을 작성자가 알고있는 경우 이러한 상황이 발생할 수 있습니다.
- PDF 문서는 PDF / A로 식별 될 수 있지만 PDF / A에서 허용되지 않는 PDF 기능을 잘못 포함 할 수 있습니다. 따라서 PDF / A 준수라고 주장하는 문서는 PDF / A 준수 여부를 테스트해야합니다. [23]
확인
PDF / A 문서의 유효성 검사는 생성 된 파일이 실제로 PDF / A 파일인지 여부를 밝히기 위해 시도됩니다. 안타깝게도 PDF / A 표준의 해석이 항상 명확하지는 않기 때문에 PDF / A 검증 인이 동의하지 않는 경우가 많습니다. [18]
Isartor 테스트 스위트
원래 PDF / A Competence Center의 업계 협력으로 2007 년과 2008 년에 Isartor 테스트 스위트가 개발되었습니다. 테스트 스위트는 PDF / A-1b 적합성에 대한 각 요구 사항을 체계적으로 실패하도록 의도적으로 구성된 204 개의 PDF 파일로 구성되어 있습니다. 개발자는 표준의 가장 기본적인 수준의 적합성에 대해 자신의 소프트웨어 기능을 테스트 할 수 있습니다. [24] [25] 2009 년 중반으로 테스트 스위트는 이미 PDF / A 검증 소프트웨어의 일반적인 품질에 상당한 차이를 만들었다. [26]
veraPDF
Open Preservation Foundation [27] 과 PDF Association이 이끄는 veraPDF 컨소시엄 은 PDF / A 형식에 대한 오픈 소스 유효성 검사기를 개발하려는 EU위원회의 PREFORMA 도전 [28] 에 대응하여 만들어졌습니다 . PDF Association은 업계에서 지원하는 PDF / A 유효성 검사기 개발 계획을 명확히하기 위해 2014 년 11 월 PDF 유효성 검사 기술 작업 그룹을 시작했습니다. [29] [ 검증 실패 ]
이후 veraPDF 컨소시엄은 2015 년 4 월 PREFORMA 계약의 2 단계를 획득했습니다. [30] 2016 년 내내 개발이 계속되었으며 [31] 2 단계가 2016 년 12 월에 예정대로 완료되었습니다. 3 단계 테스트 및 승인 기간은 2017 년 7 월에 종료되었습니다. veraPDF는 이제 PDF / A의 모든 부분 (1, 2 및 3)과 적합성 수준 (a, b, u)을 다룹니다.
veraPDF는 PDFBox 기반 또는 "Greenfields"PDF 파서를 사용하여 Windows, macOS 또는 Linux에 설치할 수 있습니다. [32]
PDF / A 뷰어
PDF / A 사양에는 또한 준수해야하는 PDF / A 뷰어에 대한 몇 가지 요구 사항이 나와 있습니다.
- PDF 및 PDF / A 표준에서 설명하지 않는 데이터는 무시하십시오.
- 파일에서 제공하는 선형화 정보를 무시하십시오.
- only use the embedded fonts (rather than any locally available, substituted or simulated fonts);
- only display using the embedded colour profile;
- ensure that form fields do not change the rendered presentation and are rendered without regard to the form data;
- ensure that annotations are rendered consistently.
When encountering a file that claims conformance with PDF/A, some PDF viewers will default to a special "PDF/A viewing mode" to fulfill conforming reader requirements. To take one example, Adobe Acrobat and Adobe Reader 9 include an alert to advise the user that PDF/A viewing mode has been activated. Some PDF viewers allow users to disable the PDF/A viewing mode or to remove the PDF/A information from a file.[33][34]
Reception
A PDF/A document must embed all fonts in use; accordingly, a PDF/A file will often be larger than an equivalent PDF file that does not include embedded fonts.
The use of transparency is forbidden in PDF/A-1. The majority of PDF generation tools that allow for PDF/A document compliance, such as the PDF export in OpenOffice.org or PDF export tool in Microsoft Office 2007 suites, will also make any transparent images in a given document non-transparent. That restriction was removed in PDF/A-2.[9]
Some archivists have voiced concerns that PDF/A-3, which allows arbitrary files to be embedded in PDF/A documents, could result in circumvention of memory institution procedures and restrictions on archived formats.[35]
PDF Association은 출판물 "PDF / A in a Nutshell 2.0"에서 PDF / A에 대한 다양한 오해 [36] 를 다루었습니다 . [37]
또한보십시오
- 디지털 암흑 시대
- PDF / E – 엔지니어링 및 기술 문서 용
- PDF / X – 인쇄 제작에 최적화 된 PDF 표준의 또 다른 하위 집합
- PDF / VT – 가변 및 트랜잭션 인쇄용
참고 문헌
- ↑ Oettler, Alexandra (2013 년 2 월 7 일). "PDF / A 사실 – 표준 소개" . PDF 연결 . 만회 2014년 7월 11일을 .
- ^ a b "ISO 19005-1 : 2005" . ISO . 2016 년 7 월 27 일에 확인 함 .
- ^ a b "ISO 19005-2 : 2011" . ISO . 2016 년 7 월 27 일에 확인 함 .
- ^ a b "ISO 19005-3 : 2012" . ISO . 2016 년 7 월 27 일에 확인 함 .
- ^ "PDF / A의 짧은 역사" . PDF 연결 . 2013 년 2 월 7 일 . 만회 2014년 7월 11일을 .
- ↑ Oettler, Alexandra (2013 년 2 월 7 일). "PDF / A를 사용하는 가장 중요한 이유" . PDF 연결 . 만회 2014년 7월 11일을 .
- ↑ Oettler, Alexandra (2013 년 2 월 7 일). "PDF / A의 일반적인 용도" . PDF 연결 . 만회 2014년 7월 11일을 .
- ↑ Oettler, Alexandra (2013 년 2 월 7 일). "PDF / A 표준의 기술적 측면" . PDF 연결 . 2015 년 7 월 2 일에 원본 문서에서 보존 된 문서 . 2017 년 8 월 7 일에 확인 함 .CS1 유지 보수 : BOT : 원래 URL 상태를 알 수 없음 ( 링크 )
- ^ a b "PDF / A – 기술 측면 살펴보기" . 2011 년 7 월 26 일에 원본 문서 에서 보존 된 문서 . 2011 년 7 월 6 일에 확인 함 .
- ^ a b "ISO에서 발행 한 PDF / A-2 표준! 새로운 표준에는 뛰어난 기술 향상이 포함됩니다" . 2011-07-01 . 2011 년 7 월 6 일에 확인 함 .
- ^ 자주 묻는 질문 (FAQ) – ISO 19005-1 : 2005 – PDF / A-1, 날짜 : 2006 년 7 월 10 일 (PDF) , 2006-07-10 , 2012 년 1 월 18 일에 원본 (PDF) 에서 보관 됨 , 2011 년 7 월 6 일에 검색 됨
- ^ a b c "개선 된 PDF / A-1b" . PDF 연결 . 2011-08-05. 2012 년 9 월 15 일 에 원본 문서 에서 보존 된 문서 . 만회 2012년 9월 26일을 .
- ↑ Oettler, Alexandra (2013 년 2 월 7 일). "PDF / A 및 기타 PDF 표준" . PDF 연결 . 2014 년 7 월 14 일 에 원본 문서 에서 보존 된 문서 . 만회 2014년 7월 12일을 .
- ↑ PDF / A-2, PDF for Long-term Preservation, Use of ISO 32000-1 (PDF 1.7) , Library of Congress , retrieved 2012-09-26
- ^ "PDF 협회, 표준 1 ~ 3을 포함하는 PDF / A에 대한 첫 번째 세미나 개최" . PDF 연결 . 2012 년 3 월 29 일. 2012 년 9 월 15 일 에 원본 문서 에서 보존 된 문서.
- ^ PDF / A-4 및 기타 새로운 PDF 표준 (PDF 협회)
- ^ "PDF / A 파일은 어떻게 만듭니 까?" . Innovation @ ETH-Bibliothek . 2017-02-15 . 2020 년 4 월 29 일에 확인 함 .
- ^ a b 수리, Roland Erwin; 모하메드 엘 사드 (2018-06-06). "마이그레이션 중 손실 : PDF / A로 일괄 변환을위한 문서 품질". 도서관 하이테크 (인쇄 전) : LHT–10–2017-0220. 도이 : 10.1108 / LHT-10-2017-0220 . hdl : 20.500.11850 / 269199 . ISSN 0737-8831 .
- ↑ Suri, Roland (2017 년 2 월 15 일). "PDF / A 파일을 어떻게 만듭니 까?" 도이 : 10.16911 / ethz-IB-2722-드 . 저널 인용
|journal=
( help ) - ↑ PDF / A – A Look at the Technical Side , 검색된 2015-08-14
- ^ SoftMaker 사무실
- ^ TU 베를린에서 온라인 게시를위한 PDF / A 준수 파일 생성 지침
- ↑ Oettler, Alexandra (2013 년 2 월 7 일). "검증 : 정말 PDF / A입니까?" . PDF 연결 . 만회 2014년 7월 11일을 .
- ^ Isartor 테스트 스위트 (PDF) . PDF / A 역량 센터. 2008 년 8 월 12 일 . 만회 2016년 9월 23일을 .
- ^ "Isartor 테스트 스위트" . PDF 연결 . 2011-08-03 . 만회 2016년 9월 23일을 .
- ^ "바바리아보고" . PDFlib . 2009. 2015 년 4 월 21 일에 원본 문서에서 보존 된 문서 . 만회 2015년 4월 30일을 .CS1 유지 보수 : 적합하지 않은 URL ( 링크 )
- ^ "오픈 보존 재단 veraPDF 프로젝트" . 보존 재단을 엽니 다 . 만회 2015년 4월 30일을 .
- ^ PREFORMA, EU위원회 자금 지원 프로젝트
- ^ "PDF 협회를 포함한 컨소시엄이 오픈 소스 PDF / A 검증 인을 생성하기위한 EU위원회 입찰의 1 단계에서 승리 합니다. " . PDF 연결 . 2014-11-13. 2015 년 4 월 21 일 에 원본 문서 에서 보존 된 문서 . 만회 2015년 4월 30일을 .
- ^ PREFORMA , 프로토 타이핑 단계 시작 , 2015-04-30 검색
- ↑ "veraPDF 0.22 출시" . 2016 년 9 월 23 일에 확인 함 .
- ^ "소프트웨어" . veraPDF . 2015 년 6 월 30 일 . 만회 2017년 3월 15일을 . 플랫폼 별 설치 프로그램을 다운로드하기위한 페이지입니다.
- ^ "파일에서 PDF / A 정보를 제거하는 방법" . 만회 2014년 4월 10일을 .
- ^ "PDF / A보기 모드 변경" . 만회 2014년 4월 10일을 .
- ^ 아카이브 : PDF / A-3 용 꽃 없음 , 2014 년 7 월 12 일 검색
- ^ PDF / A를 둘러싼 신화와 전설 , 검색된 2018-02-15
- ↑ "PDF / A in a Nutshell 2.0" .
추가 읽기
- Nutshell 2.0의 PDF / A – PDF Association에서 게시 (2013)
- PDF / A 101 : 소개 – 제 1 회 국제 PDF / A 컨퍼런스 발표 (2008)
- 백서 : PDF / A – 기본 사항 – PDF Tools AG (2009)
- PDF / A-1 형식 설명 – digitalpreservation.gov
외부 링크
- PDF 연관
- PDF / A 역량 센터
- veraPDF – PDF / A 검증 소프트웨어