Main Content

이 번역 페이지는 최신 내용을 담고 있지 않습니다. 최신 내용을 영문으로 보려면 여기를 클릭하십시오.

readPDFFormData

PDF 양식에서 데이터 읽어오기

설명

예제

data = readPDFFormData(filename)은 PDF 양식의 데이터를 구조체로 읽어옵니다.

data = readPDFFormData(filename,'Password',password)는 PDF 양식을 열기 위한 비밀번호를 지정합니다.

예제

모두 축소

readPDFFormData를 사용하여 weatherReportForm1.pdf의 양식 필드에서 데이터를 읽어옵니다. 이 함수는 PDF 양식 필드의 데이터가 포함된 구조체를 반환합니다.

filename = "weatherReportForm1.pdf";
data = readPDFFormData(filename)
data = struct with fields:
         event_type: "Thunderstorm Wind"
    event_narrative: "Large tree down between Plantersville and Nettleton."

파일 데이터저장소를 사용하여 여러 파일의 양식 필드에서 데이터를 읽어옵니다.

날씨 보고서 양식에 사용할 파일 데이터저장소를 만듭니다. 양식 이름은 "weatherReportFormN.pdf" 형식이며, 여기서 N은 양식의 번호입니다. 와일드카드 "*"로 파일 이름을 지정하여 이 구조로 된 파일 이름을 모두 찾습니다. readPDFFormData를 읽기 함수로 지정하려면 함수 핸들을 사용하여 이 함수를 fileDatastore에 입력합니다.

fds = fileDatastore("weatherReportForm*.pdf",'ReadFcn',@readPDFFormData)
fds = 
  FileDatastore with properties:

                       Files: {
                              ' .../tp38dbdd07/textanalytics-ex39762425/weatherReportForm1.pdf';
                              ' .../tp38dbdd07/textanalytics-ex39762425/weatherReportForm2.pdf';
                              ' .../tp38dbdd07/textanalytics-ex39762425/weatherReportForm3.pdf'
                               ... and 1 more
                              }
                     Folders: {
                              '/tmp/Bdoc23b_2395265_791999/tp38dbdd07/textanalytics-ex39762425'
                              }
                 UniformRead: 0
                    ReadMode: 'file'
                   BlockSize: Inf
                  PreviewFcn: @readPDFFormData
      SupportedOutputFormats: ["txt"    "csv"    "xlsx"    "xls"    "parquet"    "parq"    "png"    "jpg"    "jpeg"    "tif"    "tiff"    "wav"    "flac"    "ogg"    "opus"    "mp4"    "m4a"]
                     ReadFcn: @readPDFFormData
    AlternateFileSystemRoots: {}

루프를 사용해 데이터저장소 내 파일을 순회하고 각 PDF 양식을 읽어옵니다.

data = [];
while hasdata(fds)
    textData = read(fds);
    data = [data; textData];
end
data
data=4×1 struct array with fields:
    event_type
    event_narrative

입력 인수

모두 축소

파일 이름으로, string형 스칼라 또는 문자형 벡터로 지정됩니다.

readPDFFormData는 AcroForm PDF 파일(대화형 양식)만 지원합니다.

데이터형: string | char

PDF 파일을 열기 위한 비밀번호로, 문자형 벡터 또는 string형 스칼라로 지정됩니다.

예: "skroWhtaM"

데이터형: string | char

출력 인수

모두 축소

출력 구조체. data의 필드는 해당 PDF의 양식 필드 이름에 해당합니다. 양식 필드 이름이 유효한 구조체 필드 이름이 아니면 이 함수는 유효한 이름을 생성하기 위해 자동으로 양식 필드 이름을 수정합니다.

버전 내역

R2018a에 개발됨