MATLAB 도움말 센터
PDF 양식에서 데이터 읽어오기
data = readPDFFormData(filename)
data = readPDFFormData(filename,'Password',password)
data = readPDFFormData(filename)은 PDF 양식의 데이터를 구조체로 읽어옵니다.
data
filename
예제
data = readPDFFormData(filename,'Password',password)는 PDF 양식을 열기 위한 비밀번호를 지정합니다.
password
모두 축소
readPDFFormData를 사용하여 weatherReportForm1.pdf의 양식 필드에서 데이터를 읽어옵니다. 이 함수는 PDF 양식 필드의 데이터가 포함된 구조체를 반환합니다.
readPDFFormData
weatherReportForm1.pdf
filename = "weatherReportForm1.pdf"; data = readPDFFormData(filename)
data = struct with fields: event_type: "Thunderstorm Wind" event_narrative: "Large tree down between Plantersville and Nettleton."
파일 데이터저장소를 사용하여 여러 파일의 양식 필드에서 데이터를 읽어옵니다.
날씨 보고서 양식에 사용할 파일 데이터저장소를 만듭니다. 양식 이름은 "weatherReportFormN.pdf" 형식이며, 여기서 N은 양식의 번호입니다. 와일드카드 "*"로 파일 이름을 지정하여 이 구조로 된 파일 이름을 모두 찾습니다. readPDFFormData를 읽기 함수로 지정하려면 함수 핸들을 사용하여 이 함수를 fileDatastore에 입력합니다.
"weatherReportFormN.pdf"
N
fileDatastore
fds = fileDatastore("weatherReportForm*.pdf",'ReadFcn',@readPDFFormData)
fds = FileDatastore with properties: Files: { ' .../tpaeae62dc/textanalytics-ex39762425/weatherReportForm1.pdf'; ' .../tpaeae62dc/textanalytics-ex39762425/weatherReportForm2.pdf'; ' .../tpaeae62dc/textanalytics-ex39762425/weatherReportForm3.pdf' ... and 1 more } Folders: { '/tmp/Bdoc25a_2974004_626030/tpaeae62dc/textanalytics-ex39762425' } UniformRead: 0 ReadMode: 'file' BlockSize: Inf PreviewFcn: @readPDFFormData SupportedOutputFormats: ["txt" "csv" "dat" "asc" "xlsx" "xls" "parquet" "parq" "png" "jpg" "jpeg" "tif" "tiff" "wav" "flac" "ogg" "opus" "mp3" "mp4" "m4a"] ReadFcn: @readPDFFormData AlternateFileSystemRoots: {}
루프를 사용해 데이터저장소 내 파일을 순회하고 각 PDF 양식을 읽어옵니다.
data = []; while hasdata(fds) textData = read(fds); data = [data; textData]; end data
data=4×1 struct array with fields: event_type event_narrative
파일 이름으로, string형 스칼라 또는 문자형 벡터로 지정됩니다.
readPDFFormData는 AcroForm PDF 파일(대화형 양식)만 지원합니다.
데이터형: string | char
string
char
PDF 파일을 열기 위한 비밀번호로, 문자형 벡터 또는 string형 스칼라로 지정됩니다.
예: "skroWhtaM"
"skroWhtaM"
출력 구조체. data의 필드는 해당 PDF의 양식 필드 이름에 해당합니다. 양식 필드 이름이 유효한 구조체 필드 이름이 아니면 이 함수는 유효한 이름을 생성하기 위해 자동으로 양식 필드 이름을 수정합니다.
R2018a에 개발됨
pdfinfo | extractFileText | extractHTMLText | writeTextDocument | tokenizedDocument
pdfinfo
extractFileText
extractHTMLText
writeTextDocument
tokenizedDocument
You clicked a link that corresponds to this MATLAB command:
Run the command by entering it in the MATLAB Command Window. Web browsers do not support MATLAB commands.
웹사이트 선택
번역된 콘텐츠를 보고 지역별 이벤트와 혜택을 살펴보려면 웹사이트를 선택하십시오. 현재 계신 지역에 따라 다음 웹사이트를 권장합니다:
또한 다음 목록에서 웹사이트를 선택하실 수도 있습니다.
사이트 성능 최적화 방법
최고의 사이트 성능을 위해 중국 사이트(중국어 또는 영어)를 선택하십시오. 현재 계신 지역에서는 다른 국가의 MathWorks 사이트 방문이 최적화되지 않았습니다.
미주
유럽
아시아 태평양
지역별 지사에 문의