knowledge AutoMate 自習用コンテンツ その6

【課題】
以下の内容を満たすタスクを作成してみましょう。


■1. 事前準備
以下のダウンロードサイトからPDFファイルをダウンロードしてください。
(PDFファイルは、Adobe reader, Internet Explorer, Google Chromeなどで閲覧可能です)
https://www-1.sct.co.jp/download/automate/Sample_Task/00009912/00009912.pdf
  

■2. 内容(クリックして展開してください)

--------------------------------------------------------------------------------------------------

PDFファイルには、ページが全部で4ページあります。以下の要領で、ページ分割とファイル名変更を行います。
1. PDFファイルをページごとに別ファイルとして分割
2. 分割したそれぞれのページのファイルを、そのページ内に含まれている「管理番号」に名前変更する
(例:1ページ目のみ抽出されたファイルの名前は「0002735.pdf」になる)

--------------------------------------------------------------------------------------------------

  
■2. 前提
・PDFファイルはただの画像ではなく、テキストの選択が可能です。
・管理番号は必ず1ページに1か所書かれています。
・管理番号は「0」も含めた7桁とします。
・処理専用のフォルダは事前に作っておいても構いません。
・PDFを分割するにあたって「Adobe Acrobat」などの専用ソフトは必要ありません。

■3. 処理を作成する上での禁則事項
・事前にPDFファイルを開いて、ページごとに管理番号をメモしておくなどの行為は禁止です。
・ファイルをリネームした結果から、管理番号の先頭の「0」が消えていると失敗です。

■4.ヒント
(ヒントを見る際は、クリックして展開してください。)

ヒント1

PDFファイルの内容のテキストを格納する変数と、管理番号を格納する変数の2種が必要です。
なお、「管理番号」の変数については、先頭のゼロが消えてしまわないよう変数の型にご注意ください。

  

ヒント2

「PDF - 分割」アクションを使用することで、ページごとにPDFファイルを分割することが出来ます。
この際、分割されたファイルの出力先を専用フォルダに指定すると後続処理が楽になります。分割元のPDFと同じ場所を指定すると後続処理がややこしくなります。

  

ヒント3

処理専用フォルダに出力したPDFを「ファイルシステム - 情報の取得」でデータセット化すれば処理するファイルの一覧を取れます。

  

ヒント4

PDFファイルはテキスト選択できるので、「PDF - 抽出」を利用すれば内部のテキストを全て変数に抽出できます。

  

ヒント5

管理番号は必ず「管理番号:」+数字のフォーマットになっています。
正規表現で抽出した後、「管理番号:」の文字列を除去すれば7桁の数字だけを残せます。

  

■5. 解説及び構築例
以下のページをご参照ください。
https://automate.sct.co.jp/knowledge/12054/