2016-08-10
最近PDFファイルで保存した帳票をExcelで活用したいというご要望がありました。
そこには、基幹システムから毎月特定日に帳票として出力したPDFファイルが数年分保存されていて、その月ごとの帳票データを別システムで管理しているExcelファイルにダイレクトにではなく、一旦必要データを整えるためのファイルを作り、そこから流し込めるようにその工程をプログラミングしました。
というのも、PDFファイルからExcel形式への変換は有名市販ソフトの一機能を使うため、変換結果に一抹の不安を感じていたからです。
反面、うまくいけば変換後のデータを手を加えずに使えるのではという期待もありました。
ところが淡い期待とは裏腹に、やはり変換後のデータをExcelで再計算してみると、PDFファイルとは計算結果がまったく違います。
原因を探るため、まず、項目ごとの計算結果から切り分けてチェックしていくと、ありましたへんてこな数値が…。
本来3桁ずつのカンマが2桁ずつで区切られている箇所があり、そのセルの表示形式を見ると、数値ではなく日付になっていました。
すぐに表示形式が標準、数値、通貨、会計以外のものを検索するプログラムを加えて修正し、何とか無事完了しました。
PDFファイルからExcel形式への変換というのは、多様なデータ形式をソフトで完璧に判断させること自体まだまだ無理があるんだと痛感しました。