前回に引き続き、PDFの請求書・領収書データから取引年月日を自動でエクセルに抽出させる件。
前回は、PDFから引っこ抜いたテキストデータから日付だけを抽出することができたので、今回はその日付の中から取引年月日に該当するものをピックアップすることを考えてみました。
PDFからテキストデータを引っこ抜く際、データの一覧と一緒にPDFのレイアウトにそったデータも次のように抽出しているので、日付セルとその周辺のセルのデータを使えばうまくいくでしょうか?
日付が含まれているセルの前後の文言。それに日付セルの上下左右のセルの文言を抽出してみると、以下の通り。
取引年月日の正解は「2022/5/19」ですが、同じセルに含まれている「注文日」に着目すれば、これをキーにうまくピックアップできるかなあ・・・。
同じようにアマゾンの領収書から引っ張ってきたデータは、次のような感じ。
正解は「2022/4/21」ですが、左のセルに「注文日」という文言があるから、これも「注文」をキーに引っ張ってこれそうな気がしますね。
もうちょっと考えてみたいと思います。
※今日はチェーンの居酒屋でランチ。
最近居酒屋にランチに行くと、お昼でも何となく店員さんや店の中の雰囲気がウキウキ華やいだ感じがするんですよね。
お客さん、だいぶん戻ってきているのかしら?