仕事上でも個人的にもPDFや画像をExcelに変換したいことは多いと思います。敢えて生成AIを使わなくともAcrobatでやOCRなどやり方はやると思われますが、意外とまともな結果が得られず、生成AIを頼ることにしました。今回活躍してくれたジェダイならぬジェナイ(Genai)達 Genais ChatGPT, Gemini, Claude から見えた三者三様というか性質の一端が見えた気がしますので、軽い気持ちで見て頂ければと思います。
結論: Claudeで今回目的に一番近づけました。
それでは、どのような状況になったか共有します。プロンプトも単純なものなのでもっと具体的に詳しく指示をすることで各生成AIもより効果的に動かせるかも知れません。
題材: 財務資料の読み込み
仕事上様々な表データをPDFで入手し、データとして活用を検討することが多いと思います。製品やサービスのスペック、課題一覧や損益に関するものなど。今回は、財務系のPDF資料をExcel化しデータ活用をする目的で変換を行います。
第一走者 “ChatGPT”: 力技で変換するも結果は…
ChatGPTは、企画の相談から画像生成まで様々お世話になっていますし、複数のモデルをもつ生成AIで今や様々なテレビやラジオでも聞かない日はないというのも大げさではないと思います。そんなChatGPTにPDFを添付し対象のページ番号のExcel化をお願いしました。
トライ①: PDFからExcel直接変換
直接は難しそうでしたが、画像からの変換など代替策を示してくれました。

トライ②: PNGからExcel変換
それであればと、PDFの一部を画像に変換し、その画像を添付して変換を依頼したところ・・・全然違うものが出てきました。どこを拾ったんだろうか。数字が全く見えません。

あくまでも今回の場合、ChatGPTは力業で結果を出してきたものが見事に異なりましたが、何とか結果を出そうと努力する後輩のような感じです。もう少し指示を見直したいです。
第二走者 “Gemini”: すごく生真面目ですが今回ばかりは…
Geminiも2.5と進化が止まりません。どんどん賢くなっているような気がします。私の身近でも使っている人が増えてきています。
トライ①: PDFからExcel直接変換
ものすごく潔い答えが返ってきました。気持ちいい。行頭に「拙者、」と書いてありそうな。文末は「おりませぬ。」と本当は言いたいのではと思ってしまいます。

トライ②: Deep Researchで取り込み方を調査
これもまた潔し。こちらの指示が無償で利用できるなど条件に合うものが見つからなかったと想像します。この単純な一行だけでなく、画面右側にはDeep Researchの過程として様々なサイトの閲覧、分析からの考察が繰り返し出力されかなり真面目に考えてくれたことが分かります。

Geminiも今回の問題をすごく多角的に取り組んでくれましたが、結果をだせないとわかると、無理やり答えを出そうとせず、できないことを示す潔さが非常にすがすがしく信頼できます。
第三走者 “Claude”: 淡々と良い結果にたどり着けました。
Claudeは、個人的には最近認知したばかりでまだそんなに試せていませんが、やはりネットのニュースや動画で見聞きすることは増えてきています。
トライ①: PDFからExcel変換手段を聞く
他の2つとトライが異なっていますが、そもそも直接変換はできないのではと思い、どのような手段があるかを訪ねてみました。生成AIについてを含まない既存のサービスやソフトウェアの情報だけが帰ってきました。ちょっと気になったので下のように聞いてみました。

画像からであればできると!? ChatGPTの結果を見ているので期待はせずに試すことにしました。
トライ②: PNGからCSV変換
結論から言うとお見事でした。多少日本語や数字の読み取りの間違いはありましたし、数字の桁を示すカンマもそのままでCSV形式のカラムの間のカンマと混ざったりとありましたが、文字列のカンマを削除するような追加指示をすることで見事にCSVが出力されました。

表から見事に「財務データ」と見抜いた点も驚きですが、比較的正確に抽出されていたので最初の二人に比べて非常に淡々と結果が出力されていく様に度肝を抜かれました。また最後に「不鮮明な部分」との記載があり、画像を拡大すると確かに解像度が低く不鮮明な数字や文字になっていました。もう少し解像度を上げた状態で画像かできればもっと精度よく読み取れそうで期待が持てます。
だったら、最初からできるって言ってよと言いたくもなりますが、元の質問がPDFからExcelにすることを求めていたのでそこまで融通を利かせられるものではなかったかと、こちらが期待しすぎたなと思いました。ただ、できる範疇に入った後は「財務データ」と見抜いたりと見事でした。少しぶっきらぼうに感じましたが、今回はClaudeがよい成果を出してくれました。
タイトルには「ツンデレ」と書いてしまいましたが、デレなところは皆無なので、、、ぶっきらぼうではありそうですが確かな技術でこちらもまた信頼にたる相棒と呼べそうです。
まとめ
今回、まさかこのような三者三様な結果になるとは思いもよらず、面白可笑しく書いてしまった気がします。よく言われていますが、生成AIにはそれぞれ得手不得手があるようなので、いろいろなAIに様々なことを頼んでみてよいものを採用すればよいのかなと感じました。
また、プロンプトの書き方がもっと工夫できれば今回の結果も変わったかも知れませんので、AIと共に働くこちら側のアップデートも必要だと感じています。
この3者だけでなく、これからももっと多くのジェナイ(GenAI)の騎士を探して仲間にしていきたいと思います。