はじめに
営業や採用の現場で集めた名刺、まだ手入力していませんか? 先日 Codeless Camp で開催された Dify 勉強会に、これまで主催側だった私が今回は参加者として参加しました。
勉強会では、しんやさんが講師として、ノーコード AI ツールDifyと Google のGemini を組み合わせ、名刺画像をアップロードするだけで文字を自動抽出する手順を 1 時間で実践していただきました。さらに私の個人の勉強として、余った時間で、抽出したテキストを Discord へ自動通知するところまで実装できたので、その流れを初めて Dify に触れる方でも分かるようにまとめました。
ちなみに、今回の内容については、【94%OFFクーポン配布中】ゼロからはじめる「Dify入門講座」をUdemyで公開しました の一部を提供していただいたとのことです。(リンクもしんやさんから頂きました。ありがとうございます)
この記事でわかること
- 名刺画像を AI が読み取る(OCR)フローの作り方
- 抽出したテキストを Discord へ Webhook 送信する設定
- ノーコードで業務を効率化する応用アイデア
完成イメージ
名刺を読み込むと、文字情報が自動で Dify に取り込まれます。
STEP 1:Gemini API キーを取得して Dify に登録
まずは Google Gemiで Gemini API を有効化し、Dify から呼び出せるようにします。
- Gemini Developer API にログインし、新しいプロジェクトを作成
- 右メニュー「APIキーを取得する」で Gemini API を有効化

- 同じ画面の「API キー」タブでAPI キーを発行
- Dify 管理画面 → Model Providers → Google Cloud を選択し、発行したキーを
API KEY
欄へ貼り付け



STEP 2:名刺画像をアップロード
Dify の開始ノードに以下の入力フィールドを用意します。
businesscard
(ファイル/画像)


STEP 3:LLM ノードで Gemini Vision を使って OCR
続いてLLM ノードを追加し、下記の設定を行います。
- AIモデル:
Gemini 2.0 Flash
(Vision 対応) - System プロンプト:
step1.読み取った画像の文字データを全て出力してください。
- ビジョントグルを
ON
にし、画像フィールドにbusinesscard
を指定 - 解像度:「高」を選択(読み取り精度アップ)
SYSTEM / USER ブロック補足
SYSTEM は「必ずこう動いてね」という 仕様書、 USER は「今回はこれを処理してね」という 依頼書 という位置づけです。二層構造にしておくことで、どんな名刺画像を送ってもフォーマット崩れや余計な雑談を防げます。
SYSTEM:
step1. 読み取った画像の文字データを全て出力してください。
- 改行はそのまま保持
- 余計な説明文は付けず、純粋なテキストのみ返す
USER:
ビジョンには名刺画像が含まれています。
ビジョンで読み取った内容を
System に書かれているプロンプトで処理してください。
STEP 4:Discord Webhook で自動通知
- Discord のチャンネル→設定→インテグレーションで Webhook を作成し URL をコピー
- Dify でWebhook ノードを追加し、URL を貼り付け
content
フィールドに Jinja で Gemini 出力を渡します{{ '{{ LLM-TSUBASA.text }}' }}
- Discord Webhook Username に
名刺Bot
など好みの名前を入力


まとめ
今回ご紹介したように、Dify × Gemini を使えば、これまで手作業だった名刺情報の取り込みも、画像をアップするだけで自動抽出・通知できるようになります。
ノーコードのAIワークフロー構築は、最初は難しそうに見えるかもしれませんが、慣れればとてもシンプル。ちょっとした業務改善から、DXの第一歩を踏み出せます。
今回の内容は、Codeless Camp の勉強会で得た知見をベースにしています。Codeless Campは、ノーコードやAIの最新事例を学び合えるコミュニティ。初心者でも気軽に参加でき、実践的なスキルが身につく場です。
これからDifyを始めたい方、ノーコードで業務改善を進めたい方には特におすすめのコミュニティなので、ぜひ覗いてみてください。
この記事が、あなたのDX推進のヒントになれば幸いです!