🚀 マルチモーダルRAGシステム
📁
ファイルをドラッグ&ドロップ、またはクリックして選択
PDF, PNG, JPG, GIF, BMP, WebP, Word(.docx)対応 (最大50MB)
⚙️ API選択設定
📝 テキスト処理API
Gemini 2.0 Flash (コスト重視) ~$0.0004/chunk
GPT-4o mini (バランス) ~$0.0004/chunk
Gemini 3 Pro (精度重視) ~$0.007/chunk
PDF・Word文書のテキストチャンク処理に使用するLLMを選択します
📊 API比較 (2025-11-22更新)
💚 Gemini 2.0 Flash:
$0.075/$0.30/1M tokens | 精度★★★☆☆ | 一般文書、大量処理向け
💙 GPT-4o mini:
$0.15/$0.60/1M tokens | 精度★★★★☆ | 高コスパ・バランス型
💜 Gemini 3 Pro:
$2.00/$12.00/1M tokens | 精度★★★★★ | LMArena首位・最高精度
🤖 LLMキーワード抽出を使用
❌ 無効(埋め込みのみ、低コスト)
🔍 キーワード抽出API
Gemini 2.0 Flash (コスト重視) ~$0.0004/chunk
GPT-4o mini (バランス) ~$0.0004/chunk
Gemini 3 Pro (精度重視) ~$0.007/chunk
🔍 キーワード抽出とは?
既に抽出されたテキストから重要なキーワードを抽出してRAG検索の精度を向上させる機能(画像→テキスト変換ではありません)
💚 Gemini 2.0 Flash:
基本的な文脈理解、一般文書向け (最安)
💙 GPT-4o mini:
高度な文脈理解、高コスパ
💜 Gemini 3 Pro:
最高精度の概念抽出、LMArena首位
💡 選択時の影響:
✅
有効時:
LLM使用でキーワード抽出精度向上、コスト増加(~23,000倍)
❌
無効時:
TF-IDF+辞書ベース、低コスト、基本精度
🖼️ 画像表抽出モード
自動選択(戦略に基づく)
スキップ(画像表抽出なし)
Google Vision API使用
GPT-4o使用(高精度)
💡 選択ガイド:
🔄 自動選択:
戦略に基づいて自動決定(コスト重視→スキップ, バランス→スキップ, 精度重視→GPT-4o)
⏭️ スキップ:
画像表抽出を実行しない(OCRのみ)- コスト: $0
🌐 Google Vision:
シンプルな表に最適 - コスト: ~$0.0015/画像
🤖 GPT-4o:
複雑な表・セル結合に対応 - コスト: ~$0.010/画像
📊 コスト比較:
GPT-4oはGoogle Visionの約6.7倍のコストですが、セル結合・階層構造の認識精度が高くなります。
📊 階層構造解析(表・フローチャート検出)
💡 推奨用途:
✅
ON推奨:
XMLスキーマ、API仕様書、組織図など階層構造を持つ文書(バランス型以上推奨)
❌
OFF推奨:
単純な文章のみの文書、処理速度優先の場合
⏱️
処理時間節約:
OFFで約60-150秒短縮(2ページPDF例: 210秒→0秒)
💰
APIコスト:
約$0.01~0.03/表(階層表のみ)
📝 Note:
ONの場合、PDF内の表・フローチャートを検出し、階層関係(親子・兄弟)を自動解析します。階層構造がない単純な表は通常の表抽出のみ実行されます。OFFの場合は階層解析をスキップして処理時間を大幅に短縮します。
📄 ファイルを選択
⚡ バッチ処理開始
🚀 高度バッチ処理
🗑️ クリア
⏭️ 現在の処理をスキップ
🚫 全処理キャンセル
準備中...
📊 コンテンツタイプ別実績コスト(全ファイル集計)
🔍 検索
🎯 検索モード
検索タイプ
📖 検索のみ - 関連文書を詳細表示
💬 質問回答 - AI要約 + 参考文書(設定件数)
🎭 専門家役割 (チャットモード用)
AIの回答視点を設定します。プリセットから選択するか、テキストボックスで直接編集できます。
経営コンサルタント
金融・決済システムの専門家
法務・コンプライアンスの専門家
ITシステムアーキテクト
データ分析の専門家
セキュリティ専門家
業務プロセスコンサルタント
マーケティングの専門家
政治の専門家
経済の専門家
東洋医学の専門家
西洋医学の専門家
整体の専門家
AI・機械学習の専門家
汎用AIアシスタント
🚀 AI戦略選択 (チャットモード用)
🔥
コスト最適化
~$0.0004
Gemini 2.0 Flash で超低コスト・高速な回答を提供。レートリミットなし。
主要モデル: google/gemini-2.0-flash-001 ($0.075/$0.30/1M)
⚖️
バランス型
~$0.0008
DeepSeek V3 で高コスパな回答を提供。コストと品質のベストバランス。
主要モデル: deepseek/deepseek-chat ($0.30/$1.20/1M)
🎯
精度重視
~$0.007
Gemini 3 Pro (LMArena首位) で最高品質の分析と推論を提供。
主要モデル: google/gemini-3-pro-preview ($2/$12/1M)
💡
選択ガイド:
コスト最適化が選択されています。Gemini 2.0 Flash ($0.075/$0.30/1M tokens) で超低コスト・高速な回答を提供します。
📁 ファイル名でフィルタ
-- ファイルを選択 --
💡 リストから選択、またはワイルドカード入力可(例: IMG_*.JPG, P1-*.pdf)
検索
📝 定型プロンプト:
-- 選択してください --
確度記号:根拠
Advanced Tablesプラグイン対応
➕ 追記
⚙️ 検索設定
絞り込み最大件数
PostgreSQL類似検索の候補件数(source_fileフィルタ使用時はDB側でフィルタ適用後に取得)
表示結果件数
ユーザーに表示する最終結果件数(上限: 100件、完全網羅には50推奨)
📏 結果文字数制限
標準 (1000文字)
拡張 (2500文字)
詳細 (5000文字)
最大 (10000文字)
各検索結果の表示文字数を選択
類似度閾値
推奨: 0.0-0.2 (低いほど多くの結果、高いほど精密) ※完全網羅には0.0推奨
画像も含める
はい
いいえ
詳細ソース表示
はい
いいえ
🐛 デバッグモード
APIレスポンスをコンソールに出力
🤖 TTS プロバイダー
OpenAI TTS (tts-1) - $0.015/1000文字
Gemini 2.5 Flash Preview TTS - $0.012/1000文字
音声合成に使用するAIプロバイダーを選択(Geminiの方が20%安価、30種類の声優)
🎤 音声合成の声優
Alloy (中性的)
Echo (男性的)
Fable (イギリス英語)
Onyx (深い男性)
Nova (女性的)
Shimmer (柔らかい女性)
Telegram送信時の音声メッセージの声優を選択
🔊 音声メッセージも送信
Telegram送信時にテキストと音声の両方を送信