PRERAG

PDFからテキストを100%の精度で抽出。
RAGのための“確実な前処理”を実現。

OCRを使わず、PDFからテキストを直接抽出するため誤認識はゼロ

帳票データを構造化して、すぐにRAGや生成AIに渡せます。

※PDFのフォーマットが固定され、テキスト情報が正しく埋め込まれている場合に限ります。

letter-r_32

PRERAG(プレラグ)について

RAG前処理でOCR精度に悩む現場が多い

ChatGPTや生成AIの普及により、社内文書をRAG(検索拡張生成)に取り込む動きが広がっています。
社内文書にはExcelやWord、PDFなどさまざまな形式がありますが、中でもPDFは最も前処理に手間がかかる形式です。
そのため、PDFファイルの文字を正確にテキスト化することが、手動入力の手間を省き、データ管理やAI活用を進めるうえで重要になります。

OCRの限界

多くの企業ではOCR(文字認識)を使ってPDFを処理していますが、誤認識やレイアウトの崩れに悩む声が多く聞かれます。
特に、数字(Oと0、1とIなど)の混同や、表形式のズレによって人手での修正作業が避けられないケースも少なくありません。
こうした非構造データの処理には、安定して情報を抽出できる“別の方法”が求められています。

定型帳票にはルールベースが最適解

多くの企業では、「同じ様式の帳票」を繰り返し使用しています。
請求書・納品書・明細書など、定型フォーマットの帳票が大半を占めており、内容は違ってもレイアウトは共通です。

このように形式が決まっている帳票に対しては、生成AIやOCRよりも、ルールベースの抽出のほうが確実で効率的です。
あらかじめ定義された位置やキーワードに基づいて、必要な情報を高精度に・安定して抽出できます。

PRERAGの強み

OCR不要で高精度

あらかじめ指定された座標から直接テキストを抽出するため、誤認識のない正確なデータ取得が可能です。

業務帳票に最適化

請求書・納品書・明細書など、定型フォーマットの帳票に特化しており、実運用に強い。

構造化データとしてすぐ使える

抽出データはCSV・JSON・Markdown形式で出力可能。RAGや生成AIにそのまま連携できます。

現場の帳票に合わせてカスタマイズ

帳票ごとに抽出ルールを調整できるため、企業ごとの様式や現場の要件にも柔軟に対応可能です。

外部システムとの連携・自動化にも対応

出力データはNotion・Zapier・kintoneなどの外部ツールと連携可能。業務フローへの組み込みや自動化にも活用できます。

letter-r_32

PRERAGはここが違う

letter-r-24

PRERAG

汎用AI
チャット

OCR系
ツール

テキスト抽出の精度

dpib;e_circle_32
100%
triangle_32
97%前後
close_32
そもそも不可

帳票書式への対応力

dpib;e_circle_32
定型帳票に特化
triangle_32
レイアウト崩れ
close_32
無対応

JSON・CSVで出力

dpib;e_circle_32
すぐに構造化
triangle_32
追加整形が必要
triangle_32
工夫すれば可能

RAGとの親和性

dpib;e_circle_32
即インジェスト可
close_32
形式変換が必要
triangle_32
要整形

カスタマイズ対応

dpib;e_circle_32
柔軟なルール設定
triangle_32
固定ルール
dpib;e_circle_32
プロンプト次第

現場導入しやすさ

dpib;e_circle_32
軽量&シンプル
close_32
OCRセット要・構築が大変
triangle_32
調整すれば可

スキャンPDF
手書きPDF対応

close_32
テキストPDF専用
dpib;e_circle_32
画像をOCR処理
triangle_32

外部OCRを使えば可能

=対応・強みあり

=一部対応・工夫次第

=非対応

letter-r_32

PRERAGの導入方法

ヒアリング

テキストを抽出したいPDFを確認し、対象ページや取得項目、付加情報などのご要望をヒアリングします。

お見積もり・ご発注

ヒアリング内容をもとにお見積りをご提示。内容と費用にご納得いただけましたら、ご発注ください。

アプリ納品

ルールを実装したアプリをご納品。インストール不要でそのままご利用いただけます。

なぜPRERAGは “個別対応” なのか?

一見手間に見える“個別対応”ですが、そこには確かな理由があります。

クラウド全盛の今、「カスタマイズ前提の受注生産」は一見、手間がかかるように見えるかもしれません。
しかし、実際の現場では——

  • 帳票の形式は企業や業種ごとに千差万別

  • 同じ帳票でも抽出したい情報は会社ごとに異なる

  • 書式のズレや誤認識は精度に直結する問題

だからこそ、PRERAGでは “1社ごと × 1帳票ごと” に専用ルールを定義。
「確実な構造化データを得る」ことにフォーカスした前処理アプリとして、
テンプレート任せではない、信頼できるデータ抽出を実現しています。

letter-r_32

PRERAGの価格について

PRERAGは、使い切りの明快な価格体系です。

月額・年額の継続費用は不要。必要な帳票ごとの買い切り型で、1度の導入で長くご利用いただけます。

初回費用

アプリ本体費用

50,000 円

アプリの共通ベース

1帳票追加

帳票ルール定義費用

30,000 円 ~

抽出項目数・帳票構造により調整

※ 表形式を含む帳票は、別途 +20,000円〜(表形式の複雑さに応じてお見積もり)

価格例:

初回1帳票をご依頼いただいた場合

アプリ本体費用 50,000円 +   帳票ルール定義費用 30,000円

その後2帳票めを追加でご依頼いただいた場合

帳票ルール定義費用 30,000円

※ 価格の表記はすべて税別

letter-r_32

PRERAGへのよくある質問

本当に精度100%ですか?

はい。PRERAGでは、OCRではなくPDF内のテキスト情報をルールベースで抽出するため、対象のPDFがテキスト情報を正しく保持していれば、抽出精度は100%です。

どのようなPDFでも対応可能ですか?

※ただし、スキャン画像PDFや文字化けしたPDFなど、テキスト情報が含まれていない形式には対応していません。

どんな形式でデータを出力できますか?

JSONやCSV、Markdownなど、RAGや生成AIにそのまま使える形式で出力可能です。

どこまでカスタマイズ対応できますか?

PRERAGは、共通ベースの上に、各企業様の帳票ごとに個別のルールを定義・追加してご提供する「個別対応型アプリケーション」です。 そのため、業種や帳票の形式に応じて、柔軟かつ高精度なカスタマイズが可能です。

1帳票からはじめられますか?

もちろんです。 PRERAGは 1帳票から小さく始めていただくことが可能 です。
初回は「アプリ本体 + 1帳票ルール」のセットで納品し、ご利用後に帳票を追加したい場合は、必要な分だけ追加購入していただけますので、 スモールスタートから段階的な導入が可能です。

どれくらいの期間で納品できますか?

通常1〜2帳票であれば、ヒアリング後約1〜2週間でのご提供が目安です(帳票の複雑さにより調整あり)。

精度100%の確実なデータを、RAGに届ける

まずは1つの帳票から。100% の精度で確実な構造化を体験してください。

上部へスクロール