ナレッジ
実務ハウツー AI実装

AI開発を外注するときの見積もりの読み方 — 金額よりも先に確認すべき5つの項目

AI開発の見積もりは、従来のシステム開発と同じ読み方をすると失敗します。精度目標の合意方法、PoCと本番の範囲の切り分け、運用開始後の推論コスト、評価工数の有無など、金額の妥当性を判断する前に確認すべき項目を発注者の視点で整理します。

文責:サードパーティートラスト編集部

AI機能の開発を外部に依頼するとき、複数社の見積もりを並べると金額が数倍違う、ということが普通に起きます。従来のシステム開発でも相見積もりの幅はありますが、AI開発の幅はそれよりずっと大きい。そしてこの幅は、ベンダーの良心の差だけでなく、各社が「何を約束し、何を約束していないか」の差から生まれています。

結論から言うと、AI開発の見積もりは金額を比べる前に、約束の範囲を比べる必要があります。この記事では、見積書を受け取ったときに確認すべき項目を、発注側の視点で整理します。

なぜAI開発の見積もりは幅が出るのか

従来のシステム開発は、要件を固めれば成果物が決まります。AI開発が違うのは、作ってみるまで精度が分からないという不確実性が本質的に残ることです。

同じ「問い合わせ自動応答」でも、正答率70%で許容される業務と95%が必要な業務では、開発の工数がまったく違います。前者はプロンプト設計とRAGの基本構成で届くことが多いのに対し、後者はデータ整備・評価基盤・例外処理の作り込みが必要で、場合によっては到達不能です。安い見積もりは前者を、高い見積もりは後者を想定していることがあり、この場合両者は同じものの値段ではありません。

確認すべき5項目

見積書と提案書に対して、次の5点を確認してください。

  1. 精度の目標と、その測り方が書かれているか。「高精度な応答を実現」は約束ではありません。確認すべきは、何のデータで、どんな基準で、誰が評価するのか。誠実なベンダーは「現時点では精度を約束できないため、PoCで実測する」と書きます。根拠なく高い精度を約束する提案より、約束できない理由を説明する提案のほうが信頼できます

  2. PoCと本番開発の範囲が切り分けられているか。一括で「AIシステム開発一式」となっている見積もりは、不確実性の高い部分と低い部分が混ざっており、リスクの所在が読めません。PoC(精度の実測と実現可能性の判断)を小さく切り出し、その結果を見て本番開発を判断する2段階構成が、発注側にとって安全です。PoCの成果物に「本番に進まないという判断」が含まれることも、事前に合意しておくべきです

  3. 運用開始後のコストが見積もりに含まれているか。AI機能は作って終わりではなく、動くたびにAPI利用料(推論コスト)がかかります。利用量の想定と月額コストの試算、モデルの世代交代(数年でモデルは必ず古くなります)への追従が保守契約に含まれるのか、別料金なのか。ここが見積もりから抜けていると、開発費より運用費が高くつく事態が起きます

  4. 評価用データの整備が誰の仕事になっているか。精度を測るには「正解付きのテストデータ」が必要で、その正解を定義できるのは発注側の業務担当者だけです。見積もりに「評価データ作成支援」の工数があるか、あるいは発注側の作業として明記されているか。ここが曖昧な提案は、精度検証そのものを軽視している可能性があります

  5. 撤退条件が話せるか。PoCの結果がどうだったら本番に進まないのか、を契約前に話せるベンダーかどうか。AI開発は「やってみたが業務要件に届かない」が正当な結末としてあり得る領域です。撤退の話を嫌がる相手とは、不確実性の高いプロジェクトを組むべきではありません

従来開発との違いを表で整理する

社内の決裁者に説明する場面を想定して、違いを一覧にしておきます。

観点 従来のシステム開発 AI開発
成果物の確実性 要件通りに作れば動く 精度は作って測るまで不明
見積もりの前提 要件定義で固まる 精度目標と許容誤差で大きく変わる
検収の基準 仕様との一致 評価データでの精度実測
運用コスト サーバー・保守費 推論コストとモデル更新が加わる
失敗の形 納期遅延・仕様齟齬 精度未達・業務不適合

安い見積もりと高い見積もりの読み方

最後に、相見積もりで金額差が大きいときの実務的な読み方を。

まず、各社の見積もりを上の5項目で採点し、約束の範囲を揃えてから金額を比べます。範囲を揃えると、実は大差なかったということがよくあります。

それでも差が残る場合、安い側に確認すべきは「その金額で、精度が出なかったときに何が起きるか」です。追加費用で対応なのか、そこで終了なのか。高い側に確認すべきは「何にその工数がかかっているのか」で、データ整備や評価基盤に厚く積んでいる見積もりであれば、高いのではなく正直なのかもしれません。

AI開発の発注で失敗する典型は、不確実性を無視した固定価格・固定仕様の契約に、双方が縛られることです。見積もりの読み方とは、結局のところ、不確実性を契約のどこに置くかを読むことだと考えてください。

参考情報

関連するナレッジ