メインコンテンツへスキップ

7.8.3 プロジェクト:納品キット

LLM プロジェクトの最後に大事なのは、「動く」だけではありません。

それ以上に大事なのは、

他の人が目的を理解し、結果を再現し、評価を確認し、続きから進められるか?

プロジェクト納品キット

このページがある理由

多くのプロジェクトは、モデルが弱いから失敗するのではなく、最後の引き継ぎが弱いから失敗します。良いプロジェクトには、デモだけでなく証拠が必要です。

最終パッケージには何が必要か

最低限、良い LLM プロジェクトには次のものが必要です。

  1. README.md
  2. 再現可能な実行コマンド
  3. 入力と出力の例
  4. 評価記録
  5. 失敗ケース分析
  6. スクリーンショットやグラフ
  7. 次のステップの計画

これがあると、プロジェクトは自立して見えます。

レビューしやすいフォルダ構成

project/
├── README.md
├── examples/
│ ├── input-01.json
│ └── output-01.json
├── reports/
│ ├── evaluation.md
│ └── failure_cases.md
├── screenshots/
│ ├── run-01.png
│ └── before-after.png
└── src/
└── ...

この構成は意図的にシンプルです。

  • README.md は物語を伝える
  • examples/ はタスクを証明する
  • reports/ は評価を証明する
  • screenshots/ は実行できることを証明する

再利用できる README テンプレート

次のひな形をコピーして、自分のプロジェクト内容で埋めてください。

# プロジェクト名

## 1. 目的
このプロジェクトは何を解決するのか?

## 2. タスク範囲
何が範囲内で、何が範囲外か?

## 3. ベースライン
まず何と比較したのか?

## 4. データ
データはどこから来たのか? サンプル数はどれくらいか?

## 5. 評価
どの指標や手動チェックを使ったのか?

## 6. 結果
何が改善し、何がまだ課題か?

## 7. 失敗ケース
実際の失敗を 1 つ示し、原因を説明する。

## 8. 実行方法
どうすれば結果を再現できるか?

## 9. 次のステップ
次に何を改善するのか?

使いやすい評価記録テンプレート

固定テストセットがあるなら、結果は次のような表にまとめると便利です。

ケース ID入力ベースライン新しい方法合格?メモ
001返金依頼汎用回答ドメイン対応回答はいポリシーをカバー
002住所変更曖昧明確なルール回答はい構造が良い
003請求書の質問重要点を落とす正しい回答いいえデータ追加が必要

これで、後からバージョン比較がしやすくなります。

本当に役立つ失敗メモのテンプレート

「モデルが悪い」とだけ書かないでください。

次のように書きます。

# Failure Case: JSON field missing

- Phenomenon: The output sometimes adds extra text before the JSON object.
- Clues: This happens more often on long prompts.
- Suspected cause: The prompt does not strongly constrain the output format.
- Investigation: Compare prompt versions and inspect the raw outputs.
- Fix action: Add a strict schema reminder and a short example.
- Regression check: Run the same fixed test cases again.

この 1 つのメモは、10 枚のスクリーンショットより価値があることもあります。

良い引き継ぎとは何か

引き継ぎでは、他の人がすぐに次の 3 つに答えられるべきです。

  • このプロジェクトは何を解決するのか?
  • どうやって再現するのか?
  • なぜこの方法はベースラインより良いのか?

この 3 つにすぐ答えられるなら、ポートフォリオやチームレビューに出せる状態です。

プロジェクト納品キット

最終チェックリスト

プロジェクトを閉じる前に、次を確認します。

  • README が目的と範囲を説明しているか
  • 実行コマンドが動くか
  • ベースラインと新しい方法の両方を示しているか
  • 評価セットが固定されているか
  • 失敗ケースが少なくとも 1 つあるか
  • スクリーンショットやグラフがあるか
  • 次の計画が書かれているか

まとめ

良い LLM プロジェクトは、動くだけのスクリプトではありません。

理解できて、再現できて、評価できて、さらに拡張できるパッケージであるべきです。

ここまでできれば、もう単に技術を学んでいるだけではありません。 他の人が本当に使えるものを作っています。