メインコンテンツへスキップ

7.8.1 プロジェクトロードマップ:Prompt、RAG、微調整を選ぶ

このキャップストーンは、第 7 章を 1 つのエンジニアリング判断にまとめます。問題はタスク表現、知識不足、形式の不安定さ、安全境界、評価不足のどれでしょうか。

まずプロジェクトルートを見る

大規模モデル総合プロジェクトのロードマップ

大規模モデルプロジェクトの手法選択ループ図

ポートフォリオ証拠パック図

最強モデルや複雑なフレームワークから始めないでください。小さなドメインタスク、Prompt ベースライン、固定例、失敗ログから始めます。

証拠パックチェックを動かす

レポートを書く前に、この小さなプロジェクトログを使います。ベースライン、改善幅、次のルート、今すぐ微調整が必要かを示すためです。

project = {
"task": "classify course questions",
"baseline_pass_rate": 0.62,
"prompt_v2_pass_rate": 0.78,
"rag_needed": True,
"finetune_needed": False,
}

improvement = project["prompt_v2_pass_rate"] - project["baseline_pass_rate"]

print("task:", project["task"])
print("improvement:", round(improvement, 2))
print("next_route:", "RAG" if project["rag_needed"] else "Prompt")
print("fine_tune_now:", project["finetune_needed"])

出力:

task: classify course questions
improvement: 0.16
next_route: RAG
fine_tune_now: False

この項目を埋められないなら、プロジェクトをさらに小さくします。大きいが検証できないデモより、明確な比較のほうが価値があります。

この順番で学ぶ

手順作業証拠
1ドメインタスクを 1 つ選ぶ1 文のタスク定義と 10 件の固定例
2Prompt ベースラインを作るPrompt バージョン、出力、合否メモ
3失敗タイプを分類するタスク表現、知識不足、形式のずれ、安全境界
4次の手法を選ぶPrompt 反復、RAG、微調整の判断メモ
5結果をまとめるREADME、実行コマンド、スクリーンショット、失敗例、次の一手

先にガイド付きで動かしたい場合は、自分のドメインプロジェクトを設計する前に 7.8.4 実践:第 7 章フルワークショップ を実行してください。

プロジェクト成果物基準

成果物最低基準強いポートフォリオ版
README目的、実行コマンド、モデルまたは API 選択、入出力例手法のトレードオフ、コストメモ、評価、振り返りを追加
10 件以上の固定ケースPrompt、RAG、微調整、ルールベース版を比較
評価明確な合否ルールスコア、失敗タイプ統計、回帰メモを追加
Prompt/データ記録Prompt バージョンまたはサンプル形式を保存schema 検証、データ品質チェック、安全メモを追加
発表素材動作を証明するスクリーンショットまたは短い GIFなぜ現在のルートが代替案より良いか説明

合格ライン

固定した評価セットを使って、「ここで微調整しない理由」「ここで RAG が必要な理由」「この Prompt 変更が効いた理由」を説明できれば、この章は合格です。

最終プロジェクトは基本版で十分です。1 つのドメインタスクで 2 つの Prompt バージョンを比較します。強い版では RAG や小さな微調整実験を追加できますが、必ずベースラインと失敗ログで必要性を示してから行います。