メインコンテンツへスキップ

A.9 学習リソース早見表

AI プロジェクト早見表の全体図

AI プロジェクト早見表のトラブルシュート索引

プロジェクト中に調べるページです。上から順に読む必要はありません。

環境確認

python --version
which python
pip --version
pip list
pwd
ls

ドキュメントサイト:

npm install
npm run start
npm run build

NVIDIA GPU:

nvidia-smi

まずベースライン

タスク最初に試すもの
表形式の分類/回帰線形モデルまたは木モデル
テキスト分類TF-IDF + LogisticRegression
画像分類転移学習
固有表現抽出ルール/辞書 baseline、その後系列モデル
文書 Q&Aキーワード/BM25 検索、その後 RAG
Agent ツール利用単一 Agent + 安全なツール 1 つ

指標

タスク最初に見る指標
クラスが均衡した分類Accuracy、F1
不均衡分類Precision、Recall、F1、混同行列
回帰MAE、RMSE、残差レビュー
検索 / RAGHit@K、MRR、引用正確性、人手レビュー
Agent成功率、ツールエラー、コスト、trace レビュー

学習中の警告サイン

サイン先に確認
loss が下がらないラベル、loss 関数、学習率、入力形式
train は良いが validation が悪い過学習、データ漏洩、分布ずれ
accuracy が変わらない特徴が弱い、ラベルが誤り、モデルが学習していない
GPU OOMbatch size、入力長、モデルサイズ
結果が不安定random seed、データ不足、分割の不一致

RAG チェックリスト

  1. 文書は正しく分割されているか。
  2. 検索は正しい chunk を返すか。
  3. 回答に出典が含まれるか。
  4. 回答は本当に検索内容を使っているか。
  5. 権限フィルタと「答えられない」動作があるか。

Agent チェックリスト

  1. 単発 Q&A から始める。
  2. ツールを 1 つ追加する。
  3. 厳密なパラメータ schema を追加する。
  4. ログと trace 再生を追加する。
  5. 権限境界と停止条件を追加する。

Prompt テンプレート

あなたは ____ です。
あなたのタスクは ____ です。
入力:
出力形式:
制約:
情報が不足している場合は明確にそう言ってください。

最小訓練ループ

data = [(1.0, 2.0), (2.0, 4.0), (3.0, 6.0)]
w = 0.0
lr = 0.01

for epoch in range(3):
total_loss = 0.0
for x, y in data:
pred = w * x
error = pred - y
total_loss += error * error
grad = 2 * error * x
w -= lr * grad
print(f"epoch={epoch} w={w:.3f} loss={total_loss:.3f}")

期待される出力:

epoch=0 w=0.521 loss=48.630
epoch=1 w=0.907 loss=26.580
epoch=2 w=1.192 loss=14.528

データ -> 予測 -> 損失 -> 勾配 -> パラメータ更新、の順に読みます。