Module 2 / AI 管理學認證課程

召聘 AI 成員,選對模型

從「一個 ChatGPT 打天下」到「每個 AI 成員各司其職」——學會定義職責、選配模型、跑完召聘流程,並建立你的第一個 AI 子代理人。

約 100 分鐘
4 堂課 + 1 個實作練習
完成後取得 Module 2 徽章
2.1
一個 AI 成員需要什麼?職責設計的三個問題
在召聘任何 AI 成員之前,你必須先回答三個問題。少答一個,這個成員就會在某個地方讓你失望。

核心概念

「召聘 AI 成員」不是把 ChatGPT 打開就算。它需要你事先設計好這個成員的輸出是什麼、不做什麼、誰來把關
沒有設計,AI 就會填滿所有空白——而它填的,通常不是你真正需要的。

Module 1 我們學了 ABCDE 任務分類和委派決策樹。你現在知道哪些任務可以交給 AI 做。但「能做」和「做得好、可持續」之間,還有一個關鍵步驟:職責設計

人類新進員工入職時,你會給他一份工作說明書——寫清楚他負責什麼、不負責什麼、工作成果由誰評鑑。AI 成員也一樣。沒有這份設計,他會做出他認為你需要的東西,而不是你實際需要的東西。

三個核心問題

Q1
具體輸出是什麼?
這個 AI 成員每次完成任務,應該交付什麼?

好的答案:「一份 600 字的競品分析摘要,格式為 Markdown,含執行摘要和 3 個行動建議」
壞的答案:「幫我分析競品」

輸出越具體,成員越穩定。「幫我做行銷」讓 AI 每次做出不同的東西;「每週一早上 9 點前,產出一份 5 個 Instagram 貼文構想,每個含圖片描述和文字稿」讓 AI 的工作可以累積、可以比較、可以改善。
Q2
邊界在哪裡?
這個成員不做什麼?邊界的設計和職責的設計同樣重要。

為什麼邊界比你想的更重要:AI 不知道什麼時候「停下來問你」——除非你告訴它。如果你的研究 AI 沒有明確的邊界,它可能開始替你起草 email、修改你的策略文件、對外做承諾——而這些你可能根本不知道。

邊界設計範例:
  • 研究 AI:「只負責資料蒐集和摘要,不負責做策略建議或做決定」
  • 行銷文案 AI:「只負責產出初稿,不直接發布到任何平台」
  • 客服 AI:「只回答產品功能問題,涉及退款、法律糾紛立即轉人工」
Q3
誰來驗收品質?
AI 的輸出需要一個人類品質守門人(Quality Gatekeeper)。這不是不信任 AI——而是 AI 不知道它不知道的事。

驗收設計包含三件事:
  1. 誰驗收:是你本人、你的同事、還是另一個 AI 成員?(對,AI 可以驗收 AI 的工作)
  2. 驗收什麼:格式是否符合?內容是否正確?邏輯是否合理?
  3. 通過標準是什麼:不合格的輸出進入什麼流程?退回修改還是人工接手?

三個問題的完整範例:研究 AI

Q1 具體輸出
每次任務交付一份 Markdown 格式研究摘要,長度 400–800 字,包含:
・資料來源清單(至少 3 個可驗證來源)
・核心發現 3–5 點(條列式)
・與上次報告的比較(如有)
・不確定或需要人工確認的項目標注
Q2 邊界
做:資料蒐集、閱讀文件、摘要整理、數字查核
不做:策略建議、決定優先順序、對外溝通、修改其他成員的工作產出
遇到不確定時:在報告中標注「需要確認」,不自行推斷
Q3 驗收
驗收人:J董(初期)→ 品質稽查 AI(成熟後)
驗收項目:來源可驗證、格式符合、沒有幻覺事實
不合格處理:退回並附修正說明,最多重試兩次後交人工

常見錯誤:職責太廣的成員

真實錯誤 · 「全能 AI 助理」的陷阱

很多人第一個 AI 成員叫做「我的 AI 助理」,職責是「幫我做所有事」。這等於請了一個員工,他的工作說明書是空白的。

結果是:他不知道該主動做什麼,只能等你每次指揮。你節省的時間很有限,因為你還是要每次想清楚「我要它做什麼」。

正確做法:從你最常重複、最容易定義輸出的任務開始——那才是第一個 AI 成員的職責。等你建立了一個穩定的成員,再召聘第二個。

✎ 實作練習 · 30 分鐘

定義你的第一個 AI 成員

選一件你每週或每月都需要做一次的工作(A 類或 B 類任務效果最好),用下面三個問題設計你的第一個 AI 成員:

  1. Q1 具體輸出:寫下這個成員每次完成任務,應該交付什麼(格式、長度、結構)
  2. Q2 邊界:列出 3 件這個成員「不做」的事,以及遇到邊界情境時的處理方式
  3. Q3 驗收:決定由誰驗收、驗收什麼、不合格怎麼辦

這份設計文件就是你的「AI 成員職責說明書」,Lesson 2.3 的召聘流程會用到它。

2.2
模型選配決策框架(Opus vs Sonnet vs Haiku / Claude vs GPT vs Gemini)
不同模型不是強弱之分,而是適用場景不同——用錯模型,不是浪費錢就是浪費時間,或者兩者都浪費。

先說「錯誤的做法」

最常見的錯誤

「我所有事情都用 ChatGPT」——這就像公司所有事情都請同一個人做:查資料、寫合約、寫程式、接客服電話、處理財務。這個人可能很厲害,但他會成為你的瓶頸,而且你為此付出的成本遠超過分工的方式。

模型選配不是「哪個最好」,而是「哪個最適合這個任務」。一個每次回答都需要深度推理的模型處理「幫我查今天天氣」,就是資源浪費;一個快速輕量的模型去分析複雜的法律合約風險,就是結果不可靠。

三層模型框架

你可以把 Claude 的模型家族理解為三個不同的員工:

Heavy Thinker
Opus
claude-opus-4.7
深度推理,複雜判斷
需要跨領域推理、長文件理解、嚴謹邏輯判斷、品質稽查的任務。把它想成你的首席分析師:慢、貴,但在複雜問題上無可替代。
成本最高 · 速度較慢
Everyday Executive
Sonnet
claude-sonnet-4.6
日常執行,工具呼叫
大多數工作任務的最佳選擇。工具呼叫穩定、程式能力強、文字品質夠好、速度合理。把它想成你的執行副總:什麼都能做,大多數情況下夠好。
成本中等 · 速度平衡
Speed Runner
Haiku
claude-haiku-4.5
快速查詢,高頻簡單任務
你需要大量、高頻、格式化的輸出時,Haiku 是成本最低的選擇。把它想成你的行政助理:快速、便宜,不適合需要深思熟慮的工作。
成本最低 · 速度最快

任務類型 × 模型選配速查表

任務類型 建議模型 原因
政府開放資料分析
抓資料 + 摘要 + 比較
Sonnet 4.6 工具呼叫穩定(MCP 工具多次呼叫不容易出錯),速度夠快,品質適合報告等級
策略文件、合約草稿
需要嚴謹推理
Opus 4.7 合約用詞的細微差異、策略選項的利弊分析,需要 Opus 等級的深度推理能力
行銷文案、outreach 信件
說服力 + 品牌聲音
Sonnet 4.6 文字品質夠、速度快、成本合理,批量產出時 Haiku 也可考慮
程式碼開發、部署腳本
穩定性最重要
Sonnet 4.6 程式能力最穩定的 Claude 版本,工具使用準確率高,debug 流程完整
快速查詢、格式化摘要
高頻、簡單、批量
Haiku 4.5 成本最低、速度最快,適合不需要深度思考的標準化任務
品質稽查、監察長角色
審查其他 AI 的輸出
Opus 4.7 最嚴謹的判斷力,能發現 Sonnet 漏掉的邏輯問題和事實錯誤

Claude vs GPT-4o vs Gemini:什麼時候用什麼?

這個問題的答案沒有一刀切,但有幾個實用判斷點:

情境 建議選擇 原因
需要整合到 Claude Code / MCP 工具鏈 Claude Claude Code 生態系整合最好,工具呼叫、agent 框架、子代理人都是原生支援
需要即時上網查詢(Search 功能) GPT-4o / Gemini Claude 目前沒有原生即時搜尋,需要搭配 WebSearch 工具;GPT-4o 有內建 Bing 搜尋
大規模 Google Workspace 整合(Docs/Sheets) Gemini Gemini 在 Google 生態系的整合深度是競品無法比的
長文件(100 頁以上)分析 Claude Opus 200K token 上下文,長文件閱讀和引用準確率最高
多模態(圖片分析、文件掃描) Claude / GPT-4o 兩者都支援,選取決於其他整合需求

實用原則:如果你是在 Claude Code 生態系工作,優先用 Claude;如果需要特定平台整合,選對應的模型。
不要為了「試試看哪個比較好」而不斷切換——在你的工作流程穩定之前,保持一致性比追求最優更重要。

✎ 實作練習 · 20 分鐘

為你的 5 個任務選配模型

從你的工作清單中選出 5 個任務(可以用 Module 1 的 ABCDE 分類結果),對每個任務回答:

  1. 任務是什麼?(一句話描述)
  2. 選哪個模型?(Opus / Sonnet / Haiku + 選哪個廠商)
  3. 選擇原因?(對照上面的選配表,寫出你的理由)

特別注意:如果你的 5 個任務都選了 Opus,表示你對 Opus 的理解可能有偏差。大多數日常任務用 Sonnet 已經夠好——保留 Opus 給真正需要深度推理的工作。

2.3
召聘流程:五步驟從「有需求」到「新成員上線」
什麼時候該召聘新成員?怎麼在 15 分鐘內完成設定?以及新成員上線後的前三次任務該怎麼跑?

核心概念

召聘新 AI 成員的決定不應該隨便——但也不應該拖太久。三個觸發條件告訴你什麼時候該行動,五步驟流程讓你從需求到上線控制在一天之內。

三個召聘觸發條件

如果你符合以下任一條件,表示你需要召聘新的 AI 成員:

T1
同一任務重複超過 3 次
任何你做了 3 次以上的任務,都應該問自己:「這個可以設計成 AI 成員的職責嗎?」

真實例子:J董發現自己每週都要花 2 小時整理政府標案公告,做了三週之後,建立了「標案掃描 AI」——它現在每週自動跑,J董只需要 10 分鐘確認。
T2
現有成員「角色偏離」超過 30%
當你發現你的 AI 成員開始做越來越多「超出原本職責」的工作,這是一個警訊。

真實例子:行銷文案 AI 開始幫你回客戶問題、分析競品、找供應商聯絡方式——這些都不是它該做的事。正確做法:把這些新工作另外設計成獨立的成員職責,而不是讓一個成員無限擴張。
T3
需要特定工具組合
某些任務需要特定的工具搭配(例如:同時需要 WebSearch + 資料庫查詢 + 文件生成),如果沒有專屬成員設定這個工具組合,每次你都要重新設定。

真實例子:明察的「情報研究 AI」被設定為同時擁有 Twinkle Hub MCP(政府開放資料)+ WebSearch + 文件生成工具,這個工具組合讓它能完成完整的情報研究任務。

五步驟召聘流程

1
定義職責
用 Lesson 2.1 的三個問題:輸出是什麼?邊界在哪裡?誰來驗收?
時間目標:15 分鐘。如果你花超過 15 分鐘還沒想清楚,表示這個任務還沒成熟到可以召聘——先手動做幾次,再來設計。
2
選定模型
用 Lesson 2.2 的選配表,決定這個成員用哪個模型。
預設選擇:大多數日常任務從 Sonnet 4.6 開始,有特殊需求(深度推理 → Opus / 高頻低複雜 → Haiku)再調整。
3
設定工具範圍
這個成員需要哪些工具?只給必要的工具,不要給「可能用到的」工具。
工具越少越好:工具越多,成員越容易誤用工具,輸出越難預測。
4
寫系統提示(System Prompt)
系統提示是這個成員的「工作說明書」。它定義了成員的角色、工作方式、邊界、輸出格式。
Lesson 2.4 有完整的系統提示範例和模板。
5
更新團隊名冊 + 跑前三次任務
把新成員加入你的 AI 團隊名冊(你知道你有哪些成員、各自的職責)。
前三次任務的重要性:新成員需要 2–3 次真實任務來校準輸出品質。第一次可能有格式問題、邊界問題——這是正常的,紀錄下來,調整系統提示,讓它第三次就穩定。

Claude Code Subagent 的設定格式

在 Claude Code 中,AI 子代理人(Subagent)以 YAML frontmatter 格式定義,儲存在 ~/.claude/agents/ 目錄中。

~/.claude/agents/research-agent.md YAML + Markdown
---
name: 研究 AI
description: 政府開放資料研究與情報整理專員。
           負責蒐集、閱讀、摘要各類政府開放資料,
           輸出結構化 Markdown 研究報告。
model: claude-sonnet-4-6
tools:
  - WebSearch
  - Read
  - mcp__twinkle-hub__opendata-search_datasets
  - mcp__twinkle-hub__opendata-query_rows
---

# 研究 AI — 工作說明書

你是明察(Mingcha)的情報研究專員,專責政府開放資料蒐集與整理。

## 核心職責
- 根據指定主題,搜尋並閱讀相關政府開放資料
- 整理成結構化 Markdown 格式研究摘要
- 標注每個數據點的來源(資料庫名稱 + 查詢日期)

## 輸出格式(每次都必須遵守)
1. **執行摘要**(200–300 字)
2. **核心發現**(3–5 個條列,每條含來源)
3. **數據附表**(如有)
4. **待確認項目**(你不確定的資料標注在這裡)

## 邊界(你不做的事)
- 不做策略建議或決策
- 不修改其他成員的輸出
- 不對外發送任何資料
- 遇到不確定的資訊,標注「待確認」而不是推斷

## 品質標準
- 每個數字都必須有來源可查
- 報告長度 400–800 字(不含附表)
- 如果找不到可靠來源,明確說明「未找到可靠資料」
⚠ 常見錯誤 · 職責太廣的成員

不要在一個成員身上放超過 5–6 個工具,也不要讓一個成員「什麼都做」。一個有 20 個工具、職責橫跨研究/文案/程式/客服的成員,不會比 4 個各司其職的成員更有效率——它只會更難管理、更難除錯、更難預測。

✎ 實作練習 · 使用 Lesson 2.1 的設計

完成你的第一個召聘流程設計

用 Lesson 2.1 中你設計的 AI 成員職責說明書,跑完召聘流程的前四步:

  1. Step 1(職責):直接使用你在 Lesson 2.1 完成的三問設計
  2. Step 2(模型):根據 Lesson 2.2 的選配表,決定用哪個模型
  3. Step 3(工具):列出這個成員需要的工具(最多 5 個)
  4. Step 4(系統提示):用上面的代碼範本,寫出你的成員設定檔

Step 5(跑前三次任務)會在 Lesson 2.4 完成。

2.4
實作:建立你的第一個 AI 子代理人(Subagent)
從零開始,一步一步建立一個「研究 AI」——包含完整的成員定義文件、工具配置、第一次任務委派,以及你自己的自定義版本。

核心概念

建立第一個 Subagent 最重要的不是技術細節,而是「第一次任務要足夠簡單」
過於複雜的首次任務會讓你在分不清「是設定有問題還是任務本身太難」中耗費時間。從一個你完全熟悉的任務開始,確認成員的行為符合預期,再往更複雜的方向走。

Step-by-Step:建立「研究 AI」

1
建立 agents 資料夾
在你的 Claude Code 環境中,確認 ~/.claude/agents/ 目錄存在。如果沒有,建立它。

這個目錄是所有 AI 子代理人定義的家。每個 .md 文件就是一個成員。
2
建立成員定義文件
建立 ~/.claude/agents/research-agent.md,貼入以下完整的成員定義:
~/.claude/agents/research-agent.md 完整版
---
name: 研究 AI
description: 網路資料研究與摘要專員。使用 WebSearch 工具
           查詢最新資訊,整理成結構化報告交付。
           適用情境:競品研究、產業趨勢、法規查詢、
           背景資料蒐集。
model: claude-sonnet-4-6
tools:
  - WebSearch
  - Read
---

# 研究 AI

你是一個專業的研究助理,擅長快速查詢資訊並整理成清晰的報告。

## 你的工作方式

接到研究任務後,你會:
1. 先確認研究範圍和目標(如果不清楚,先問)
2. 使用 WebSearch 查詢相關資訊(至少查 3 個不同來源)
3. 閱讀重要頁面的完整內容(使用 Read 工具)
4. 整理成結構化報告

## 輸出格式

每次都必須按以下格式輸出:

```
# [研究主題]

## 執行摘要
(2–3 段,說明主要發現)

## 核心發現
- 發現 1(來源:URL)
- 發現 2(來源:URL)
- 發現 3(來源:URL)

## 重要數字 / 數據
(表格或條列)

## 待確認項目
(你不確定或找不到來源的資訊)

## 建議延伸閱讀
(3–5 個相關連結)
```

## 你的邊界

- **不做**:策略建議、決策判斷、對外溝通
- **不推斷**:找不到可靠來源時,說「未找到可靠資料」,不要猜
- **不擴散**:只完成被要求的研究範圍,不自行擴展到「相關議題」

## 品質標準

- 所有數字必須有來源
- 報告交付後,在最後標注「研究完成時間」和「查詢的主要來源數量」
3
委派第一個任務(要夠簡單)
在 Claude Code 中,用以下方式召喚你的研究 AI:

Use the 研究 AI to research: 台灣 2025 年寵物產業市場規模,查詢最新統計數字和主要來源。
Claude Code 的 orchestrator 會找到你的研究 AI 定義,啟動子代理人執行任務,並回傳結果。
4
驗收輸出,調整設定
第一次任務完成後,檢查輸出:
  • 格式是否符合你定義的模板?(如果不符,在系統提示中更明確說明)
  • 來源引用是否正確?(點幾個連結確認)
  • 有沒有超出邊界的行為?(做了你說「不做」的事?)

根據觀察調整系統提示,再跑第二次任務確認改善。
5
加入你的 AI 團隊名冊
建議在你的筆記系統(Notion、Obsidian 或任何你慣用的工具)建立一個「AI 團隊名冊」頁面,記錄:
  • 成員名稱
  • 職責一句話描述
  • 使用的模型
  • 設定文件位置
  • 召聘日期
  • 最近一次使用日期

真實任務委派範例

J董真實案例 · 研究 AI 第一次任務

委派指令:「Use the 研究 AI to research: 台灣 2025 年餐飲業 AI 應用現況——包含哪些連鎖品牌已導入 AI、使用哪些工具、有哪些政府補助可以申請。需要至少 5 個來源,重點是補助資訊要確認是否還在申請期限內。」

輸出時間:約 4 分鐘

輸出內容:一份 800 字的結構化報告,包含 6 個來源連結、3 個補助方案(含截止日期)、8 個已導入 AI 的連鎖品牌案例。

J董的時間投入:寫委派指令 3 分鐘 + 驗收輸出 10 分鐘 = 13 分鐘(這份研究如果自己做,至少需要 90 分鐘)。

建立你自己的第一個 Subagent

不要用「研究 AI」作為你的第一個 Subagent(那是練習用的)。用你在 Lesson 2.1 設計的成員職責,建立你自己的第一個 AI 成員。

用以下模板作為起點,把括號內的內容替換成你自己的設計:

~/.claude/agents/[你的成員名稱].md 模板
---
name: [成員名稱,例如:行銷文案 AI / 標案掃描 AI]
description: [一句話描述這個成員做什麼、什麼情況下應該被召喚]
model: [claude-sonnet-4-6 / claude-opus-4-7 / claude-haiku-4-5]
tools:
  - [工具 1]
  - [工具 2,最多 5 個]
---

# [成員名稱]

[一段描述這個成員的角色和背景]

## 核心職責
[條列式,3–5 個]

## 輸出格式
[詳細說明每次任務完成後,應該交付什麼格式的輸出]

## 邊界(不做的事)
[條列式,至少 3 個]

## 品質標準
[這個成員的輸出達到什麼水準才算合格]
✎ Module 2 最終實作

建立你自己的第一個 AI Subagent 並跑完第一次任務

  1. 建立設定文件:用你在 Lesson 2.1–2.3 完成的設計,建立 ~/.claude/agents/[你的成員].md
  2. 跑第一次任務:選一個你真實工作中會用到的任務,委派給這個新成員
  3. 記錄驗收結果:輸出哪裡符合預期?哪裡需要調整?
  4. 調整系統提示後再跑一次:確認第二次輸出有改善
  5. 建立你的 AI 團隊名冊:把這個成員加入你的名冊,記錄職責和設定位置

認證版學員:提交你的成員設定文件 + 前兩次任務的輸出截圖,取得 Module 2 回饋和完成徽章。

🆘

Module 2 結業條件

完成以下四件事,即可取得「AI 管理學 Module 2 完成徽章」。認證版學員將獲得 J董的個人回饋。

  • 1
    職責設計練習:用三個問題(輸出/邊界/驗收)完成你的第一個 AI 成員職責說明書
  • 2
    模型選配練習:為你的 5 個任務選配模型,並寫出每個選擇的理由
  • 3
    召聘流程設計:完成五步驟流程的前四步(職責 + 模型 + 工具 + 系統提示)
  • 4
    Subagent 實作:建立你自己的第一個 AI 子代理人,跑完兩次任務並完成調整
提交作業 · 取得徽章 返回課程主頁
Coming Soon

Module 3:品質管控與監察機制

你已經建立了 AI 成員,知道如何委派任務。下一個問題是:如何確保他們的輸出品質持續達標?Module 3 教你設計 Checkpoint 系統,讓 AI 幫你管 AI。

  • AI 輸出品質為什麼參差?
  • Checkpoint 設計的三個層次
  • 用 Opus 擔任監察長,審查 Sonnet 的輸出
  • 何時需要人工介入的判斷框架

Module 3 預計 2026 年 Q3 開放,完成 Module 2 的學員將優先通知。

還沒報名完整課程?

Module 2 是免費試讀範圍。完整的 AI 管理學認證課程包含 5 個 Module、J董個人回饋、以及課程結束後的 AI 工作流程設計審查。