Lesson 2.1
2.1
一個 AI 成員需要什麼?職責設計的三個問題
在召聘任何 AI 成員之前,你必須先回答三個問題。少答一個,這個成員就會在某個地方讓你失望。
⌄
核心概念
「召聘 AI 成員」不是把 ChatGPT 打開就算。它需要你事先設計好這個成員的輸出是什麼、不做什麼、誰來把關。
沒有設計,AI 就會填滿所有空白——而它填的,通常不是你真正需要的。
Module 1 我們學了 ABCDE 任務分類和委派決策樹。你現在知道哪些任務可以交給 AI 做。但「能做」和「做得好、可持續」之間,還有一個關鍵步驟:職責設計。
人類新進員工入職時,你會給他一份工作說明書——寫清楚他負責什麼、不負責什麼、工作成果由誰評鑑。AI 成員也一樣。沒有這份設計,他會做出他認為你需要的東西,而不是你實際需要的東西。
三個核心問題
好的答案:「一份 600 字的競品分析摘要,格式為 Markdown,含執行摘要和 3 個行動建議」
壞的答案:「幫我分析競品」
輸出越具體,成員越穩定。「幫我做行銷」讓 AI 每次做出不同的東西;「每週一早上 9 點前,產出一份 5 個 Instagram 貼文構想,每個含圖片描述和文字稿」讓 AI 的工作可以累積、可以比較、可以改善。
為什麼邊界比你想的更重要:AI 不知道什麼時候「停下來問你」——除非你告訴它。如果你的研究 AI 沒有明確的邊界,它可能開始替你起草 email、修改你的策略文件、對外做承諾——而這些你可能根本不知道。
邊界設計範例:
- 研究 AI:「只負責資料蒐集和摘要,不負責做策略建議或做決定」
- 行銷文案 AI:「只負責產出初稿,不直接發布到任何平台」
- 客服 AI:「只回答產品功能問題,涉及退款、法律糾紛立即轉人工」
驗收設計包含三件事:
- 誰驗收:是你本人、你的同事、還是另一個 AI 成員?(對,AI 可以驗收 AI 的工作)
- 驗收什麼:格式是否符合?內容是否正確?邏輯是否合理?
- 通過標準是什麼:不合格的輸出進入什麼流程?退回修改還是人工接手?
三個問題的完整範例:研究 AI
・資料來源清單(至少 3 個可驗證來源)
・核心發現 3–5 點(條列式)
・與上次報告的比較(如有)
・不確定或需要人工確認的項目標注
不做:策略建議、決定優先順序、對外溝通、修改其他成員的工作產出
遇到不確定時:在報告中標注「需要確認」,不自行推斷
驗收項目:來源可驗證、格式符合、沒有幻覺事實
不合格處理:退回並附修正說明,最多重試兩次後交人工
常見錯誤:職責太廣的成員
很多人第一個 AI 成員叫做「我的 AI 助理」,職責是「幫我做所有事」。這等於請了一個員工,他的工作說明書是空白的。
結果是:他不知道該主動做什麼,只能等你每次指揮。你節省的時間很有限,因為你還是要每次想清楚「我要它做什麼」。
正確做法:從你最常重複、最容易定義輸出的任務開始——那才是第一個 AI 成員的職責。等你建立了一個穩定的成員,再召聘第二個。
定義你的第一個 AI 成員
選一件你每週或每月都需要做一次的工作(A 類或 B 類任務效果最好),用下面三個問題設計你的第一個 AI 成員:
- Q1 具體輸出:寫下這個成員每次完成任務,應該交付什麼(格式、長度、結構)
- Q2 邊界:列出 3 件這個成員「不做」的事,以及遇到邊界情境時的處理方式
- Q3 驗收:決定由誰驗收、驗收什麼、不合格怎麼辦
這份設計文件就是你的「AI 成員職責說明書」,Lesson 2.3 的召聘流程會用到它。
Lesson 2.2
2.2
模型選配決策框架(Opus vs Sonnet vs Haiku / Claude vs GPT vs Gemini)
不同模型不是強弱之分,而是適用場景不同——用錯模型,不是浪費錢就是浪費時間,或者兩者都浪費。
⌄
先說「錯誤的做法」
「我所有事情都用 ChatGPT」——這就像公司所有事情都請同一個人做:查資料、寫合約、寫程式、接客服電話、處理財務。這個人可能很厲害,但他會成為你的瓶頸,而且你為此付出的成本遠超過分工的方式。
模型選配不是「哪個最好」,而是「哪個最適合這個任務」。一個每次回答都需要深度推理的模型處理「幫我查今天天氣」,就是資源浪費;一個快速輕量的模型去分析複雜的法律合約風險,就是結果不可靠。
三層模型框架
你可以把 Claude 的模型家族理解為三個不同的員工:
任務類型 × 模型選配速查表
| 任務類型 | 建議模型 | 原因 |
|---|---|---|
| 政府開放資料分析 抓資料 + 摘要 + 比較 |
Sonnet 4.6 | 工具呼叫穩定(MCP 工具多次呼叫不容易出錯),速度夠快,品質適合報告等級 |
| 策略文件、合約草稿 需要嚴謹推理 |
Opus 4.7 | 合約用詞的細微差異、策略選項的利弊分析,需要 Opus 等級的深度推理能力 |
| 行銷文案、outreach 信件 說服力 + 品牌聲音 |
Sonnet 4.6 | 文字品質夠、速度快、成本合理,批量產出時 Haiku 也可考慮 |
| 程式碼開發、部署腳本 穩定性最重要 |
Sonnet 4.6 | 程式能力最穩定的 Claude 版本,工具使用準確率高,debug 流程完整 |
| 快速查詢、格式化摘要 高頻、簡單、批量 |
Haiku 4.5 | 成本最低、速度最快,適合不需要深度思考的標準化任務 |
| 品質稽查、監察長角色 審查其他 AI 的輸出 |
Opus 4.7 | 最嚴謹的判斷力,能發現 Sonnet 漏掉的邏輯問題和事實錯誤 |
Claude vs GPT-4o vs Gemini:什麼時候用什麼?
這個問題的答案沒有一刀切,但有幾個實用判斷點:
| 情境 | 建議選擇 | 原因 |
|---|---|---|
| 需要整合到 Claude Code / MCP 工具鏈 | Claude | Claude Code 生態系整合最好,工具呼叫、agent 框架、子代理人都是原生支援 |
| 需要即時上網查詢(Search 功能) | GPT-4o / Gemini | Claude 目前沒有原生即時搜尋,需要搭配 WebSearch 工具;GPT-4o 有內建 Bing 搜尋 |
| 大規模 Google Workspace 整合(Docs/Sheets) | Gemini | Gemini 在 Google 生態系的整合深度是競品無法比的 |
| 長文件(100 頁以上)分析 | Claude Opus | 200K token 上下文,長文件閱讀和引用準確率最高 |
| 多模態(圖片分析、文件掃描) | Claude / GPT-4o | 兩者都支援,選取決於其他整合需求 |
實用原則:如果你是在 Claude Code 生態系工作,優先用 Claude;如果需要特定平台整合,選對應的模型。
不要為了「試試看哪個比較好」而不斷切換——在你的工作流程穩定之前,保持一致性比追求最優更重要。
為你的 5 個任務選配模型
從你的工作清單中選出 5 個任務(可以用 Module 1 的 ABCDE 分類結果),對每個任務回答:
- 任務是什麼?(一句話描述)
- 選哪個模型?(Opus / Sonnet / Haiku + 選哪個廠商)
- 選擇原因?(對照上面的選配表,寫出你的理由)
特別注意:如果你的 5 個任務都選了 Opus,表示你對 Opus 的理解可能有偏差。大多數日常任務用 Sonnet 已經夠好——保留 Opus 給真正需要深度推理的工作。
Lesson 2.3
2.3
召聘流程:五步驟從「有需求」到「新成員上線」
什麼時候該召聘新成員?怎麼在 15 分鐘內完成設定?以及新成員上線後的前三次任務該怎麼跑?
⌄
核心概念
召聘新 AI 成員的決定不應該隨便——但也不應該拖太久。三個觸發條件告訴你什麼時候該行動,五步驟流程讓你從需求到上線控制在一天之內。
三個召聘觸發條件
如果你符合以下任一條件,表示你需要召聘新的 AI 成員:
真實例子:J董發現自己每週都要花 2 小時整理政府標案公告,做了三週之後,建立了「標案掃描 AI」——它現在每週自動跑,J董只需要 10 分鐘確認。
真實例子:行銷文案 AI 開始幫你回客戶問題、分析競品、找供應商聯絡方式——這些都不是它該做的事。正確做法:把這些新工作另外設計成獨立的成員職責,而不是讓一個成員無限擴張。
真實例子:明察的「情報研究 AI」被設定為同時擁有 Twinkle Hub MCP(政府開放資料)+ WebSearch + 文件生成工具,這個工具組合讓它能完成完整的情報研究任務。
五步驟召聘流程
時間目標:15 分鐘。如果你花超過 15 分鐘還沒想清楚,表示這個任務還沒成熟到可以召聘——先手動做幾次,再來設計。
預設選擇:大多數日常任務從 Sonnet 4.6 開始,有特殊需求(深度推理 → Opus / 高頻低複雜 → Haiku)再調整。
工具越少越好:工具越多,成員越容易誤用工具,輸出越難預測。
Lesson 2.4 有完整的系統提示範例和模板。
前三次任務的重要性:新成員需要 2–3 次真實任務來校準輸出品質。第一次可能有格式問題、邊界問題——這是正常的,紀錄下來,調整系統提示,讓它第三次就穩定。
Claude Code Subagent 的設定格式
在 Claude Code 中,AI 子代理人(Subagent)以 YAML frontmatter 格式定義,儲存在 ~/.claude/agents/ 目錄中。
--- name: 研究 AI description: 政府開放資料研究與情報整理專員。 負責蒐集、閱讀、摘要各類政府開放資料, 輸出結構化 Markdown 研究報告。 model: claude-sonnet-4-6 tools: - WebSearch - Read - mcp__twinkle-hub__opendata-search_datasets - mcp__twinkle-hub__opendata-query_rows --- # 研究 AI — 工作說明書 你是明察(Mingcha)的情報研究專員,專責政府開放資料蒐集與整理。 ## 核心職責 - 根據指定主題,搜尋並閱讀相關政府開放資料 - 整理成結構化 Markdown 格式研究摘要 - 標注每個數據點的來源(資料庫名稱 + 查詢日期) ## 輸出格式(每次都必須遵守) 1. **執行摘要**(200–300 字) 2. **核心發現**(3–5 個條列,每條含來源) 3. **數據附表**(如有) 4. **待確認項目**(你不確定的資料標注在這裡) ## 邊界(你不做的事) - 不做策略建議或決策 - 不修改其他成員的輸出 - 不對外發送任何資料 - 遇到不確定的資訊,標注「待確認」而不是推斷 ## 品質標準 - 每個數字都必須有來源可查 - 報告長度 400–800 字(不含附表) - 如果找不到可靠來源,明確說明「未找到可靠資料」
不要在一個成員身上放超過 5–6 個工具,也不要讓一個成員「什麼都做」。一個有 20 個工具、職責橫跨研究/文案/程式/客服的成員,不會比 4 個各司其職的成員更有效率——它只會更難管理、更難除錯、更難預測。
完成你的第一個召聘流程設計
用 Lesson 2.1 中你設計的 AI 成員職責說明書,跑完召聘流程的前四步:
- Step 1(職責):直接使用你在 Lesson 2.1 完成的三問設計
- Step 2(模型):根據 Lesson 2.2 的選配表,決定用哪個模型
- Step 3(工具):列出這個成員需要的工具(最多 5 個)
- Step 4(系統提示):用上面的代碼範本,寫出你的成員設定檔
Step 5(跑前三次任務)會在 Lesson 2.4 完成。
Lesson 2.4
2.4
實作:建立你的第一個 AI 子代理人(Subagent)
從零開始,一步一步建立一個「研究 AI」——包含完整的成員定義文件、工具配置、第一次任務委派,以及你自己的自定義版本。
⌄
核心概念
建立第一個 Subagent 最重要的不是技術細節,而是「第一次任務要足夠簡單」。
過於複雜的首次任務會讓你在分不清「是設定有問題還是任務本身太難」中耗費時間。從一個你完全熟悉的任務開始,確認成員的行為符合預期,再往更複雜的方向走。
Step-by-Step:建立「研究 AI」
~/.claude/agents/ 目錄存在。如果沒有,建立它。這個目錄是所有 AI 子代理人定義的家。每個 .md 文件就是一個成員。
~/.claude/agents/research-agent.md,貼入以下完整的成員定義:
--- name: 研究 AI description: 網路資料研究與摘要專員。使用 WebSearch 工具 查詢最新資訊,整理成結構化報告交付。 適用情境:競品研究、產業趨勢、法規查詢、 背景資料蒐集。 model: claude-sonnet-4-6 tools: - WebSearch - Read --- # 研究 AI 你是一個專業的研究助理,擅長快速查詢資訊並整理成清晰的報告。 ## 你的工作方式 接到研究任務後,你會: 1. 先確認研究範圍和目標(如果不清楚,先問) 2. 使用 WebSearch 查詢相關資訊(至少查 3 個不同來源) 3. 閱讀重要頁面的完整內容(使用 Read 工具) 4. 整理成結構化報告 ## 輸出格式 每次都必須按以下格式輸出: ``` # [研究主題] ## 執行摘要 (2–3 段,說明主要發現) ## 核心發現 - 發現 1(來源:URL) - 發現 2(來源:URL) - 發現 3(來源:URL) ## 重要數字 / 數據 (表格或條列) ## 待確認項目 (你不確定或找不到來源的資訊) ## 建議延伸閱讀 (3–5 個相關連結) ``` ## 你的邊界 - **不做**:策略建議、決策判斷、對外溝通 - **不推斷**:找不到可靠來源時,說「未找到可靠資料」,不要猜 - **不擴散**:只完成被要求的研究範圍,不自行擴展到「相關議題」 ## 品質標準 - 所有數字必須有來源 - 報告交付後,在最後標注「研究完成時間」和「查詢的主要來源數量」
Use the 研究 AI to research: 台灣 2025 年寵物產業市場規模,查詢最新統計數字和主要來源。Claude Code 的 orchestrator 會找到你的研究 AI 定義,啟動子代理人執行任務,並回傳結果。
- 格式是否符合你定義的模板?(如果不符,在系統提示中更明確說明)
- 來源引用是否正確?(點幾個連結確認)
- 有沒有超出邊界的行為?(做了你說「不做」的事?)
根據觀察調整系統提示,再跑第二次任務確認改善。
- 成員名稱
- 職責一句話描述
- 使用的模型
- 設定文件位置
- 召聘日期
- 最近一次使用日期
真實任務委派範例
委派指令:「Use the 研究 AI to research: 台灣 2025 年餐飲業 AI 應用現況——包含哪些連鎖品牌已導入 AI、使用哪些工具、有哪些政府補助可以申請。需要至少 5 個來源,重點是補助資訊要確認是否還在申請期限內。」
輸出時間:約 4 分鐘
輸出內容:一份 800 字的結構化報告,包含 6 個來源連結、3 個補助方案(含截止日期)、8 個已導入 AI 的連鎖品牌案例。
J董的時間投入:寫委派指令 3 分鐘 + 驗收輸出 10 分鐘 = 13 分鐘(這份研究如果自己做,至少需要 90 分鐘)。
建立你自己的第一個 Subagent
不要用「研究 AI」作為你的第一個 Subagent(那是練習用的)。用你在 Lesson 2.1 設計的成員職責,建立你自己的第一個 AI 成員。
用以下模板作為起點,把括號內的內容替換成你自己的設計:
--- name: [成員名稱,例如:行銷文案 AI / 標案掃描 AI] description: [一句話描述這個成員做什麼、什麼情況下應該被召喚] model: [claude-sonnet-4-6 / claude-opus-4-7 / claude-haiku-4-5] tools: - [工具 1] - [工具 2,最多 5 個] --- # [成員名稱] [一段描述這個成員的角色和背景] ## 核心職責 [條列式,3–5 個] ## 輸出格式 [詳細說明每次任務完成後,應該交付什麼格式的輸出] ## 邊界(不做的事) [條列式,至少 3 個] ## 品質標準 [這個成員的輸出達到什麼水準才算合格]
建立你自己的第一個 AI Subagent 並跑完第一次任務
- 建立設定文件:用你在 Lesson 2.1–2.3 完成的設計,建立
~/.claude/agents/[你的成員].md - 跑第一次任務:選一個你真實工作中會用到的任務,委派給這個新成員
- 記錄驗收結果:輸出哪裡符合預期?哪裡需要調整?
- 調整系統提示後再跑一次:確認第二次輸出有改善
- 建立你的 AI 團隊名冊:把這個成員加入你的名冊,記錄職責和設定位置
認證版學員:提交你的成員設定文件 + 前兩次任務的輸出截圖,取得 Module 2 回饋和完成徽章。
Module 2 結業條件
完成以下四件事,即可取得「AI 管理學 Module 2 完成徽章」。認證版學員將獲得 J董的個人回饋。
-
1職責設計練習:用三個問題(輸出/邊界/驗收)完成你的第一個 AI 成員職責說明書
-
2模型選配練習:為你的 5 個任務選配模型,並寫出每個選擇的理由
-
3召聘流程設計:完成五步驟流程的前四步(職責 + 模型 + 工具 + 系統提示)
-
4Subagent 實作:建立你自己的第一個 AI 子代理人,跑完兩次任務並完成調整
Module 3:品質管控與監察機制
你已經建立了 AI 成員,知道如何委派任務。下一個問題是:如何確保他們的輸出品質持續達標?Module 3 教你設計 Checkpoint 系統,讓 AI 幫你管 AI。
- AI 輸出品質為什麼參差?
- Checkpoint 設計的三個層次
- 用 Opus 擔任監察長,審查 Sonnet 的輸出
- 何時需要人工介入的判斷框架
Module 3 預計 2026 年 Q3 開放,完成 Module 2 的學員將優先通知。
還沒報名完整課程?
Module 2 是免費試讀範圍。完整的 AI 管理學認證課程包含 5 個 Module、J董個人回饋、以及課程結束後的 AI 工作流程設計審查。