用白話文解釋 CoT(Chain of Thought)

用白話文解釋 CoT(Chain of Thought)

什麼是 CoT(Chain of Thought)?

如果你在網路上看到某些 Prompt 教學,告訴你要在提示詞內加入 "think step by step",這就是 CoT 的典型用法!

如果用比較學術的解釋來說,CoT 是一種 提升大型語言模型(LLM)推理能力的技術,它讓模型在回答問題時像人類一樣逐步思考,而不是直接給出答案。

隨著 LLM 的演進,CoT 可能變得不再必要。在較新的 Reasoning 模型(如 o1、o3-mini、DeepSeek R1)上,使用 CoT 不一定能提高答案品質,甚至可能影響推理效果。這些模型已內建強大的推理能力,不需要額外的「一步步思考」提示。

GPT 模型 vs. Reasoning 模型

目前,OpenAI 主要推出兩大類 LLM 模型:

  1. GPT 系列模型(如 GPT-4o):適合 執行任務,如寫作、翻譯、內容生成、程式碼撰寫。
  2. Reasoning 模型(如 o1、o3-mini):適合 深度推理與決策,用於複雜任務,如財務分析、法律判斷、策略規劃等。

以下是這兩種模型的差異整理:

比較項目 GPT 模型(如 GPT-4o) Reasoning 模型(如 o1、o3-mini)
主要特性 執行明確定義的任務,高速且成本較低 深度推理與決策,適用於複雜與模糊問題
適用場景 內容生成、翻譯、聊天、程式碼撰寫 計劃、決策、跨多文件推理、財務/法律分析
推理能力 基礎推理,適用於單步問題(可用 CoT 改善) 高級推理,適用於多步與模糊問題(不需 CoT 提示)
適合的問題類型 簡單、明確的問題(如 FAQ、自動回覆) 需要深入分析與綜合判斷的問題(如法律、金融建議)
計算成本 低成本,適合大規模應用 較高成本,但適合高精度決策
運行速度 相對較慢,但決策更可靠
決策可靠性 可能生成錯誤答案,適合非關鍵應用 高可靠性,適合財務、法律、醫療等專業領域
處理大數據能力 可處理大數據但較弱於整合資訊 擅長分析大量非結構化資訊,找出關鍵點
應用於 AI Workflow 適合具體任務執行(如回應、總結) 適合規劃與決策(如戰略分析、風險評估)
視覺處理 可處理一般圖片與圖表 o1 具更強視覺推理能力,如建築圖、低品質圖像
適用於多步推理 需要 CoT 提示來「一步步思考」 內建推理能力,不需 CoT
適合的使用案例 寫作、翻譯、客服、社群媒體管理 財務分析、法律推理、科學研究、策略規劃、複雜程式碼審查

CoT(Chain of Thought)還適用嗎?

你可能會問:「所以,我應該在 Prompt 內加上 CoT 嗎?

這取決於 使用的 LLM 類型:

  • GPT-4o 這類「執行型」模型,CoT 仍然有效,能幫助它在數學推理、邏輯推理等任務上表現更好。
  • o1、o3-mini 這類「推理型」模型,內建推理能力,不需要 CoT,反而可能影響效能。

何時使用 CoT?

適用情境

  • 需要 AI 詳細解釋推理過程(如教育、法律分析)。
  • 讓 AI 展示計算步驟,方便用戶檢查答案(如數學題、決策分析)。
  • 提升 GPT-4o 的推理能力,避免它直接猜測答案。

不適用情境

  • o1、o3-mini 已內建推理能力,不需要 CoT 提示。
  • 簡單任務(如翻譯、內容總結),CoT 反而讓回應變冗長,無助於提高準確度。

結論

隨著 AI 技術的進步,過去的 Prompting 技巧不一定適用於新模型,因此在設計 Prompt 時,應根據 模型特性 來選擇最佳策略!

Read more

Cursor Rules 教學:如何讓 AI 更理解你的開發需求?

Cursor Rules 教學:如何讓 AI 更理解你的開發需求?

不論你是剛開始學習AI寫程式的小白,或是早就有開發經驗的工程師,應該都有聽過,或是正在使用 Cursor。除了AI自動補全程式碼功能之外,其實還有一個小細節,可以大幅提升AI 產code的品質。 Cursor Rules 是什麼? Cursor Rules 是一組自訂指令,用來引導 Cursor 搭配的LLMs。它能夠調整 AI 在解讀程式碼、提供建議和回應時的行為,你可以想像成是一種引導AI的 prompt 或指示。 如何建立與使用 Cursor Rules? 你可以透過兩種方式來建立 Cursor Rules: 1. Project Rules:這也是Cursor團隊推薦的作法 2. Global Rules:在 Cursor 設定中的 「General」 > 「Rules for AI」 進行設定。 * Semantic Descriptions: 每條規則都可以包含什麼時候應該使用的描述

By Reynold Cheng
還在每天手動分類信件? 來試試信件分類自動化!

還在每天手動分類信件? 來試試信件分類自動化!

收件匣雜亂問題讓人好困擾 看到喜歡的寫作內容和電子報,隨手訂閱起來,但過了幾個月發現信箱怎麼一團亂,有時工作一繁忙根本就沒空去一一閱讀和分類。但又不忍心按下退訂,總想著有一天會去把這些電子報看完🤪 沒關係,你不孤單,其實大家都是這樣。 為了解決這個問題,我花了半小時 快速用 Google Apps Script (GAS) 寫了一個郵件自動標籤分類功能。 Source Code 也開放出來,只需複製貼上到你的 GAS, 找到 emailRules 這個變數,改成你訂閱的電子報即可。 更進階的應用,可以設定成每天或每周定期自動執行 這個功能可以解決哪些問題呢? 1. 郵件分類管理 * 根據發件人 Email 地址,自動將郵件分配到特定標籤 2. 減少收件匣混亂 * 分類後自動封存 (Archive),避免收件匣累積過多郵件 3. 支援多標籤分類 * 一封

By Reynold Cheng
主觀選擇 vs 客觀必然

主觀選擇 vs 客觀必然

工作流程自動化的需求,究竟是 主觀的選擇 還是客觀的必然? 但不論是哪一種,最好不要抱持著 "我是為了你好"的心態 而是需要站在對方的立場去思考,覺得不需要自動化的人,心裡會怎麼想? 主觀的選擇 ↓↓↓ 1. 我多花點時間就可以處理,沒必要自動化 2. 學習自動化的時間 > 省下的時間 3. 改變帶來的不確定性,例如怕效率提高會被賦予更多工作 客觀的必然 ↓↓↓ 1. 是否存在大量重複性的工作 & 任務 ex. 例如財務報表的對帳與審核 2. 是否會隨公司的營業規模擴大而變成瓶頸? ex. 廣告數據分析,當需要整理的後台投廣數據從 10 個變成 100 個 💡在「主觀的選擇」與「客觀的必然」之間找到共同交集, 才能讓習慣手動作業的人,接受不同的作法。 方法: 1. 量化時間成本

By Reynold Cheng
如何看待政府推出AI應用規劃師證照?

如何看待政府推出AI應用規劃師證照?

從政府角度來看,推出AI應用規劃師證照是為了建立產業標準, 加速台灣產業的數位轉型。這與過去推動資訊專業人員證照的 思維相似,希望通過標準化認證來提升整體產業競爭力。 但在資訊領域,證照往往難以跟上技術演進的速度。從資訊從業人員的角度來看,實務經驗和解決問題的能力才是核心價值。 一個優秀的軟體工程師,更重視的是實際專案經驗、 技術社群參與度,以及開源貢獻。就像GitHub的commit紀錄,往往比任何證照更能說明一個工程師的實力。這也是為什麼Google、Meta等科技公司的面試,著重在實作能力而非證照。 對想轉職AI領域的在職者來說,最關心的不外乎是這張證照能為 職涯帶來什麼? 回顧過去,TQC等企業人才認證最終淪為形式,對薪資和職涯幫助有限。原因在於這類證照往往只能驗證基礎操作能力,無法反映實際工作所需的問題解決能力。以台灣證照發展史來看,真正有價值的認證,都具備三個特質: 與實務緊密連結、有持續更新機制、獲得業界廣泛認可。 工程師證照之所以維持其地位,正是因為它確實反映了專業能力,且具有法規約束力。相比之下,純技能認證往往曇花一現。 AI應用規劃師證照若要避免成為另一

By Reynold Cheng