善用思維鏈,增進ChatGPT的提問效能


本文作者為鄭緯筌,原發表於《科技島

時序進入2024年,首先在此跟大家說聲新年快樂!我相信在過去這一年期間,大家對於ChatGPT、Bard或Claude這類生成式AI工具已經相當熟悉了!但是,如果問大家是否滿意ChatGPT提供的答案呢?我想,可能很多人會露出苦笑吧?

現在,讓我來跟你分享一個名為「思維鏈」(Chain of Thought,CoT)的提問技巧。簡單來說,這是一種讓機器人能夠學習像人一樣思考的方法。就像小時候在解決一道數學習題時,老師會教我們一步步地寫下解題過程一樣,而「思維鏈」則會讓機器人模仿這個推理的過程。

也就是說,如果你透過這種方式詢問ChatGPT一個複雜的數學問題,它會開始「思考」,一步步告訴你它是怎麼解題的,而不是直接跳到最終的答案。

這樣做,有兩個顯而易見的好處:首先,讓ChatGPT在面對真正複雜的問題時更有可能找到答案。其次,也讓我們更容易理解ChatGPT是怎麼想的?如果答案有錯,我們也可以更容易看出來,到底問題在哪裡?

這就好像當你跟一位朋友討論要去哪裡吃飯的時候,他也許很快就根據你的偏好和預算,推薦一家CP值頗高的餐廳給你。下次,當你再問他相關的問題時,他自然會基於上次的談話內容來提供建議。

根據維基百科的介紹,「思維鏈」又可稱為「思路鏈」,它是文本提示(Textual Prompting)的一種技術,該技術透過提示大型語言模型(Large Language Models,LLM)生成一系列中間步驟來提高其推理能力,這些中間步驟會導致多步驟問題的最終答案。該技術由Google公司的研究人員於2022年首次提出。

根據Google Brain團隊的研究科學家Jason Wei和Denny Zhou等人的研究,「思維鏈」在訓練大型語言模型和設計提問詞的過程中,得以發揮顯著的作用。

有些朋友可能聽過「提示工程」(Prompting Engineering)這個名詞,這是一種能夠讓ChatGPT等生成式AI工具更懂得如何回答問題的技術。它把問題以提示詞的形式提供給AI工具參考,不是單單只提供參數而已。如此一來,AI工具就可以直接從問題本身去學習。

科學家們發現,如果在提示詞裡加上類似「讓我們循序思考」(Let’s think step by step)這樣的語句,可以提高 ChatGPT等生成式AI工具在需要多步驟推理的問題上的表現。換句話說,這也就是所謂的「思維鏈」技術。

「思維鏈」讓AI工具在回答問題之前,先生成一系列的推理步驟,它的原理就像人腦在思考時的過程一樣。如此一來,就可以提升AI工具解決複雜問題的能力,尤其是面對需要思考推理或數學計算等問題。

設法擴大語言模型的規模,當然是一種技術的突破,然而這個過程不但漫長,通常也很花錢。所以,一群專家和學者們決定另闢蹊徑,設法透過「思維鏈」技術來有效提升ChatGPT等AI工具在複雜推理問題上的表現。它善於模擬人類思考的過程,足以讓AI工具的回答更容易被人理解。

「思維鏈」聽起來有點深奧,其實它指涉的是一系列與邏輯相關的思考步驟,只是我們把它串聯起來,形成一個完整的思維過程。

請你回想一下,當我們在生活中面對一些比較複雜的問題時,你會怎麼拆解跟處理呢?以我自己來說,我很喜歡使用「心智圖」(Mind Map)這種工具來全面地拆解思考步驟。比如,當你需要製作簡報或準備演講,我們會先把主題分解成相關的子題,然後針對每個子題逐步思考和落實細節,最後把所有想法組織起來,形成一個條理清晰的脈絡。這整個從分解到組織的過程,也就是一個思維鏈。

整體而言,「心智圖」是一種很適合用來拆解和重新建構知識的工具,而「思維鏈」同樣也是一個很棒的思維工具!所以,在學習提示詞設計的歷程中,我也建議你可以採用「思維鏈」的方法來提示大型語言模型的推理。

這種循序漸進的提問方式,更容易讓提問者檢驗大型語言模型的推理是否正確?即便在提問過程中出現錯誤,其實也不打緊,我們可以及時進行修正。

總之,運用「思維鏈」的概念來設計提示詞,就像是讓ChatGPT、Bard或Claude來做一道細緻的數理分析題,而不僅是簡單的填空題。它可以讓這些生成式AI工具詳細地展示推理過程和各個步驟的邏輯,進而提高其推理能力。

「思維鏈」的起源,可以追溯到古希臘時期的蘇格拉底式問答法,這種方法透過一系列問答深入探討主題。在現代,這種方法也廣泛被管理顧問、教育、心理學和科學研究等各種領域所採用。

「思維鏈」的特色,包括:

  • 連貫性:問題之間具有邏輯上的連貫性,每一個問題都建立在前一個問題的答案之上。
  • 深入性:透過一系列的問答,思維鏈允許深入探索一個問題的多個層面。
  • 靈活性:可以應用於幾乎任何類型的問題解決過程,不受主題或領域的限制。

「思維鏈」的重要性不言可喻,主要在於它提供了一種結構化的思考方式,能夠幫助人們更全面和深入地理解問題。這種方法特別適合於解決複雜問題,因為它鼓勵探索問題的不同角度,並能從中發現新的洞見和解決方案。

最後,讓我來舉一個職場中常見的案例,來幫助你理解「思維鏈」的應用方式。

假設王嘉華是一名想要創業的年輕人,他想使用 ChatGPT 來獲取有關開設新咖啡店的市場分析和建議。

他可以運用「思維鏈」的概念來跟ChatGPT提問:

  1. 開始提問:請問目前在臺北市中心的咖啡店市場情況如何?ChatGPT 可能提供有關臺北市中心咖啡店的數量、類型和一般客流量的資訊。
  2. 深入問題:這些咖啡店的主要客群是哪些人?藉此了解不同咖啡店吸引的客戶類型,例如上班族、學生或觀光客。
  3. 進一步探索:近年來,臺北市咖啡消費者的偏好有哪些變化?這能夠幫助王嘉華了解市場趨勢,例如客人對特殊咖啡豆的偏好。
  4. 市場機會:目前市場上是否存在未被充分滿足的客戶需求?探索潛在的市場機會,比如特殊飲品或獨特的咖啡體驗。
  5. 競爭分析:臺北市中心的咖啡店競爭格局是怎樣的?了解競爭對手的強項和弱點,以及市場的飽和程度。
  6. 潛在機會:如果開設一家新咖啡店,需要考量哪些關鍵因素?評估地理位置、店面設計、菜單選擇等因素對開店的影響。

透過這樣的問答過程,王嘉華不僅可以獲得有關咖啡店的市場資訊,還能夠深入理解相關行業的動態,並發掘潛在的商機。

現在,相信您已經了解:「思維鏈」是一種問題解決的方法,可以透過連續提問的方式來深入探究一個主題。而每一個問題都基於前一個問題的答案,這樣可以逐步深入到一個主題的核心或發掘更深層次的見解。



★ 想要擁抱AI時代?歡迎報名《AI文案寫作課》!

★ 全面提升您的寫作力,歡迎報名「Vista寫作陪伴計畫」。

★ 如果覺得這篇文章對您有幫助,歡迎分享或是請我喝杯咖啡唷!

Buy Me a Coffee
張貼留言

留言