llama.cpp 官方 WebUI 終於來了！打造終極本地 AI 聊天體驗

告別複雜設定！llama.cpp 正式推出全新官方 WebUI，基於 SvelteKit 打造，功能強大且完全免費。本文將帶你快速上手，探索多模態、平行對話、JSON 約束生成等超酷功能，在自己的電腦上享受 100% 隱私的 AI 助理。

如果你是個喜歡在自己電腦上運行大型語言模型（LLM）的玩家，那你對 llama.cpp 這個名字肯定不陌生。它輕巧、高效，幾乎可以在任何硬體上運行，是本地 AI 的代名詞。但老實說，過去要為它找到一個順手又強大的圖形介面（UI），總得費點功夫。

但現在，這個煩惱可以正式畫下句點了。llama.cpp 的核心開發團隊推出了全新的官方網頁使用者介面（WebUI）！這不僅僅是一個簡單的聊天視窗，而是一個企圖打造「終極本地 AI 聊天體驗」的完整解決方案。

所以，這次的官方 WebUI 有什麼特別之處？

你可能會想，市面上不是已經有很多 WebUI 了嗎？沒錯，但官方出品的總是多了那麼一點「親兒子」的優勢。這個基於 SvelteKit 技術打造的介面，與 llama-server 後端完美結合，帶來了幾個令人驚豔的特點：

完全免費且開源： 由社群驅動，你可以完全掌控一切。
極致的效能： 無論你的電腦是高階顯卡還是普通 CPU，它都能提供卓越的表現。
進階快取技術： 擁有先進的上下文（Context）和前綴（Prefix）快取，回應速度更快。
輕量且高效： 極低的記憶體佔用，不會拖垮你的系統。
100% 的隱私： 所有運算都在你的電腦上完成，你的對話資料哪裡都不會去。

聽起來很棒，對吧？接下來，讓我們看看上手有多簡單。

三步驟快速上手，立即體驗

準備好開始了嗎？過程真的非常簡單，你不需要是個程式高手也能輕鬆搞定。

取得 llama.cpp： 首先，你需要取得 llama.cpp 的主程式。你可以透過安裝 (Install)、下載 (Download) 或自行編譯 (Build) 的方式取得。
啟動 llama-server 伺服器： 接著，打開你的終端機（Terminal 或命令提示字元），輸入指令來啟動後端伺服器。這是一個範例，它會下載並運行一個模型：
```
# 運行一個範例伺服器，使用 gpt-oss-20b 模型
llama-server -hf ggml-org/gpt-oss-20b-GGUF --jinja -c 0 --host 127.0.0.1 --port 8033
```
打開瀏覽器開始聊天： 伺服器啟動後，直接在你的瀏覽器（Chrome, Edge, Firefox 等）中打開 http://127.0.0.1:8033，你就會看到簡潔的聊天介面了！

小提示： 如果你是 Mac 使用者，且不喜歡處理指令，可以試試看 LlamaBarn 這個應用程式，它提供了一個更簡單的圖形化介面來設定 llama.cpp。

不只是聊天：探索 WebUI 的強大功能

這個 WebUI 可不是只有外表而已，它內建了許多實用又強大的功能，讓你的本地 AI 體驗提升到一個新的層次。

文件、PDF、圖片？通通丟進來！

這可能是最實用的功能之一。你可以直接將多個文字檔（.txt）、PDF 檔案，甚至是圖片拖曳到對話中。

文件處理： 無論是從電腦硬碟還是直接從剪貼簿貼上，它都能將文字內容加入到對話的上下文中。
PDF 處理： 預設情況下，它會將 PDF 的內容轉換為純文字。如果你的 AI 模型支援視覺能力（Vision），你甚至可以設定讓它將 PDF 當作圖片來處理，直接分析裡面的圖表或版面。
圖片輸入： 對於支援視覺的模型（例如 LLaVA 或 Qwen-VL），你可以上傳圖片，讓 AI 描述圖片內容、回答相關問題，甚至可以圖文並茂地進行對話。

一心多用？平行對話與分支管理

你有沒有過這樣的經驗：想同時跟 AI 討論好幾個不同的主題？或是想針對 AI 的某個回答，嘗試另一種追問方式？

平行對話（Parallel conversations）： 這個 WebUI 允許你同時開啟多個獨立的聊天視窗，每個對話都有自己的上下文，互不干擾。
對話分支（Conversation branching）： 你可以隨時回頭編輯自己或 AI 的任何一則訊息，然後從那個時間點「分岔」出一個新的對話走向。這對於比較不同提示（Prompt）的效果，或是修正 AI 的回答方向非常有用。

讓 AI 乖乖聽話：精準控制與格式化輸出

對於進階使用者和開發者來說，能夠精準控制模型的輸出格式至關重要。

約束生成（Constrained generation）： 這是個超酷的功能！你可以提供一個自訂的 JSON Schema，強制 AI 的回答必須符合你指定的格式。例如，你可以讓它從一堆發票圖片中，自動抓取「公司名稱」、「金額」、「日期」等欄位，並以標準的 JSON 格式輸出，大大簡化了後續的資料處理工作。
渲染數學公式和程式碼： 它能夠完美地渲染 LaTeX 數學表達式和程式碼區塊（HTML/JS），讓學術討論和程式開發變得更加直觀。

隨時隨地帶著走：完美的行動裝置體驗

沒錯，這個 WebUI 也是行動裝置友善的！你可以在手機或平板的瀏覽器上打開它，介面會自動適應螢幕大小，讓你隨時隨地都能使用自己的本地 AI 助理。

常見問題解答 (FAQ)

在社群的討論中，大家也提出了一些常見問題，這裡一併整理給你。

Q: 如何啟用平行對話功能？ A: 在啟動 llama-server 時，加入 --parallel N 參數即可，N 是你想要同時處理的對話數量（例如 --parallel 2）。如果是在單一使用者、多對話的情境下，建議再多加一個 --kv-unified 參數，這樣可以讓所有對話共享 KV 快取，而不是切分它，能更有效地利用上下文空間。

Q: 我不想從 Hugging Face 下載模型，如何載入我自己電腦上的模型檔？ A: 非常簡單，使用 -m 或 --model 參數，後面接上你本地 GGUF 模型檔案的路徑即可。例如： llama-server -m /path/to/your/model.gguf

Q: 如何讓 AI 嚴格按照我指定的 JSON 格式回覆？ A: 這就是前面提到的「約束生成」功能。你可以在 WebUI 的開發者設定中找到「Custom JSON」選項，然後貼上你的 JSON Schema 定義即可。

結語

llama.cpp 的這個全新官方 WebUI，無疑為本地 AI 愛好者們提供了一個功能完整、效能卓越且介面友善的絕佳選擇。它不僅讓入門變得更加簡單，也為進階使用者提供了豐富的客製化選項。

這一切都要感謝專案的領導開發者 Aleksander Grygier、貢獻良多的 ServeurpersoCom，以及提供廣泛支援的 Hugging Face 社群。

如果你也對在自己電腦上運行 AI 充滿熱情，現在就是最好的時機。快去 GitHub 專案頁面看看，親手體驗這個強大的新工具吧！

分享至:

Featured Partners

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

SPONSORED

DMflow.chat

DMflow.chat: 您的智能AI夥伴，提升客戶互動、創造卓越體驗。

Learn More

SPONSORED

DMflow.chat

探索DMflow.chat，立即開啟AI驅動的客戶服務新時代。

Learn More

SPONSORED

videoweaver.app

Video Weaver: 瀏覽器內完成專業影片剪輯，無需下載、即刻創作。

Learn More

Recommended for You

打 …

tool

打造智慧對話：DMflow.chat 助您輕鬆建立機器人(什麼是dmflow.chat)

DMflow.chat 是一個功能強大的多管道問答機器人平台，結合了大型語言模型 (LLM) 的自然語言處理能力和精確的流程控制，提供靈活且高效的解決方案。支援 LINE、Telegram、Messenger 和網站等多個平台，提供閒聊角色、文檔問答、表單問答等多種功能，並具備真人客服、廣播訊息、儀表板和日誌等強大功能，協助您打造智慧化的對話體驗。核心功能快速部署：簡單易用的介面，快速建立機器人。多管道支援：支援 Facebook、Instagram、Telegram、LINE 和網站等多個平台。整合大型語言模型：內建 ChatGPT 和 Gemini，提供更自然的對話體驗。提供流程式：你可以透過流程式引導訪客使用聊天機器人。主要優勢：節省時間和成本，提升客戶服務效率。適用對象：需要快速建立問答機器人的企業或個人機器人機器人組件包含以下功能：模板、全局設定、變數、資源管理、流程對話設計、日誌記錄、廣播訊息、發布以及設定。模板模板功能提供多種記憶方式，方便您客製化機器人行為：使用者參數：您可以新增客製化的欄位來儲存使用者資訊，這些欄位可用於聊天機器人互動以及推播訊息的個人化設定。使用者標籤：您可以為訪客添加標籤，方便進行分群和管理，這些標籤也可用於精準的推播訊息發送，有效區隔不同受眾的訊息。機器人參數：這些參數作為機器人流程中的環境變數。單一會話儲存：此功能允許您在單次使用者會話中暫時儲存資料，儲存期限為 30 分鐘。這對於需要追蹤使用者在單次互動中的狀態或臨時資訊非常有用。全局設定全局設定用於管理機器人的核心功能，包含領域、場景以及通用回答。這些設定定義了機器人的能力範圍、行為模式和基本互動方式。何謂領域？領域代表機器人擁有的「技能」或「專長」。每個領域都賦予機器人特定的能力，使其能夠處理特定類型的問題或任務。系統預設提供以下三種領域：閒聊角色（透過 LLM 調用工具回答問題）：此領域使機器人具備一般的閒聊能力，能夠理解使用者的自然語言並做出回應。它透過大型語言模型 (LLM) 調用相關工具來生成回答，提供更豐富和自然的對話體驗。文檔問答（僅使用 RAG 回答問題）：此領域使機器人能夠根據提供的文檔資料庫回答使用者的問題。它使用檢索增強生成 (RAG) 技術，從文檔中檢索相關資訊並生成回答。針對重複性問題，系統會快取答案，以減少AI點數消耗，節省資源並提高回應速度。表單問答（可以透過各種表單資料庫進行 CRUD 操作）：此領域使機器人能夠與各種表單資料庫進行互動，執行新增 (Create)、讀取 (Read)、更新 (Update) 和刪除 (Delete) 等操作 (CRUD)。這使得機器人能夠處理需要資料庫互動的任務，例如收集使用者資訊、查詢產品庫存等。目前閒聊角色同時支援文檔問答以及表單問答，但差別在於：文檔問答若命中語法完成不消耗AI點數，也就是不使用LLM產生回答。表單問答除了新增和搜尋外，還有刪除、修改、點擊等功能。何謂場景？場景定義了機器人在特定情境下的行為和回應方式。您可以為不同的情境設定不同的場景，使機器人能夠根據當前的情境提供更適切的服務。例如，/call_agent 是一個場景範例，當使用者輸入此指令時，機器人會進入 call_agent 的場景，執行與呼叫客服人員相關的流程。這讓機器人能根據不同的指令或觸發條件，切換到不同的應對模式。

Jan 15, 2025 Read →

P …

tool

Poe AI聊天機器人：ChatGPT替代品的全面指南與使用教學(什麼是Poe AI)

本文深入介紹Poe平台，探討其功能、優缺點，以及如何有效利用這個強大的AI工具。無論你是AI新手還是資深用戶，這篇指南都能幫你快速上手Poe，體驗多種頂尖AI模型的魅力。圖片來源: Poe Poe是什麼？為何在香港如此受歡迎？ Poe不僅僅是一個AI聊天機器人平台，更像是一個AI應用商店或生態系統。它允許使用者：使用多種AI模型：如你所說，Poe整合了多個領先的AI模型，這讓使用者可以在同一個介面體驗不同模型的優勢，例如GPT-4的強大推理能力、Claude的親切對話風格等。這避免了使用者需要在不同平台之間切換的麻煩。創建和分享AI機器人：這是Poe的一大特色。使用者可以基於現有的模型，透過簡單的指令或提示詞工程（Prompt Engineering）來創建客製化的AI機器人，並分享給其他人使用。這降低了AI應用的開發門檻，促進了AI社群的發展。探索和發現新的AI應用： Poe上的機器人種類繁多，涵蓋了寫作、翻譯、程式碼生成、問答、創意發想等多個領域。使用者可以透過探索不同的機器人，發現新的AI應用場景和可能性。 Poe在香港受歡迎的原因：除了無需VPN、多模型整合、使用便利等原因外，我認為Poe在香港受歡迎還有以下幾個因素：對ChatGPT的替代需求：ㄋ由於ChatGPT在某些地區的限制，香港使用者需要尋找替代方案。Poe的出現正好滿足了這一需求，它提供了一個無需VPN即可訪問多個強大AI模型的平台。對新科技的接受度高：香港作為一個國際化的都市，市民對新科技的接受度普遍較高。他們樂於嘗試新的工具和平台，Poe這種新穎的AI應用自然會受到關注。社群效應和口碑傳播：隨著越來越多的人開始使用Poe，相關的討論和分享也在社群媒體和網路上擴散開來，形成了良好的口碑效應，吸引了更多使用者加入。中文介面和本地化內容：雖然Poe的介面主要以英文為主，但由於其基於大型語言模型，因此對於中文的理解和生成能力也相當出色。此外，一些使用者也會創建針對香港本地需求的機器人，例如提供廣東話支援、香港新聞摘要等，這進一步提升了Poe在香港的吸引力。 Quora的品牌效應： Poe背後的Quora本身就是一個知名的問答平台，擁有一定的用戶基礎和品牌信任度。這也為Poe的推廣起到了一定的作用。 Poe新手指南：快速註冊與使用一、註冊流程補充：多種註冊方式： Poe通常提供多種註冊方式，例如使用Google帳號、Apple ID或電子郵件地址註冊。建議使用者選擇自己常用的方式，以便日後登入。驗證郵件：使用電子郵件註冊後，通常需要驗證郵件地址。請務必檢查收件匣（包括垃圾郵件匣），點擊驗證連結以完成註冊。設定個人資料（可選）：註冊後，使用者可以選擇設定個人資料，例如頭像和暱稱。這有助於在社群中更好地識別自己。二、網頁版使用補充：「探索」頁面：「探索」頁面是尋找新機器人的好地方。使用者可以根據不同的類別（例如寫作、程式碼、娛樂等）瀏覽機器人，或使用搜尋功能查找特定的機器人。機器人資訊卡：在「探索」頁面或「我的機器人」頁面，每個機器人都有一個資訊卡，上面會顯示機器人的名稱、描述、創建者等資訊。點擊資訊卡可以進入機器人的聊天介面。提示詞（Prompt）的重要性：與AI聊天機器人互動的關鍵在於使用有效的提示詞。清晰、明確的提示詞可以幫助機器人更好地理解使用者的需求，並產生更準確、更有用的回應。建議使用者多加嘗試不同的提示詞，以找到最佳的互動方式。上下文的重要性： Poe的聊天機器人通常會記住之前的對話內容，這稱為上下文。善用上下文可以進行更深入、更連貫的對話。付費訂閱： Poe提供免費和付費訂閱兩種方案。付費訂閱通常可以解鎖更強大的AI模型（例如GPT-4），並享有更高的使用配額。使用者可以根據自己的需求選擇是否訂閱。三、手機App使用補充：介面差異：手機App的介面可能與網頁版略有不同，但基本功能是相同的。使用者可以透過App上的導航選單或按鈕來訪問不同的功能。通知設定：使用者可以設定App的通知，以便及時收到機器人的回覆或其他重要訊息。四、常見問題與解決方案：網路連線問題：如果遇到網路連線問題，請檢查網路連線是否正常。機器人回應緩慢：有時由於伺服器負載或其他原因，機器人的回應可能會比較緩慢。請耐心等待。遇到錯誤訊息：如果遇到錯誤訊息，可以嘗試重新整理頁面或重新啟動App。如果問題仍然存在，可以聯繫Poe的客服支援。五、安全和隱私：謹慎分享個人資訊：在與AI聊天機器人互動時，請謹慎分享個人資訊，例如姓名、地址、電話號碼等。注意機器人的回應： AI聊天機器人的回應並不總是準確或可靠的。請使用者自行判斷資訊的真偽。 Poe vs ChatGPT：深度對比分析特性 Poe ChatGPT 模型多樣性提供多個AI模型，包括OpenAI的GPT-4、ChatGPT、Anthropic的Claude系列、Google的PaLM、Meta的Llama 2等。這讓使用者可以根據不同的需求選擇最適合的模型，例如需要快速回應時選擇速度快的模型，需要創意寫作時選擇擅長此道的模型。這是Poe最大的優勢之一。僅提供OpenAI自家模型，目前主要有GPT-3.5和GPT-4。雖然OpenAI也在不斷改進其模型，但使用者的選擇相對有限。功能特色 * 自定義機器人：允許使用者基於現有的模型創建客製化的AI機器人，並分享給其他人使用。這降低了AI應用的開發門檻，促進了AI社群的發展。 * 模型比較：由於整合了多個模型，使用者可以方便地比較不同模型的表現，例如在回答同一個問題時，不同模型的回應有何差異。 * API整合： Poe也提供API，方便開發者將Poe的功能整合到自己的應用程式中。 * 插件功能： ChatGPT提供插件功能，可以連接到第三方應用程式和服務，擴展其功能，例如連接到Wolfram Alpha進行數學計算、連接到Zapier自動化工作流程等。這是ChatGPT的獨特優勢。 * 程式碼解釋和生成： ChatGPT在程式碼的解釋、生成和除錯方面表現出色，對於程式設計師來說非常有用。 * 語音輸入和輸出： ChatGPT也支援語音輸入和輸出，提供更自然的互動方式。響應速度一般而言，Poe的響應速度較快，尤其是在處理簡單的問答時。這可能是因為Poe可以根據不同的模型特性進行優化。在處理複雜的查詢或生成較長的文本時，ChatGPT可能需要較長的時間。但隨著OpenAI不斷優化其模型和伺服器，響應速度也在不斷提升。創意寫作 Poe整合的某些模型，例如Claude，在創意寫作方面表現優異，擅長生成詩歌、故事等具有想像力的內容。 ChatGPT在長篇創意內容生成上可能更有優勢，例如撰寫小說、劇本等。它在文本的連貫性和邏輯性方面表現出色。多語言支持 Poe整合的不同模型在多語言支持方面各有優劣。某些模型可能在特定的語言上表現更好。 ChatGPT在多語言支持方面持續改進，但相較於某些專注於多語言處理的模型，可能仍有進步空間。知識更新 Poe整合的不同模型有不同的知識截止日期。這意味著某些模型可能無法回答關於近期事件的問題。 ChatGPT的知識庫會定期更新，但仍然存在時間限制。這表示它可能無法提供關於最新發生的事件的資訊。使用便利性 Poe提供網頁版、iOS和Android應用程式，方便使用者在不同裝置上使用。介面簡潔易懂，易於上手。 ChatGPT也提供網頁版和API，方便使用者和開發者使用。其介面也相當簡潔，但相較於Poe，可能更偏向於文字介面。付費模式 Poe提供免費和付費訂閱兩種方案。付費訂閱可以解鎖更強大的AI模型和更高的使用配額。 ChatGPT也提供免費和付費訂閱兩種方案。付費訂閱可以提供更快的響應速度和更高的使用配額。社群與生態系 Poe擁有一個活躍的社群，使用者可以創建和分享自定義機器人，並互相交流使用心得。 ChatGPT背後有OpenAI強大的技術支援和資源投入，其生態系也更加成熟，擁有大量的開發者和合作夥伴。 Poe各AI機器人特點比較 Poe平台提供多種AI機器人，每種都有其獨特優勢：

Sep 11, 2024 Read →

2 …

tool

2026年 Manychat 完整評測：功能、優缺點與價格分析，從自動化到 AI 代理的轉型指南與價格分析(什麼是Manychat)

Manychat 在 2026 年依然是聊天機器人平台的首選嗎？答案可能比您想像的更複雜。這款工具已經不再僅僅是一個「自動回覆機器人」，而是進化為連結社群圖譜與營收運營的「代理式 AI (Agentic AI)」中樞。本文將結合 2026 年最新的技術趨勢，深入評測 Manychat 的全新功能，包含 Instagram 的隱形獲客術、WhatsApp 的類 App 體驗、TikTok 的整合限制，以及如何透過混合 AI 架構打造最強客服大腦。無論您是電商經營者、內容創作者或行銷人員，這篇指南將協助您做出明智決策。重新定義 Manychat：2026 年的它到底是什麼？如果您對 Manychat 的印象還停留在「自動回覆貼文留言」，那麼是時候更新資訊了。雖然它依然是一個無需撰寫程式碼就能打造聊天流程的工具，但在 2026 年的行銷生態中，它的角色已經轉變為**「中介軟體 (Middleware)」**。簡單來說，Manychat 現在是連接「公域流量」與「私域資產」的關鍵橋樑。試想一下，當顧客在 Instagram Reels、TikTok 短影音或 Facebook 貼文產生興趣時，Manychat 能透過內建的 AI 代理功能，將這些稍縱即逝的注意力，無縫轉化為 CRM 系統中的具體名單，甚至直接在對話框內完成交易。它整合了當今主流的溝通渠道： Meta 生態系： Facebook Messenger、Instagram、WhatsApp。新興與傳統渠道： TikTok、Telegram、SMS 簡訊與 Email。這意味著企業可以在單一儀表板上，管理來自四面八方的客戶互動，不僅提升效率，更重要的是將分散的對話數據轉化為可變現的資產。 2026 核心功能大躍進：三大渠道深度解析 Manychat 之所以能持續領跑，關鍵在於對各個平台 API 的深度整合。以下是今年最具殺傷力的功能更新。 Instagram：流量閉環的終極優化 Instagram 依然是品牌經營的主戰場，而 Manychat 在此處的功能已經演化得相當細膩。「追蹤即私訊」(Follow to DM) 的隱形磁鐵效應：這已成為官方核准的原生觸發器。當用戶點擊「追蹤」您的帳號時，系統可以自動觸發一段歡迎流程或發送見面禮。這被行銷圈稱為「隱形磁鐵 (Silent Lead Magnet)」，因為品牌不再需要強迫用戶在留言區洗版，就能優雅地開啟私密對話，大幅降低了獲客的摩擦力。

Aug 13, 2024 Read →