2026 現代 Mac 必學!用 Homebrew + Ollama 在本地端打造專屬免費 AI(附 9B 模型推薦)

為什麼你該在 Mac 部署本地端 AI?
在 2026 年的今天,生成式 AI 已經成為工作不可或缺的工具。然而,每次使用 ChatGPT、Claude 或 Gemini 時,你是否曾擔心公司機密或個人隱私資料外洩?又或者對高昂的訂閱費用感到卻步?
其實,如果你使用的是 Apple Silicon(M1/M2/M3/M4 系列晶片)的 Mac,你手上的機器就是一台強大的 AI 工作站。透過開源社群的努力,現在我們完全不需要複雜的程式背景,只要透過 Homebrew 與 Ollama 這兩個工具,就能在幾分鐘內把實力強大的 AI 語言模型下載到電腦裡,享受離線、免費、100% 隱私安全的 AI 對話體驗!
核心觀念:工具箱、大腦與手腳的關係
在開始動手安裝前,用一個簡單的比喻讓你秒懂這些工具的底層邏輯,安裝時才不會迷路:
- Homebrew(工具箱): Mac 上最著名的套件管理工具。就像一個自動化工具箱,能幫我們一鍵安裝各式各樣的軟體,省去上網找安裝檔的麻煩。
- Ollama(大腦/執行環境): 它是本地 AI 的核心伺服器。就像是一台「CD 播放器」或大腦核心,提供了一個環境,讓各種 AI 語言模型可以在 Mac 的 GPU 上順暢跑起來。
- LLM 語言模型(手腳/音樂CD): 如同不同的音樂 CD。播放器(Ollama)裝好後,我們可以自由放入不同的 CD(例如 Google 的 Gemma 2 或阿里的 Qwen 2.5),讓 AI 執行不同的任務。
簡單三步驟!在 Mac 上建立本地 AI
請打開 Mac 內建的「終端機」(Terminal)應用程式,依序輸入以下指令:
步驟一:安裝套件管理器 Homebrew
如果你的 Mac 還沒有裝過 Homebrew,請複製以下官方指令並貼進終端機中執行(過程中可能需要輸入你的 Mac 開機密碼):
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
步驟二:透過 Homebrew 一鍵安裝 Ollama
工具箱準備好後,接著安裝本地 AI 的大腦核心 Ollama。在終端機輸入:
brew install ollama
安裝完成後,直接在應用程式中打開 Ollama,或者在終端機輸入 ollama serve 啟動後台服務。
步驟三:下載並運行 9B 語言模型
大腦啟動後,就可以把模型(CD)放進去了。對於目前主流擁有 16GB 記憶體的 Mac Mini 或 MacBook 讀者,我們強烈推薦下載 9B(90億參數)左右的模型,在推理解答能力與運行速度上能達到完美的平衡。
例如,要下載並執行目前極受歡迎、對中文理解能力優秀的 Gemma 2 (9B) 模型,請在終端機輸入:
ollama run gemma2:9b
終端機隨即會開始下載模型檔案。下載完成後,你會看到輸入提示符號,這時你就可以直接在終端機裡跟你的專屬本地 AI 開始打字對話了!想退出對話時,只需輸入 /exit 即可。
2026 黃金規格:為什麼推薦 9B 模型?
很多新手會糾結該選 7B、9B 還是 14B 的模型。根據實測,如果你的 Mac 記憶體為 16GB:
- 7B / 8B 模型(如 Llama3-8B): 速度極快,但有時對複雜中文邏輯的理解會稍微欠缺。
- 14/32B 模型(如 Qwen2.5-14B): 推理能力極強,但會吃掉大量記憶體,可能導致系統發熱或回應速度變慢。
- 9B 模型(如 Gemma2:9b): 恰到好處!完美善用 16GB 記憶體,既能保有流暢的打字生成速度,又能聽懂複雜的中文脈絡與商務指令。
快跟著上面的步驟,動手在你的 Mac 上釋放 AI 的真正潛能吧!
引用資料來源:
- Homebrew 官方網站:https://brew.sh/
- Ollama 官方模型庫:https://ollama.com/library
常見問題
- 在 Mac 上執行本地端 AI 最低硬體記憶體(RAM)要求是多少?
- 執行最基礎的 7B 或 8B 模型至少需要 8GB 統一記憶體;若想流暢運行本篇推薦的 9B 模型或更進階的 14B 模型,強烈建議使用 16GB 或以上記憶體的 Mac,以獲得最佳的生成速度與流暢度。
- 本地端運行的 Ollama AI 可以完全斷網(離線)使用嗎?
- 可以。只有在最初透過終端機下載模型檔案時需要連網路。下載完成後,不論你是斷網、開啟飛航模式還是處於無網路的機密環境中,Ollama 都能 100% 在本地端獨立運行,完全不消耗任何網路流量。