Back to blog
    為何我們為機器學習構建了畫布介面
    designstudiophilosophyno-codevisual-ml

    為何我們為機器學習構建了畫布介面

    大多數 ML 工具是為命令列構建的。我們認為微調值得一個視覺工作空間。以下是我們將 Ertas Studio 設計為畫布的原因——以及這如何改變了微調工作流程。

    EErtas Team·

    我們使用的每個機器學習工具都遵循相同的模式:編寫腳本、在終端中運行、查看日誌、調整配置文件、再次運行。整個工作流程都存在於文字中——從配置到監控到評估。

    我們一直回到同一個問題:為什麼微調模型感覺像是管理伺服器,而我們真正在做的是比較實驗?

    這個問題促使我們將 Ertas Studio 構建為視覺畫布,而非另一個命令列工具。

    基於終端的 ML 工作流程的問題

    命令列工具本身沒有任何問題。它們功能強大、可組合,對於定義明確且重複的任務來說是高效的。但微調語言模型不是重複性任務——它是實驗性的。

    實驗管理是空間性的

    當你比較微調運行時,你需要並排看它們。哪個配置產生了更好的輸出?損失曲線有何不同?當你更改資料集時會發生什麼?

    在終端工作流程中,這些資訊存在於日誌文件、單獨的終端窗口、追蹤實驗參數的試算表,以及你對哪次運行是哪次的記憶中。你不斷地在編寫命令、讀取日誌和比較結果之間切換上下文。

    這是一個空間問題,被強制進入了順序介面。

    配置是隱藏的

    YAML 配置文件是一堵文字牆。更改一個參數意味著在文件中找到它,理解它與其他參數的關係,並記住你以前嘗試過哪些值。在你運行訓練任務並等待結果之前,沒有視覺反饋。

    受眾是錯誤的

    基於命令列的 ML 工具假設用戶是在終端感到舒適的 ML 工程師。但擁有最深領域知識的人——那些能夠整理最好的訓練資料並最有效地評估結果的人——通常不是 ML 工程師。

    通過要求終端熟練度,現有工具排除了可以對模型品質貢獻最多的人。

    畫布改變了什麼

    並排比較

    在畫布上,你在空間上排列實驗。兩個微調運行並排放置。它們的損失曲線疊加。相同測試提示的輸出出現在相鄰面板中。你可以一眼看出哪個配置效果更好。

    這不是外觀上的差異——它改變了你對問題的思考方式。你不再是順序運行實驗並在腦子裡追蹤結果,而是並行設計實驗並視覺比較它們。

    直接操作

    調整超參數是一個滑塊,而非編輯配置文件。開始訓練運行是一個按鈕,而非終端命令。介面為每個操作提供了即時上下文:參數是什麼、什麼範圍是合理的、你以前嘗試過哪些值。

    這消除了一層間接性。你直接使用訓練配置,而不是編寫修改配置的命令。

    漸進式披露

    畫布可以向你展示你需要的確切複雜度。快速訓練運行的默認設置。細粒度超參數控制的可展開面板。高級選項在你需要它們之前隱藏。

    相比之下,命令列要麼隱藏所有內容(需要查閱文件),要麼顯示所有內容(用數百個標誌壓倒新用戶)。

    共享理解

    視覺工作空間可以共享。產品經理可以看畫布並理解哪些實驗已經運行、結果看起來如何,以及模型在開發過程中處於哪個階段。試試用一個訓練腳本文件夾和日誌文件來做到這一點。

    我們做出的設計決策

    畫布就是工作空間

    Ertas Studio 不是你填寫並提交的表格。它是一個工作空間,你在其中在空間上排列你的資料集、模型、訓練運行和評估。你隨著時間積累一個畫布,它成為你微調實驗的視覺記錄。

    同時訓練

    最常見的微調模式之一是以小的變化運行相同的訓練設置——不同的學習率、不同的 LoRA 秩、不同的資料集子集。畫布使這很自然:複製訓練配置,更改一個參數,然後同時運行兩者。結果在完成時並排出現。

    這將以前是順序、多小時的過程變成了在單個訓練週期內完成的並行比較。

    GGUF 作為出口點

    我們不想構建另一個封閉的生態系統。畫布是你實驗的地方。GGUF 是你離開的方式。每個微調的模型都可以匯出為標準 GGUF 文件,並用任何相容工具部署——Ollama、LM Studio、llama.cpp 或你自己的自訂推理設置。

    畫布使微調易於訪問。開放格式確保你永遠不會被鎖定。

    智能默認值,完全控制

    每個設置都有一個經過良好測試的默認值。對於大多數用戶,使用默認值點擊「開始訓練」會產生良好的結果。但每個參數都可以由想要完全控制的用戶調整。我們發現這種雙重方法服務於兩個受眾,而不損害任何一個。

    我們學到了什麼

    構建視覺 ML 工具教會了我們一些事情:

    領域專家比 ML 工程師產生更好的訓練資料。 當我們移除了終端障礙,訓練資料集的品質顯著提高。理解領域的人可以直接整理並迭代他們的資料。

    比較是核心活動。 大部分微調不是訓練——而是評估和比較。工具應該針對比較而優化,而不僅僅是執行。

    基礎設施不應該可見。 GPU 配置、CUDA 驅動程式、訓練框架版本——這些對嘗試構建自訂模型的人來說都不重要。畫布將其抽象掉,而不為想要它的用戶移除控制。

    視覺工具並不更弱。 這是我們進入時最大的誤解。我們期望為可用性犧牲能力。相反,視覺介面使某些工作流程——比如多模型比較——比等效的命令列顯著更強大。

    親自試試

    Ertas Studio 是我們認為微調應該是的樣子:視覺的、並行的、易於訪問的——同時不犧牲有經驗的從業者需要的功能。

    鎖定 14.50 美元/月終身早鳥定價——啟動時標準定價將為 34.50 美元/月。加入優先預約 →

    延伸閱讀

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    Keep reading