Back to blog
    LoRA遇上芯片:硬件如何使微调成为一等公民
    lorafine-tuninghardwaresiliconedge-aitaalasdeploymentasic

    LoRA遇上芯片:硬件如何使微调成为一等公民

    从Taalas的HC1到Tether Data的QVAC Fabric LLM,硬件厂商正在将LoRA支持直接构建到平台中。微调不再仅是训练技术——它正成为硬件部署接口。

    EErtas Team·

    低秩适配(LoRA)始于一个巧妙的训练技巧。由Microsoft研究人员于2021年发表,它解决了一个实际问题:大型语言模型的完整微调对大多数团队来说太昂贵、太慢。LoRA让你在冻结的基础模型之上训练一个小适配器层(50-200MB),以10%的成本达到完整微调95%的性能

    五年后,LoRA不仅仅是一种训练技术。它正在成为硬件部署接口——专业化AI模型加载到专用芯片、边缘设备和生产推理系统上的标准方式。

    Taalas:硬连线芯片上的LoRA适配器

    最戏剧性的例子是Taalas的HC1芯片。HC1将Meta的Llama 3.1 8B直接硬连线到晶体管中。模型权重物理蚀刻在芯片上。你无法改变它们。

    但你可以加载LoRA适配器。

    这意味着:

    • 基础模型 = 硬件。 它就是芯片本身。
    • 专业化 = 软件。 你的LoRA适配器是定制层。
    • 一块芯片,多种用途。 加载医疗LoRA运行临床AI。换上法律LoRA运行合同分析。

    Tether Data:边缘端的LoRA微调

    Tether Data采用相反的方法:使LoRA微调和推理在任何硬件上工作,包括消费设备。其QVAC Fabric LLM直接集成到llama.cpp生态系统中。

    学术研究:LoRA-Edge

    LoRA-Edge将LoRA与张量链奇异值分解(TT-SVD)结合,将微调压缩到具有严格内存和计算约束的边缘设备上。

    硬件厂商拥抱LoRA的商业逻辑

    1. 一个SKU,多个客户 — 基础模型是共享成本,适配器是每客户价值
    2. LoRA适配器很小 — 50-200MB适合片上SRAM
    3. 适配器 = 持续收入 — 客户带来自己的适配器

    对构建者的意义

    • 用适配器微调,而非单体模型
    • 从第一天就考虑多目标部署
    • 构建LoRA适配器库
    • 现在就开始微调 — 你今天构建的训练管道是明天部署在任何硬件上的资产

    Ertas使微调无需ML专业知识即可实现。上传数据集,可视化微调,以标准格式导出LoRA适配器。


    来源:Taalas HC1Tether Data QVAC Fabric LLMLoRA-Edge (arXiv)

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    Keep reading