法國AI新創Mistral推自定義模型:SDK優化與企業解決方案全解析

Featured Image
法國 AI 初創公司 Mistral 推出了新的 AI 模型定制選項,包括付費計劃,讓開發人員和企業能夠對其生成模型進行微調,以適應特定的用例。首先是自助服務。Mistral 發布了一個軟件開發工具包(SDK),可用於在工作站、服務器和小型數據中心節點上對其模型進行微調。在 SDK 的 GitHub 存儲庫的自述文件中,Mistral 指出,該 SDK 適用於多 GPU 設置,但也可以縮小到單個 Nvidia A100 或 H100 GPU,以微調較小的模型,如 Mistral 7B。Mistral 表示,使用 Mistral-Finetune 在一個數據集上進行微調(例如 UltraChat,其中包含 140 萬個使用 OpenAI 的 ChatGPT 生成的對話),僅需約半小時即可在八個 H100 上完成。對於偏好更受管理的解決方案的開發人員和公司,Mistral 通過公司的 API 提供了新推出的微調服務。暫時與 Mistral 的兩個模型(Mistral Small 和前述的 Mistral 7B)兼容,Mistral 表示,這些微調服務將在未來幾週內支持更多的模型。最後,Mistral 推出了自定義訓練服務,目前僅向選定的客戶提供,以使用其數據微調任何 Mistral 模型,以適應組織的應用程序。“這種方法使得能夠為特定領域創建高度專業化和優化的模型,”該公司在其官方文章中解釋道。根據最近我同事 Ingrid Lunden 的報導,Mistral 正在尋求從 DST、General Catalyst 和 Lightspeed Venture Partners 等投資者那裡籌集約 6 億美元的資金,無疑是為了增加收入,因為它在生成 AI 領域面臨著相當多且不斷增長的競爭。自 2023 年 9 月推出其首個生成模型以來,Mistral 推出了幾個其他模型,包括一個代碼生成工具和付費 API。但它並未透露有多少用戶,也沒有披露其收入狀況。

法國 AI 初創公司 Mistral 推出了新的 AI 模型定制選項,包括付費計劃,讓開發人員和企業能夠對其生成模型進行微調,以適應特定的用例。首先是自助服務。Mistral 發布了一個軟件開發工具包(SDK),可用於在工作站、服務器和小型數據中心節點上對其模型進行微調。Mistral 表示,該 SDK 適用於多 GPU 設置,但也可以縮小到單個 Nvidia A100 或 H100 GPU,以微調較小的模型,如 Mistral 7B。根據 Mistral 的說明,使用 Mistral-Finetune 在包含 140 萬個使用 OpenAI 的 ChatGPT 生成的對話的 UltraChat 數據集上進行微調,僅需約半小時即可在八個 H100 上完成。對於偏好更受管理的解決方案的開發人員和公司,Mistral 通過公司的 API 提供了新推出的微調服務。暫時與 Mistral 的兩個模型(Mistral Small 和 Mistral 7B)兼容,Mistral 表示,這些微調服務將在未來幾週內支持更多的模型。此外,Mistral 還推出了自定義訓練服務,目前僅向選定的客戶提供,以使用其數據微調任何 Mistral 模型,以適應組織的應用程序。根據該公司在其官方文章中的解釋,這種方法使得能夠為特定領域創建高度專業化和優化的模型。Mistral 近期報導中提到,該公司正尋求從投資者(包括 DST、General Catalyst 和 Lightspeed Venture Partners)那裡籌集約 6 億美元的資金,以應對生成 AI 領域中不斷增長的競爭。自 2023 年 9 月推出其首個生成模型以來,Mistral 已經推出了幾個其他模型,並且開放了付費 API。不過,Mistral 並未透露有多少用戶,也沒有公開其收入情況。

Share this content: