微軟支持法國AI初創Mistral推出編碼模型Codestral全解析

Featured Image
Mistral是一家法國人工智慧初創公司,由Microsoft支持,估值達6億美元。他們推出了首個用於編碼的生成式人工智慧模型,名為Codestral。與其他生成程式碼模型一樣,Codestral旨在幫助開發人員編寫和互動程式碼。Mistral在一篇博文中解釋,Codestral的訓練涵蓋了80多種程式語言,包括Python、Java、C++和JavaScript。Codestral可以完成編碼功能、編寫測試和填寫部分程式碼,並以英語回答有關程式碼庫的問題。Mistral將這個模型描述為「開放式」,但這一點還有待商榷。該初創公司的許可證禁止將Codestral及其輸出用於「任何」商業活動。雖然「開發」有例外,但甚至在公司業務活動的背景下,內部使用也被明確禁止。原因可能是Codestral在訓練時部分使用了受版權保護的內容。Mistral在博文中沒有確認或否認這一點,但這也不足為奇;該初創公司以前的訓練數據集就包含有版權保護的數據。無論如何,Codestral可能並不值得麻煩。這個模型擁有220億個參數,需要一台性能強大的個人電腦才能運行。(參數基本上定義了人工智慧模型在解決問題時的能力,如分析和生成文本。)而且,儘管在一些基準測試中超越了一些模型(就像我們所知道的那樣),但並不是一個顯著的優勢。Mistral的Codestral無論對於大多數開發人員來說都不實用,並且在性能改進方面只能達到漸進式的效果,這必將引發對於依賴程式碼生成模型作為編程助手的智慧性的智慧的辯論。開發者們確實在某些編碼任務中接受生成式人工智慧工具。根據2023年6月Stack Overflow的一項調查,44%的開發者表示他們現在在開發過程中使用人工智慧工具,而26%的開發者計劃很快使用。然而,這些工具明顯存在缺陷。舉例來說,GitClear對過去幾年提交到項目存儲庫的1.5億行代碼進行的分析發現,生成式人工智慧開發工具導致了更多錯誤被推送到程式碼庫中。此外,安全研究人員警告說,這些工具可能會放大軟體項目中現有的錯誤和安全問題;根據一項研究,OpenAI對編程問題的超過一半回答都是錯誤的。然而,這並不會阻止像Mistral和其他公司試圖將它們的模型商業化(並獲得心智份額)。今天早上,Mistral在其Le Chat對話人工智慧平台上推出了Codestral的托管版本,並提供了付費API。Mistral表示,他們還努力將Codestral集成到應用程式框架和開發環境中,例如LlamaIndex、LangChain、Continue.dev和Tabnine。

Share this content: