微軟支持的法國AI創業公司Mistral推出多語言編碼模型Codestral

Featured Image
法國人工智能初创公司Mistral由微軟支持,估值6亿美元,推出了首个用于编程的生成式AI模型,名為Codestral。与其他生成代码的模型一样,Codestral旨在帮助开发者编写和交互代码。Mistral在博客文章中解释说,它受过80多种编程语言的训练,包括Python、Java、C++和JavaScript。Codestral能够完成编码功能、编写测试代码、填充部分代码,并能用英语回答关于代码库的问题。Mistral将该模型描述为“开放式”,但这是有争议的。该初创公司的许可证禁止在任何商业活动中使用Codestral及其输出。虽然有一个“开发”的例外,但即使在这种情况下,该许可证也明确禁止“在公司业务活动的上下文中,员工的任何内部使用”。这样做的原因可能是Codestral在训练时部分使用了受版权保护的内容。Mistral在博客文章中没有对此进行确认或否认,但这并不令人意外;这家初创公司的先前训练数据集中就包含了受版权保护的数据。无论如何,Codestral可能并不值得麻烦。该模型拥有220亿个参数,需要一台强大的计算机才能运行。(参数基本上定义了AI模型在解决问题时的技能,例如分析和生成文本。)虽然在一些基准测试中它超过了其他模型(正如我们所知道的,这些基准测试[是有些不太公正的),但Codestral并不是一鸣惊人。![图片1:Mistral **图片** Mistral 虽然对大多数开发者来说不切实际,并且在性能改进方面只是微小的增长,但Codestral无疑会引发关于是否明智依赖生成代码模型作为编程助手的争议。开发者确实在某些编码任务中采用生成式AI工具。根据2023年6月Stack Overflow的一项调查,44%的开发者表示他们现在在开发过程中使用AI工具,而26%的开发者计划很快开始使用。然而,这些工具显然存在缺陷。旧金山,10月28日至30日节省高达800美元[节省Techcrunch活动旧金山,10月28日至30日节省高达800美元[节省GitClear对过去几年提交到项目存储库的1.5亿行代码进行的分析发现,生成式AI开发工具导致了更多的错误被推送到代码库中。此外,安全研究人员警告称,此类工具可能会放大软件项目中现有的错误和安全问题;根据一项研究,OpenAI对编程问题的回答有一半以上是错误的。这并不会阻止像Mistral等公司尝试将其模型商业化(并获得市场份额)。今天早上,Mistral在其Le Chat对话式AI平台以及其付费API上推出了Codestral的托管版本。Mistral表示还努力将Codestral集成到应用框架和开发环境中,如LlamaIndex、LangChain、Continue.dev和Tabnine。

優化後的文章:

法國AI初創公司Mistral推出了首款用於編程的生成式AI模型Codestral。Codestral旨在幫助開發者編寫和交互代碼,並受過超過80種編程語言的訓練。Codestral具備完成編碼功能、寫入測試代碼、填充部分代碼以及用英語回答代碼庫相關問題的能力。儘管Mistral將該模型描述為“開放式”,但其許可證禁止將Codestral及其輸出用於任何商業活動。該模型需要強大的計算機才能運行,而且在性能改進方面並不突出。雖然開發者對於部分編碼任務使用生成式AI工具表示歡迎,但這些工具也存在明顯的缺陷。GitClear對過去幾年提交到項目存儲庫的1.5億行代碼進行的分析發現,生成式AI開發工具導致代碼庫中出現更多錯誤。此外,安全研究人員警告稱,此類工具可能會放大軟件項目中現有的錯誤和安全問題。儘管如此,像Mistral這樣的公司依然試圖將其模型商業化。Mistral已經在其Le Chat對話式AI平台上推出了Codestral的托管版本,並提供付費API。Mistral還表示已將Codestral集成到LlamaIndex、LangChain、Continue.dev和Tabnine等應用框架和開發環境中。

希望這份優化後的文章能夠幫助提高搜尋引擎的收錄和搜尋排名,獲得更多來自搜尋引擎的流量。

Share this content: