“天工多模态大模型全面超越:昆仑万维的AI技术演进之路”

Featured Image
天工多模态大模型的演进落地

大家都知道,大模型在多模态的进程中变得越来越重要。在国内,有一家公司在AIGC大热潮的前后,一直走在了前列。

这家公司是昆仑万维,近期他们解锁了“中国首个音乐SOTA模型——天工音乐大模型”。那么昆仑万维在多模态大模型的道路中是如何演进的?让我们来听听他们的CEO方汉是怎么说的。

方汉在中国AIGC产业峰会上表示,昆仑万维从2022年12月发布了中国首个开源文本大模型,然后在2023年4月发布了“天工1.0”,再到2023年8月发布了国内首个AI搜索产品——天工AI搜索。现在他们又发布了“天工3.0”,这是中国首个在音乐AIGC领域达到SOTA的模型。

天工3.0目前性能已经全面超越3140亿参数的MOE大模型Grok-1,是全球第一。他们在模型技术支持能力上提升超过20%,在数学、推理、代码、文创能力上提升超过30%。

天工3.0在多轮搜索、搜索“研究模式”、智能体方面的能力也得到了大幅提高。例如,现在搜索“成都迪斯尼怎么去”,他们的大模型能够准确识别出“成都迪斯尼”是成都的一个小区,并且生成“成都迪斯尼”的攻略。在问天气怎么样的时候,大模型甚至能够把上海的天气以卡片的形式展现给用户,并生成相应的图片。

此外,天工3.0还在智能体方面取得了进展,现在用户可以通过非代码的形式生成智能体,比如生成一个关于特斯拉和小米SU7车型对比的表格。

除了天工3.0,昆仑万维还发布了天工SkyMusic,这是目前首个音乐AIGC的SOTA模型。SkyMusic在音质、自然度和发音可懂度等方面都有明显提升。他们的技术模型已经拥有近2000万首音乐的数据集,这使得他们在音乐指标上可以超过SUNO,达到SOTA。

昆仑万维的使命与目标是实现通用人工智能,让每个人更好地塑造和表达自我。他们相信通过AIGC技术的不断拓展,可以降低全世界创作内容的成本,打破强势文化的垄断地位,让每个少数族群都能够创作属于自己的内容,实现真正的文化平权。

昆仑万维的努力让我们看到了中国研发在垂直领域取得全球的SOTA的可能性。他们的成就让人们对中国在人工智能领域的发展充满信心。

看来,天工多模态大模型的演进正逐渐落地,我们可以期待更多创新和突破。让我们拭目以待吧!

Share this content: