【AI资讯】人工智能大模型体验报告3.0 - 新华社研究院

#WPS超玩会 #WPS AI

任舟

创作者俱乐部成员

新华社研究院中国企业发展研究中心日前发布了《人工智能大模型体验报告3.0》。

从1.0版本到3.0版本的测评过程中，参与厂商的分数变化反映了大模型产品竞争的激烈和技术的进步。可以明显观察到一些厂商在持续进步，而一些新的厂商也在逐渐崭露头角。

1.0版本（5月测评）

ChatGPT系列占据领先位置，其中ChatGPT4表现最佳，紧随其后的是ChatGPT3.5。百度文心一言位于整体第三位置，展现出了较强的实力。这一阶段的科大讯飞星火和阿里通义千问也进入了整体前五，国内前三，表现不俗。

2.0版本（8月测评）

专注于国内市场，科大讯飞星火实现了跨越式发展，整体表现亮眼。百度文心一言、商汤商量与智谱CHATGLM也取得优异的成绩。同时，360智脑和昆仑万维天工也进入了前五。这些变化展示了厂商之间的激烈竞争和技术进步的速度。

3.0版本（11月测评）

科大讯飞星火依旧保持领先，商汤商量紧随其后，稳定发挥。值得一提的是，澜舟科技孟子取得了显著进步，字节跳动豆包作为新面孔，在这次评估中崭露头角。

纵观这三个版本的发展，可以看出一些规律。

首先是竞争日益激烈，厂商之间的得分变动频繁，这体现了大模型产品市场的活跃和竞争激烈程度。其次，技术进步明显，从1.0到3.0版本，各个厂商的产品在性能和功能上都有显著提升。最后，新面孔的涌现也展示了这个行业的活力和吸引力，新的厂商不断加入竞争，推动了大模型产品的发展。

随着大模型快速的升级迭代，大模型的技术能力开始越来越多地体现在产品能力上。

在C端，职场、营销、出行、生活、公文、客服等多个场景个人助手陆续上线；在B端，制造、电力、金融、手机、传媒等行业的大模型和产业融合优秀案例也在不断出现。

从国家政策来看，政策支持已经从宏观走向落地。

“十四五”期间，国务院、科技部、网信办针对人工智能的未来发展陆续出台了相关指导方案和激励支撑政策，对人工智能的整体发展方向和技术发展重点做出规划。地方也纷纷出台支持人工智能大模型发展的政策。北京市人工智能公共算力平台于9月份正式启动，该算力平台将位于中关村科学城北部，未来将为企业提供4000P的算力；上海市发布了《上海市推动人工智能大模型创新发展的若干措施》，聚焦大模型创新能力、创新要素供给、大模型创新应用、创新环境四大方面，为上海市大模型创新发展指明方向。

人工智能大模型的发展任重而道远。

虽然人工智能大模型的发展取得了较大的进步，但是不可忽视的是，人工智能大模型依然有不稳定、“幻觉”等问题需要进一步解决，另外大模型的安全问题也不容忽视。

我们期待，在未来，人工智能大模型能够推动数字经济和产业经济的深度融合，掀起新一轮技术革命，为社会经济发展提供源源不断的科技动力。

点击阅读报告原文人工智能大模型体验报告3.0-新华社研究院-2023.11

2023-11-25 13:56:53 山西省

8 +1