【AI资讯】智谱 AI CEO 张鹏:AI Agent 是重要新风向,大模型竞争已步入混战后期(二)

小哥
小哥

创作者俱乐部成员

智谱 AI CEO 张鹏:AI Agent 是重要新风向,大模型竞争已步入混战后期(二)

文章转自「首席数字官」

--03--

开源闭源并不矛盾

智谱 AI 模型开源时间线

极客公园:刚刚也提到了开源,之前我们采访月之暗面 CEO 杨之麟的时候,他就说可能在未来,超级应用一定会诞生在闭源,因为就是它能够更加深入的去开发。关于这个你怎么看?

张鹏:开源和闭源的关系,至少我个人来看,从来不觉得是一个完全对立的事情。

开源是一个可以保持行业或者技术领域活跃性的一件事,可以保持生态圈的多样性、活跃性。因为开源社区的参与者都比较活跃和投入,都是相对愿意去做贡献的一群人,他们的讨论,他们的交流,还有对开源项目的代码贡献,经验贡献,其实也有帮忙推动技术探索,提出更多的选择和可能性,也就是我们也会从开源中可以获得很多反馈和营养。

闭源的话更考虑商业价值的稳定性、服务的持续性和安全性,因为企业有一定的主体责任,也有商业回报的诉求,这个是对等存在的。

总之就是,开源会保证生态,然后闭源会保证商业服务的价值,两者之间其实并不矛盾。

极客公园:超级应用还是会产生在闭源项目里。

张鹏:当然很难想象一个超级应用是直接建立在一个开源项目上,它可能还是要走商业版本去做,因为它涉及到的事情很多,而不是说开源一个项目,或者说扔出来一个产品就可以,如果没有后续的运营维护等等这一系列的服务,怎么可能做得成超级应用?

当然超级应用并不是未来的唯一解。超级应用当然是大家都想做的事情,这个毫无疑问。谁不想做这样一个东西?但具体这个超级应用是啥,现在也没人能说的清楚。

极客公园:除了超级应用,还有一些什么可能的比较好的解法?

张鹏:这个就跟我们本身的发展战略也有关系。一个是像应用这一块,我们也有在做 App,我们的切入点就是像智谱清言这种 AI 助手,这个方向可能会是未来的超级应用之一,毕竟这个需求还是特别明显。

另一个是我们还是更多 focus 在做基础模型、通用模型这一块。从商业落地的场景上来看,我们还是会以基础模型为基础,去赋能上层的比如行业、应用、客户等等这些层面。

--04--

ChatGPT 3.5并非 Golden Rule

极客公园:最近很多国内厂商都标榜自己的大模型达到了 3.5,从技术角度来看国内顶尖模型是否真的达到了 ChatGPT 的水平?有一种说法年底能否达到 3.5 会是国内这波大模型创业的分水岭,你怎么看?

张鹏:国内这些当然也在看,但是我们其实并没有特别的去对标过。我们也从来不认为说 ChatGPT 3.5 是个终点,或者说是个试金石什么之类的,它只不过是这个过程当中的一个 check point,就是大家在这个点上 check 一下,有一个对标,就是看看能做到什么。

因为 Open AI 跑得快,它跑过去了,留一条线给你,你什么时候能跑过这条线,或者像跳远一样,跳到一个及格线或者一个达标线,这样的一个概念。但这个线也不是说特别精确,只是大家需要的一个激励自己或者检验自己进步的一个标尺而已。

所以你不能把它当做一个 golden rule 或者是用来 check 的一个精确标准,当然大家愿意去拿一个比较统一的标尺去量这个事情,也是个好事。那怎么实打实地拿出 evidence 来证明你真的做到了,那又是另一件事。

极客公园:那你觉得这个分水岭会是什么呢?

张鹏:从技术或者说行业发展的角度来看,我没觉得这件事情有一个这样的分水岭。因为技术始终是不断向上发展的。这个东西只是一个标尺,大家共识里面的一个标尺,标识越共识,大家越容易理解,但并不代表这个事情它就是个达标线。也没有人说你做不到 ChatGPT 3.5,你就别来做了,或者是也拿不到钱或者什么之类的。

而且不能简单用 ChatGPT 3.5 作为唯一标准来评判其他模型。毕竟每个模型有自己的定位,不应该片面用一个模型的能力水平来评判其他模型。

不同的模型可以解决不同的问题,服务不同的需要。应该鼓励多样性,而不是要求所有模型都追求通用性。每个模型都可以通过自己的方式找到价值所在。一个模型的成功与独特之处,不是只用能力高低就能简单划分出来的。

这么来说吧,可能除了一个共识的标准,还有大量空间可以进行创新探索。

极客公园:技术肯定是不断向前发展,那从公司的视角怎么看?

张鹏:我觉得这个事情越往后推,肯定是趋向一个总体稳定的过程。昨天其实也有人问,最终大模型的这个厂家会剩下几个,大概的一个共识是做通用基础模型的不会超过 10 家,因为这件事情太耗钱,技术密度太高,未来也不需要那么多通用的基础模型。因为同质化比较严重的话,需要那么多干嘛?

除了这些通用技术模型以外,其他的比如 Midjourney,Character AI 这一类的行业的,或者一些专业的模型和应用,还是会不断的涌现。

--05--

大模型竞争已步入混战后期

极客公园:怎么看待当前大模型行业的竞争格局?

张鹏:基本上在模型本身这一侧的话,现在是混战的后期,格局会慢慢地清晰下来。

极客公园:现在大模型创业的环境与之前最火热的时期相比有哪些变化?投资、政策等因素又带来了哪些挑战?

张鹏:我比较赞同红杉资本的公众号有篇文章讲的,现在进入到了一个新的阶段,这个新的阶段跟之前那个阶段略微会有些差异。

之前火热是大家都没把这些事情想的特别明白,投资也好,政策也好,市场的期待也好,大家是把它胡子眉毛一把抓的。不管你是做基座模型的,做行业模型的、还是做应用的,反正只要是跟这个沾边,都算到这个里头。

但是到了现在这个阶段,大家逐渐的会把这些尝试分开来看,谁是做通用的,谁是做行业的,谁是做应用的,可能慢慢地就会把它分清楚。

极客公园:在这样的一个背景下,你认为哪些方面的差异会让智谱AI能在行业内站稳脚跟?

张鹏:这个事情对我们来讲其实是比较明确的。首先第一个我们对这件事情的认知和目标非常明确,就是聚焦在基座和通用的基座模型上、技术模型上。然后行业应用、商业落地就用生态式的方法来做,当然核心的还是我们自己的技术。随着时间往后,大家对我们的认知也越来越趋同和一致,这是个好事。

极客公园:在你看来,这次新模型意味着智谱 AI 在大模型领域将达到怎样的技术地位?

张鹏:我们基本上是跟自己比和跟 OpenAI 比,因为 OpenAI 是做的最好的,我们基本上是这样来比,那至于国内的水平,大家各自心里有把尺可以去量。

极客公园:智谱 AI 下一次在模型上的迭代会是在什么时候?

张鹏:我们一般的迭代周期就是 3 到 6 个月一代。上次二代是 6 月底,这次是 10 月底。

极客公园:现在你们的团队规模?

张鹏:就是大概的规模是 400 多人,当中有 70% 左右的研发,当然这个研发是比较宽泛的概念。

极客公园:在 27 号的现场演示过程中,智谱清言在代码理解上出了一些 bug(输入了「生成一颗红心」的代码,最后给出绘画结果却是两条函数),所以智谱清言在准确度上的水平是怎么样的?

张鹏:准确度肯定在持续提升。当然这个具体的成功率或之类的,你可以去试一试,可能每个人自己的体感不太一样。根据测试的用例、测试的方法周期范围,只能是无限的去逼近准确,但也没办法做出最准确的一个测算。虽然整体成功率还是比较高,但是现场演示的确会有一些风险,这个也没办法,我们还是希望把真实的演示呈现给大家。目前就是这样一个情况,真实的演示也反映技术本身。

理想状况下的「生成一颗红心」

极客公园:之前有其他大模型出现了不实的一些 AI 生成内容,像这种大模型的幻觉问题上,你们这边是什么样的进展?

张鹏:这个事是这个「老大难」问题,现在也没有人说能够有办法把它根除掉。我们在讨论这件事情的时候,大部分还是说得从技术上想办法去解决这个问题,比如引入知识,或者引入这种符号的一些方法,来帮助我们解决这个问题,也可能 super alignment(对齐)可以解决这个问题,当然 super alignment 是一个整体上的大的方向,它里面具体用什么方法,还是需要继续去尝试。

黑龙江省
浏览 3522
收藏
6
分享
6 +1
2
+1
全部评论 2
 
鱼鱼
WPS AI
· 北京
回复
 
鱼鱼
WPS AI
· 北京
回复