【AI资讯】震动AI圈的OpenAI DevDay到底讲了什么?
创作者俱乐部成员
今天(北京时间11月7日)凌晨2点,差不多ChatGPT推出快一年的时侯,OpenAI在旧金山举办了首届开发者大会(OpenAI DevDay),这个堪称“AI春晚”的大会为什么会震动整个AI圈,接下来我用三分钟先带大家回顾整个大会,再聊聊此次大会的意义。
大会召开的市场背景:ChatGPT的周活跃用户达到了1亿人,另外还有200万开发者通过OpenAI的API构建应用。全球财富 500 强企业中,超过92%的公司都在使用OpenAI的系列产品。
01发布新模型:GPT-4Turbo,更快更强更便宜
发布会一开始,Sam Altman 就发布了 GPT-4 的升级模板: GPT-4 Turbo
GPT-4 Turbo 可供所有付费开发者通过传递gpt-4-1106-previewAPI 进行尝试,他们计划在未来几周内发布稳定的生产就绪模型。
这是个模型是根据众多开发者关注的6大问题下做了大升级:
升级1:更长的上下文长度
原本OpenAI所提供的最长上下文长度仅为32k,然而此次GPT-4 Turbo将该限制一举提升至128k,单个提示中容纳相当于 300 多页文本的内容。不仅如此,GPT-4 Turbo新模型在处理更长上下文时,能够保持更加连贯且准确的信息表达。
升级2:更强的控制
OpenAI为开发者提供了几种更强大的控制手段,以更好地进行API和函数调用。
首先,新模型提供了一个JSON Mode,可以确保模型以特定的JSON格式提供答案,这使得调用API更加便捷。此外,新模型还支持同时调用多个函数,并引入了seed parameter,以确保模型在需要时能够返回固定的输出。这些改进将进一步增强开发者的能力和效率。
升级3:模型的知识库升级
GPT 的知识库终于更新到了 2023 年 4 月
不再是停留在2021年11月
除了内部知识库的升级,GPT-4 Turbo 也升级了外部知识库的更新方式,现在可以上传外部数据库或文件,来为 GPT-4 Turbo 提供外部知识库的支持。
升级4:开放多模态API
新模型支持了 OpenAI 的视觉模型 DALL·E 3,还支持了新的文本到语音模型(TTS),并开放了他们的API
这意味着使用GPT-4 Turbo的应用将不限制于文本,可以让图像作为聊天完成 API 中的输入,从而实现生成标题、详细分析现实世界图像以及阅读带有图形的文档等用例,并支持图生图,文生音
在图像问题上, OpenAI还推出 了防止滥用的安全系统。在涉及图像版权问题上OpenAI将为所有客户提供相关问题的法律费用。
新 TTS 模型提供六种预设声音可供选择以及两种模型变体,在语音系统中,OpenAI 表示,目前的语音模型远超市场上的同类,并宣布了开源语音识别模型 Whisper V3。
升级5:模型微调定制
OpenAI将支持GPT-3.5 Turbo 16k 的版本的微调的定制了,同时推出一项用于微调GPT-4的实验性访问计划,允许开发人员创建ChatGPT的自定义版本,包括修改模型训练过程的每一步,进行额外的特定领域预训练、运行针对特定领域定制的自定义强化学习后训练过程。
OpenAI 也开始接受单个企业的模型定制(Custom Models)了,。不过,OpenAI并不推荐初创企业使用这一功能,因为前期的成本相对来说比较高昂。
升级6:更高的速率限制
发布会之后,所有付费 GPT-4 用户的每分钟令牌限制增加了一倍。用户可以在速率限制页面查看新的速率限制。OpenAI还发布了确定自动速率限制增加的使用等级,以便让用户的使用限制将如何自动扩展。
API 体系全线降价
GPT-4 Turbo 输入代币比 GPT-4 便宜 3 倍,为 0.01 美元,输出代币便宜 2 倍,为 0.03 美元。
GPT-3.5 Turbo 输入代币比之前的 16K 型号便宜 3 倍,价格为 0.001 美元,输出代币便宜 2 倍,价格为 0.002 美元。之前使用 GPT-3.5 Turbo 4K 的开发人员受益于输入代币 33% 的减少,价格为 0.001 美元。这些较低的价格仅适用于今天推出的新款 GPT-3.5 Turbo。
经过微调的 GPT-3.5 Turbo 4K 模型输入代币减少了 4 倍,价格为 0.003 美元,输出代币便宜了 2.7 倍,价格为 0.006 美元。微调还通过新的 GPT-3.5 Turbo 型号以与 4K 相同的价格支持 16K 上下文。
Sam 表示,在解决价格之后,下一个重点解决的问题将是速度问题,很快,开发者们就会发现 GPT-4 Turbo 将变快很多。
02 AI生态打造:公布GPTs与GPT商店计划
GPTs
不会写代码的普通人,对于一个特定的目的,也能通过GPTs自己做一个定制版ChatGPT,并且可以发布给别人使用,
制作自己的GPT应用非常简单:跟GPT Builder聊天,把想要的GPT描述一遍,然后就能生成自己专属的GPT。因为它们组合了指令、扩展知识库和行动
为此Sam Altman还在现场演示了
演示1:精心制作的课程规划师GPT,汇聚了编程能力和广泛的课程专业知识,帮助老师设计更吸引人的体验课程
演示2:知名设计平台Canva构建了一个GPT,支持用户通过自然语言描述设计需要的素材,比如让它为今天的招待会设计一份海报,定制GPT会根据用户提供的细节生成一些选项,用户通过点击和聊天的方式,就能获得最终设计图。
演示3:另一个伙伴Zapier通过构建自己的GPT,允许用户在6000个应用程序中执行操作,集成应用。
比如问今天的日程安排,GPT就会连接她的日历,做出提示,如果表示自己要走了,GPT会问她是否需要告之Sam Altman,同意之后,GPT会运行信息告知Sam Altman自己有事要离开了。
演示4:Sam Altman现场完成ChatGPT构建和分发GPTs,并进行提问
ChatGPT构建
输入创建指令:我想帮助创业公司的创始人思考他们的商业理念,并获得建议。在创始人得到了一些建议之后,问他们为什么没有增长得更快
GPT会提供该模型的头像,并自己取名为Startup Mentor(创业导师)
ChatGPT提问
和原来一样,输入问题和上传一些资料,GPT就能根据自己的资料库和用户上传的资料进行定制化的回答
GPT商店
每个用户自己打造的GPT应用都可以上传GPT商店供人下载使用,并且可以获得收益,这不是妥妥地在打造AI时代的“Apple store”,GPT商店预计在本月底上线
03发布GPT Assistant API:简化Agent构建
Sam Altman表示构建一个类似Agent的API是很困难的,往往需要数十个开发人员花费几个月的时间。为了简化这一过程,OpenAI推出Assistants API
Assistants API引入的一个关键更新是提供持久且无限长的线程(Threading),允许开发人员将线程状态管理移交给OpenAI,并解决上下文窗口长度约束的问题。
Assistants API还提供三款新的工具:
检索(Retrieval)
这个很好理解,可以让GPT模型获得数据库之外的知识来完成任务,例如最新的营销数据、用户留言等外部信息,让开发者不再为数据不精准而苦恼。
代码解释器(Code interpreter)
允许开发者在沙盒执行环境中编写和运行Python代码,可以生成图形和图表,并处理具有不同数据和格式的文件,允许AI助手迭代运行代码来解决具有挑战性的代码和数学问题等。
函数调用(Function calling)
可以使助手能够调用开发者定义的函数,并将函数响应合并到其消息中。
这些工具可以帮助开发者更好的将AI融入应用中,大大改善了开发者体验
OpenAI开发者体验主管Romain现场演示了Assistants API的开发一个案例
如何花1美元创建一个为全球探险家提供的旅行服务应用程序
首先要构建一个该网站的AI聊天助手,开发者只需输入聊天助手的名称、一些初始说明,选择需要使用的模型,并选择需要的工具即可自动生成,并打开代码解释器和检索保存
对于每个新用户,系统将创建一个新的线程,当用户与他们的助手互动时,系统将把他们的消息添加到线程中,简单地运行助手,随时将响应流式传输会应用程序,开始体验一下应用程序吧
输入:我们去巴黎吧
助手就会给出非常专业的回复,比如巴黎的介绍对应的美景和住宿,并将地图定位到巴黎
输入:最重要的10件事情是什么
助手会仔细地列出10件事情,会并有标注在地图上显示
将已经订好的巴黎机票上传给助手,检索系统读取这些文件后助手将会自动解析,并以文字或交互形式将有关的内容补充进来。这个功能可以用在很多信息的补充上比如自己的订房信息,朋友的特别安排之类,让助手能适应更多复杂的条件,给出准确的意见
不再是“黑匣子”,这次把工作步骤都清楚地展示在开发者仪表盘里,包括函数,使用正确的参数调用,以及自己上传的文件,
输入:4个朋友住在这家Airbnb,加上我的机票,我的那份是什么
助手写出一些线索来回答这个问题,计算你在巴黎有多少天,朋友的数量,它也会进行汇率变动计算,为我们计算得到这个答案
Romain还演示了一个为此次开发者大会构建的专用Assistant-助手Whisper,检索系统包含本次大会的全部数据,并且使用语音交互取代了文字页面交互。
Romain通过语音输入,让该助手Whisper与现场与会者打了个招呼。随后,为了调动氛围,他先是让Whisper随机抽取5名“幸运观众”,最后又为现场所有与会者每人提供了500美元的API积分。
最后是Sam Altman出场对大会进行了总结,并对团队表示感谢,期待明年的OpenAI DevDay
写到最后
这次发布会标志这Open AI迈向AI agents的第一步,特别是GPTs和GPT商城的公开,也是Open向全球公开展示自己AI生态的版图,AI这个人类历史上从未出现的工具,他随着时间发展会越来越智能,越来越离不开他,作为先进的生产力工具将重塑我们的生活方式,至于它将会给我们的世界带来什么样的影响?对此我是充满乐观的。
如果问Open AI的最终目标是什么,可以思考一下Sam Altman在发布会中说 话[我们相信,如果你给人们更好的工具,他们会做出惊人的事情,人们想要更聪明的人工智能,更多的个人定制,更多能完成的事情,最终你只需要问电脑你需要什么,它会帮你完成所有这些任务]
这场AI春晚过后,底层大模型的竞争将会打的更加激烈,随着模型性价比越来越高,开发条件和工具越来越完善,未来更多的AI应用将会爆发式的出现,对创业者和开发者来说,一个“apple时刻”又已经到来。
投票对AI的发展保持什么态度(3选1)
- 乐观 91
- 悲观 5
- 无所谓 9
创作者俱乐部成员
创作者俱乐部成员
@金山办公