【资讯】大模型新鲜事 | 9个AI国产大模型获批
创作者俱乐部成员
大模型新鲜事 | 9个AI国产大模型获批;联发科天玑9300芯片发布;OpenAI推出GPT-4 Turbo
大模型在当下已成为各大厂的谈资,不做大模型似乎意味着你已经落伍了,因此造成了大模型争先发布上线的局面。「大模型动态」将带您探索大模型领域重点事件及热点资讯,以下是本周发生的大模型事件。
海外新动态:
OpenAI推出GPT-4 Turbo
在美国当地时间6日周一的 OpenAI 首届开发者大会上,OpenAI 推出了 GPT-4 Turbo,这款模型正处于预览状态,号称对于开发者而言“比上代 GPT-4 便宜三倍”。
OpenAI:GPT-4 周活用户破亿
美国当地时间6日周一,在 OpenAI 首届开发者大会上,该公司首席执行官萨姆・奥特曼(Sam Altman)宣布,ChatGPT 的周活用户数达到 1 亿。网易科技报道,自 3 月通过 API(应用程序编程接口)发布 ChatGPT 和 Whisper 模型以来,该公司目前拥有超过 200 万名开发者,其中包括 92% 的财富 500 强企业。
ChatGPT发生严重故障
北京时间8日晚间,人工智能公司OpenAI旗下聊天机器人ChatGPT发生重大故障中断,导致该应用无法使用,随后该话题登上了热搜。据了解,该故障中断发生的大致时间为北京时间11月8日21点30分至23点30分左右。北京时间9日0点左右,OpenAI官方回应称,已经发现了问题并实施了修复,现在服务已正常响应。
微软将使用甲骨文云服务器,优化Bing对话式搜索
微软和甲骨文宣布建立新基于云的服务:Oracle Database Azure,甲骨文将为微软的 Bing 搜索服务提供支持。此外,甲骨文还与微软达成一项新的多年期协议,将使用甲骨文云基础设施 (OCI) 与 Azure 人工智能基础设施相结合,以支持和优化 Bing 对话式搜索。
微软宣布将大模型引入Xbox
微软 7 日宣布将与 Inworld AI 合作开发 Xbox 工具,使开发者能够创建基于 AI 的角色、故事和任务。
据IT之家报道,此次合作主要将包括一个“AI 设计 Copilot”系统,Xbox 开发者可以借助该系统创建详细的脚本、对话树、任务线等等。
三星自研大模型高斯公布
在 8 日的三星人工智能论坛 2023 上,三星官方正式公布了其自研的生成式 AI 产品 Gauss(高斯)。
该大模型由 Samsung Gauss Language、Samsung Gauss Code 和 Samsung Gauss Image 组成,以建立机器学习和人工智能支柱正态分布理论的传奇数学家约翰・卡尔・弗里德里希・高斯的名字命名。
微软联手北大,发布大模型测试基准
据品玩引述 HuggingFace 页面报道,微软研究院联手北京大学,共同发布了一款名为 PPTC 的大模型测试基准,可以用于测试大模型在PPT 生成方面的能力。
研究团队表示,PPTC包含 279 个涵盖不同主题的多回合会话和数百条涉及多模式操作的说明。研究团队还提出了PPTX-Match评估系统,该系统根据预测文件而不是标签API序列来评估大语言模型是否完成指令,因此它支持各种LLM生成的API序列。
消息称苹果正利用大语言模型改造Siri
爆料者 Tech_Reve 在 X 平台声称,苹果公司正在使用大语言模型(LLM)将 Siri 完全改造成“终极虚拟助理”,并准备将其开发为“最强大的杀手级人工智能应用程序”。据悉,苹果正在积极进行中这项综合开发工作,第一批产品预计将在 WWDC 2024 的 iOS / iPadOS 18、macOS 15 中亮相,苹果同时计划令改进后的 Siri 作为 iPhone 16 机型的“主打功能”。
亚马逊据称成立AI模型训练团队
知情人士透露,亚马逊将投资数百万美元训练大型语言模型 (LLM),希望它能与 OpenAI 和 Alphabet 的顶级人工模型相媲美。该团队由 Alexa 前负责人 Rohit Prasad 领导,目前尚未公布具体时间表。亚马逊已经训练出一些规模较小的模型,并与人工智能模型初创公司 Anthropic 和 AI21 Labs 等达成合作。训练更大的人工智能模型需要更高的计算能力,因此亚马逊正在考虑削减零售业务的交付和运输规模以节省成本。
英伟达H100再次刷新六项纪录
英伟达 9 日发布新闻稿,表示旗下的 H100 GPU 在 MLPerf 基准测试中创造了 6 项新记录。据悉,MLPerf LLM 基准测试是基于 OpenAI 的 GPT-3 模型进行的,包含 1750 亿个参数,训练这样一个大模型需要大约 3.14E23 FLOPS 的计算量。
英伟达最新的 Eos AI 超级计算机配备了 10752 个 H100 Tensor Core GPU 和 NVIDIA 的 Quantum-2 InfiniBand 网络,训练完 GPT-3 仅仅只需要 3.9 分钟,比 6 月的测试结果整整快了 7 分钟。
国产大模型:
英伟达或推出针对中国区的最新AI芯片
《科创板日报》报道,从产业链人士处了解到,英伟达现已开发出针对中国区的最新改良版系列芯片: HGX H20、L20 PCle和L2PCle。
9个AI国产大模型获批
网易有道(“子曰”大模型)、面壁智能(“面壁露卡Luca”)、出门问问(“序列猴子”)、昆仑万维(“天工”大模型)、美团(模型)、知乎(“知海图AI”模型)、月之暗面(moonshot)、金山办公(WPS AI)、好未来(MathGPT大模型)这 9 家公司的 AI 大模型产品获批,今日起面向全社会开放服务。
联发科天玑9300芯片发布
在 6 日晚举行的联发科天玑旗舰芯片新品发布会上,联发科正式发布了新一代旗舰移动平台天玑 9300,这也是全球首款全大核架构智能手机芯片。天玑 9300 旗舰 5G 生成式 AI 移动芯片集成 MediaTek 第七代 AI 处理器 APU 790,为生成式 AI 而设计,支持终端运行 10 亿、70 亿、130 亿、至高 330 亿参数的 AI 大语言模型,通过先进的硬件压缩技术 NeuroPilot Compression,大幅减少 AI 大模型对终端内存的占用,让生成式 AI 在端侧流畅运行。联发科称,使用 Stable Diffusion 高速生成式 AI 图像生成时间小于 1 秒。
在 MediaTek AI 处理器 APU 790 的加持下,天玑 9300 旗舰 5G 生成式 AI 移动芯片可以基于基础大模型持续在端侧进行低秩自适应(LoRA,Low-Rank Adaptation)融合,进而赋予基础大模型更加全面的能力。
此外,MediaTek 的 AI 开发平台 NeuroPilot 还构建起丰富的 AI 生态,支持 Android、Meta LIama 2、百度文心一言大模型、百川智能百川大模型等前沿主流 AI 大模型,为用户带来包含文字、图像、音乐等领域在内的终端侧生成式 AI 创新体验。
李彦宏:重复造大模型将造成极大浪费
李彦宏在 2023 年世界互联网大会上表示,繁荣的 AI 原生应用生态将推动新一轮的经济增长,但重复造轮子会浪费社会资源。他建议通过建设大模型生态和使用插件或 API 的方式打造自己的行业应用,这是门槛最低也最容易上手的 AI 原生应用开发方式。
百度王海峰:文心一言用户规模已达7000万
百度 CTO 王海峰 11 月 9 日在 2023 年世界互联网大会乌镇峰会上披露,文心一言自 8 月 31 日面向全社会开放至今,用户规模达到 7000 万,场景 4300 个,应用 2492 个。飞桨和文心生态已凝聚 800 万开发者,服务 22 万家企事业单位,创建了 80 万个模型。
腾讯蒋杰:超180项业务已接入混元大模型
“腾讯正在持续探索大模型应用场景,目前内部超180项业务已经接入腾讯混元大模型进行内测”,11月9日,腾讯集团副总裁蒋杰在2023年世界互联网大会乌镇峰会上表示。
阿里即将开源720亿参数大模型
阿里巴巴集团 CEO 吴泳铭在 2023 年世界互联网大会上表示,我们处在传统计算向 AI 计算的切换节点上,而支持 AI 的数字基础设施必须融合 AI 能力。阿里巴巴即将开源 720 亿参数大模型,这将是国内参数规模最大的开源大模型。
京东:言犀大模型在多个场景试点接入
在 9 日举行的 2023 年乌镇峰会互联网企业家论坛上,京东集团 CEO 许冉表示:京东产业大模型 —— 言犀大模型,已经在消费导购、商家经营、客服售后、医疗问诊等多个供应链场景中试点接入。
零一万物发布大模型 Yi-34B
11月6日,李开复博士带队创办的AI 2.0公司零一万物,正式开源发布首款预训练大模型 Yi-34B。
根据 Hugging Face 英文开源社区平台和C-Eval 中文评测的最新榜单,Yi-34B预训练模型以黑马姿态取得了多项 SOTA 国际最佳性能指标认可,成为全球开源大模型“双料冠军”,这也是迄今为止唯一成功登顶 Hugging Face 全球开源模型排行榜的国产模型。
蚂蚁集团百灵大模型宣布通过备案
蚂蚁集团6日宣布,根据国家《生成式人工智能服务管理暂行办法》指导要求,蚂蚁百灵大模型已完成备案。据介绍,蚂蚁旗下基于百灵大模型的多款产品已陆续完成内测,将向公众开放。蚂蚁百灵语言大模型采用 Transfromer 架构,基于万亿级 Token 语料训练而成,支持窗口长度达 32K。