首页 >  创业论坛 >  正文
5 月,大模型继续遍地开花
发布日期:2023-05-13

5 月,大模型继续遍地开花原创:Julie 张、元鹅

来源:鞭牛士

5 月,大模型继续遍地开花

图片来源:由无界 AI工具生成

ChatGPT 火爆后,国内外大模型的研发和面试,也进入快车道。

此前,鞭牛士曾发布《4 月,国内大模型遍地开花》一文,重点盘点在今年 3、4 月推出的大模型项目。

热潮还在继续,一个月内,又有多家大模型产品面世,除了通用向,部分大模型也更细分为产业向、金融向、教育向、交通向等。

在 AI 的 iPhone 时刻,在 Mobile 时代进入到 LLM 时代的奇点时刻,在眼花缭乱的“发布会”狂欢之外,疑问依然没有解决:我们准备好这场 AI 军备竞赛了么?我们需要这么多大模型吗?

360 智脑

4 月 9 日,360 官方正式宣布,基于 360 GPT 大模型开发的人工智能产品矩阵“360 智脑”落地搜索场景,将面向企业用户开放内测。

据悉,360 智脑是一款基于人工智能技术的搜索引擎产品。这款产品将采用先进的自然语言处理技术,通过语音交互和文字输入,智能识别用户的需求,并提供更准确的结果。此外,360 智脑还将与浏览器、智能营销、苏打办公、数字助理等场景应用深度结合,提升用户体验及生产力。

4 月 21 日,周鸿祎发布了一篇内部信,内容要求 360 每一位员工、每个产品和业务都要全面拥抱人工智能,适应人机协作,着手产品重塑。

4 月 26 日,周鸿祎再度公开演示“360 智脑“迭代进展。演示环节中,周鸿祎让 360 智脑以“你真没出息”为题,模仿家长给不爱学习的孩子写一封信。

5 月 7 日晚,在与俞敏洪的对谈直播中,周鸿祎展示了接入搜索引擎的大模型产品“360 智脑”在问答、写作、文生图场景下的多模态能力。周鸿祎在直播时表示,国内大模型如果不经过两年模仿,上来就说超越,那叫吹牛。

京东 ChatJD

2 月 10 日,京东云宣布将推出产业版 ChatGPT:ChatJD。ChatJD 智能人机对话平台,预计参数量达千亿级。同时,京东云还公布了 ChatJD 的落地应用路线图“125”计划。

据了解,“125”计划包含一个平台、两个领域、五个应用。

1 个平台是指 ChatJD 智能人机对话平台,即自然语言处理中理解和生成任务的对话平台,预计参数量达千亿级;2 个领域分别为零售、金融;5 个应用包含内容生成、人机对话、用户意图理解、信息抽取、情感分类,涵盖零售和金融行业复用程度最高的应用场景。

京东集团副总裁何晓冬也回应了相关布局,称京东在 ChatGPT 领域拥有丰富的场景和高质量的数据,例如京东云言犀每天和用户进行 1000 万次的交互。

学而思 MathGPT

近日,学而思宣布正在进行自研数学大模型的研发,命名为 MathGPT,面向全球数学爱好者和科研机构。目前 MathGPT 已经取得阶段性成果,并将于年内推出基于该自研大模型的产品级应用。

据悉,MathGPT 希望弥补和攻克 LLM 的三个问题:题目要解对、解题步骤要稳定清晰、解题要讲的有趣个性化。

学而思已将 MathGPT 作为公司核心项目,由 CTO 田密负责,并在美国硅谷成立海外算法和工程团队。

淘云科技 阿尔法蛋儿童认知大模型

5 月 6 日,淘云科技宣布推出儿童认知大模型——阿尔法蛋儿童认知大模型,为孩子在练表达、塑情商、启创造、助学习等方面带来全新交互体验。

淘云科技创始人刘庆升介绍,随着讯飞星火认知大模型进入研发阶段,淘云科技将长期积累的儿童原始语料加入到大模型中,这些语料涵盖了从儿童故事、百科知识和科普读物。

据悉,淘云科技引入主动对话,让机器人发起和孩子经历相关的话题,通过多轮对话的方式,引导孩子敢表达,多表达。

出门问问 序列猴子

4 月 20 日,出门问问在 2023 AIGC 战略发布会上宣布内测探索大模型“序列猴子”。

据介绍,出门问问大模型“序列猴子”是一款具备多模态生成能力的大语言模型,模型以语言为核心的能力体系涵盖“知识、对话、数学、逻辑、推理、规划”六个维度,能够同时支持文字生成、图片生成、3 D 内容生成、语音生成和语音识别等不同任务。

除推出大模型之外,出门问问还同步推出面向创作者的 CoPilot 产品矩阵、面向 C 端的升级版语音助手魔法小问。其中,面向创作者的 CoPilot 产品矩阵包含 AI 写作平台“奇妙文”、AI 绘画平台“言之画”、AI 配音平台“魔音工坊”和数字人视频与直播平台“奇妙元”。

出门问问创始人李志飞表示,“序列猴子”在训练过程中已经展现出了“涌现”能力,目前正处于“顿悟”阶段,未来提升的速度会越来越快。

X.AI TruthGPT

特斯拉 CEO 埃隆・马斯克于当地时间 4 月 17 日接受采访时表示,他将推出一种人工智能(AI),并把它称之为“TruthGPT”(真相 GPT)。

“我将启动一种被我称之为‘TruthGPT’的东西,或者是一种最大限度地寻求真相的 AI,它试图理解宇宙的本质。”马斯克称,这个起名方式有点像特朗普此前推出的社交媒体 Truth Socia(真相社交)。

据悉,马斯克已经创建了一家名为 X.AI 的新人工智能公司,该公司在内华达州注册。马斯克是该公司唯一在册的董事,而马斯克家族办公室主任 Jared Birchall 是该公司的秘书。X.AI 已经授权为这家私人公司出售 1 亿股股票。

作为其人工智能雄心的一部分,马斯克在过去几个月里一直在招募研究人员,目的是建立一个 OpenAI 的竞争对手。

传小红书布局 AI 大模型

5 月 6 日,有报道称小红书从 3 月份起筹备了独立的大模型团队,核心员工来自广告业务的 NLP 技术团队。

目前,该部门在内部为保密状态,在员工系统里也被直接隐藏。消息显示,小红书大模型团队的负责人为张德兵。

张德兵在负责小红书的大模型之前,曾任过一年的小红书智能多媒体算法负责人,主要负责 AI 和音视频算法方向。在更早期间,张德兵还在快手担任多模态智能创作组负责人,负责视觉相关的算法研发。

据悉,除了成立大模型团队以外,小红书内部还有多个独立部门同时推进 AIGC 方向的落地探索据了解,今年 4 月,小红书上线了一款名为“Trik”的 AI 创作应用,主打 AI 绘画。

科大讯飞 星火认知大模型

5 月 6 日,科大讯飞正式推出“讯飞星火认知大模型”。该大模型具备七大维度能力,包括文本生成、语言理解、知识问答等。据介绍,该大模型支持多风格多任务长文本生成,同时还可以根据不同文章风格进行写作。

据科大讯飞董事长刘庆峰介绍,星火认知大模型将在 8 月 15 日正式开放给客户,10 月 24 日科大讯飞全球开发者大会期间,希望星火能够全面对标 ChatGPT。

5 月 8 日,科大讯飞股价再度涨停,收报 63.86 元,今年以来其股价已经多次创出历史新高,涨幅达到 94.52%,接近翻了一倍,其总市值已达 1500 亿。

然而,随后有网友质疑“星火大模型是套壳 OpenAI 的 ChatGPT”,理由是他们在与星火模型对话中,机器说其是由 OpenAI 开发而来。

对此,科大讯飞 5 月 11 日表示,讯飞星火认知大模型为公司自主研发,使用了海量数据训练,但由于 ChatGPT 比较火,训练数据中出现较多 OpenAI、ChatGPT 等词汇,因而在有些问答中会错误地出现以上信息。

科大讯飞称,网传讯飞星火大模型“套壳 OpenAI 的 ChatGPT”既不符合事实,也不符合逻辑:如果是套壳 ChatGPT,就不可能出现讯飞星火大模型的响应速度比 ChatGPT 还快;更不会出现讯飞星火大模型在文本生成、知识问答等方面的结果均优于 ChatGPT 的情况。

网易有道 子曰大模型

5 月 5 日,网易有道发布了一段基于“子曰”大模型研发的 AI 口语老师剧透视频。据介绍,“子曰”是有道自研的教育场景下的类 ChatGPT 模型,可以为学生提供更加个性化、高效的口语学习服务。

视频显示,网易有道 AI 口语老师能提供多种练习场景,同时会根据用户需求扮演多种角色,进而引导用户进行多轮对话、解决长期困扰中国学习者的“开口难”的问题。

同时,网易有道在评论区表示,“目前该产品仍在研发阶段,我们会持续打磨完善,争取在合适的时机尽快和大家见面。”

谷歌 PaLM 2

谷歌母公司 Alphabet 计划在谷歌 I/O 开发者大会上宣布一系列生成式人工智能更新,包括推出通用大语言模型(LLM)。据悉,谷歌 I/O 开发者大会于 5 月 10 日召开。

据媒体看到的有关谷歌 I/O 的内部文件,该公司将推出其最新、最先进的大型语言模型——PaLM 2。该模型包含 100 多种语言,能执行广泛的编码和数学测试,以及创造性写作测试和分析。

就大模型方面,内部文件显示,谷歌一直在开发一款名为“多面巴德”(Multi-Bard)的多模式版本,该版本使用了更大的数据集,可以解决复杂的数学和编码程序。

云从科技 行业精灵大模型

消息称 AI 企业云从科技将于 5 月 18 日正式发布大模型产品。云从科技的大模型产品将主要应用于智慧金融、智慧交通以及公司此前披露定增预案中所述领域。该公司的大模型产品将面向政府、企业以及消费者三个方向,覆盖金融、游戏、质量、交通等多个领域。

3 月 30 日晚,云从科技披露定增预案,拟向不超过 35 名发行对象发行股份不超过 2.22 亿股,募集资金不超过 36.35 亿元,拟全部用于云从“行业精灵”大模型研发项目。

自今年 2 月以来,云从科技已 3 次发布股价异动公告。据了解,自今年年初至 5 月 9 日收盘,云从科技股价区间涨幅为 151.47%,在 4 月初,云从科技股价达到上市以来的最高点,盘中一度接近 60 元。

麒麟合盛 APUS AiLMe

4 月 18 日,移动互联网公司麒麟合盛 APUS 正式发布自研多模态人工智能大模型“AiLMe”。

据介绍,AiLMe 参数已达千亿规模,具备对文本、图像、视频、音频的理解和生成能力。

针对具体应用场景,APUS 从 AiLMe 内蒸馏出文本模型“异雀八”、图像模型“异雀三”、视频模型“异雀四”、音频模型“异雀六”四个垂直领域精炼模型,并基于此创新研发出“智能问答大师、简笔成画、墨染”等系列 AI 产品。

据了解,AiLMe 将会向客户开放 API 接口和附加服务。届时,客户可根据实际应用需求调用 AiLMe 的各项 AI 技术能力。

软银拟打造“日本 ChatGPT”

5 月 11 日,软银集团旗下的电信子公司软银公司宣布,将加入打造 ChatGPT 版本的全球竞赛。

软银 CEO 宫川润一在业绩发布会上称,该公司已经于 3 月成立了一个新实体,挑选了大约 1000 人来开发 OpenAI 旗下人工智能聊天机器人 ChatGPT 的日本版本。

宫川润还强调,软银集团创始人孙正义多年以来一直将人工智能看作人类利用技术方式的革命性力量。他还透露,孙正义最近召集了一群工程师,讨论了关于 CahtGPT 的可能性。

受此消息影响,一批与人工智能相关的日本公司股价飙升。

(鞭牛士整理自 36 氪、第一财经、猎云精选、鲸媒体、北青网、和讯网)