本报(chinatimes.net.cn)记者陶炜 张智 南京报道
“我们原先的计划是在四季度发布我们的讯飞星火认知大模型,现在提前到5月6日发布。一方面是想让大家一起看看,认知大模型到底能做成什么样子;另一方面也是觉得,我们的大模型还是有一定竞争力的。”4月20日晚间,在科大讯飞(002230.SZ)的投资者交流会上,董事长刘庆峰如是说。就在当日上午,科大讯飞发布消息,将在5月6日正式发布讯飞星火大模型这一人工智能成果。
美国人工智能实验室OpenAI研发的对话式大型语言模型ChatGPT在2022年11月30日的发布,让人们大受震撼。作为人工智能技术驱动的自然语言处理工具,ChatGPT能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。在此之后,国内科技企业巨头们也加快了在这一领域的推进进度。
今年3月16日,百度正式发布了全新一代知识增强大语言模型——文心一言,如今则是科大讯飞。“大模型绝不仅仅是生成式AI,而是会对社会产生全面影响的全新变革,会带来整个互联网甚至信息产业的重塑。两年内,所有APP会基于大模型重写一遍。”刘庆峰如是评价大模型的重大意义。此外,用友网络和海康威视等重量级科技企业都在近日发布了有关人工智能的相关信息。
ChatGPT珠玉在前,国内科技企业在人工智能上的研究成果究竟处于什么水平?专家们的观点并不一致。
“国外的公司如OpenMind投入了大量资源并持续研究了很长时间,在数据收集打标、模型训练方式和模型工程开发等方面都踩过许多坑,也拥有大量未公开的独有技术。这些都不是一时半会儿就能够超越的。”AI算法专家黄颂在接受《华夏时报》记者采访时说。
不过通信业观察家项立刚则对《华夏时报》记者表达出他与黄颂相反的观点,他认为,“中国的AI能力和全世界的AI能力相比,基本上是没有差距的,甚至中国是比较领先的。”此外,国内科技企业的企业家们,似乎也信心颇足。
国内科技巨头竞相推进AI研究
4月20日上午,科大讯飞发布消息,将在5月6日正式发布讯飞星火大模型这一人工智能成果。此前,科大讯飞在2022年12月启动了“1+N 认知智能大模型技术及应用”专项攻关,其中“1”指的是通用认知智能大模型平台,“N”指的是将认知智能大模型技术应用在教育、医疗、人机交互、办公、翻译等多个行业领域,并形成独具优势的行业专用模型。
科大讯飞总经理吴晓如介绍讯飞在人工智能上的发展沿革时表示:“2018年起,预训练模型范式就逐步开始在自然语言处理领域应用,包括谷歌、微软、OpenAI、科大讯飞、智源、鹏城等单位陆续推出预训练模型。科大讯飞在预训练模型方面,有坚实的相关技术积累,成为业界最广泛流行的中文预训练模型之一。2017年,科技部正式批复依托科大讯飞建设认知智能国家重点实验室,这也是我国在人工智能高级阶段——认知智能领域的首个国家级重点实验室。2022年在国家重点实验室重组后的首批20个国家标杆实验室中,讯飞是唯一一家承建认知智能全国重点实验室。同时,讯飞面向认知智能领域陆续开源了6大类、超过40个通用领域的系列中文预训练语言模型,开源3年模型库月均调用量超1000万,成为业界最广泛流行的中文预训练模型之一,在Github平台的中文预训练模型的星标数达13346位列第一。2022年,讯飞进一步发布了面向多模态领域的两个轻量级预训练模型,实现多尺度层级预训练、有监督强化聚类表征、多预训练任务联合优化框架等创新点,在参数量远小于业界公开模型(参数量小20倍以上)的情况下识别效果提升了20%—30%,效果上实现了业界领先,同时也获得全球多模态阅读理解评测冠军等优异成绩。”
吴晓如称,大模型将显著提升人机交互体验,带来内容生成及批改辅导产品功能跃升,并提供更加精准的个性化服务,提升讯飞现有产品使用体验。同时,讯飞认知大模型将广泛赋能开放平台合作伙伴。
除了科大讯飞,用友网络、海康威视等科技企业也在近日发布了人工智能方向上的研究进度。
2023用友BIP技术大会上,用友网络执行副总裁兼CTO樊冠军宣布,用友已启动企业服务大模型训练。他介绍了用友BIP—iuap平台,并认为AI在企业的普及应用主要有三个方向:一是企业业务与职能工作的智能化运营;二是企业应用、企业服务的自然化人机交互;三是企业客户利用AI赋能的低代码开发与集成平台实现快速应用生成。
海康威视则在近日召开的机构投资者电话会议上首次披露了自己在AI方面的具体进展。公司称,研究院在几年前就开始研发视觉大模型技术。现在海康的大模型技术已经到了多模态大模型的研发阶段,包括视觉、语音、文本等多模态信号的融合训练及处理。海康威视还披露,为了支持大模型的研发,已经构建了千卡并行的训练能力,并且面向智能安防的场景,训练了百亿级参数的大模型。由于大模型部署的应用成本比较高,海康威视在大模型的算法架构上进行了研发,形成了更高效的行业模型,在架构上应用云、边、域的智能物联系统架构,实现信息的多级处理,达到成本与效果的均衡。
国产AI到底是什么水平?
与ChatGPT这样的划时代产品相比,国内科技企业在人工智能上的研究成果究竟处于什么水平?专家们的观点似乎并不一致。
“近期,国内企业的一些动作和新闻报道更多是在对标LLM大模型以及像ChatGPT这样的现象级产品。从我的角度来看,国内企业在大模型研发方面与世界顶尖公司相比仍存在差距。虽然GPT架构已经公开多年,而且通过堆算力显卡把模型参数做上去对这些企业来说并不是非常困难的事情,但难的是要让模型在特定任务上有超越人的能力,并且效果要好。国外的公司如OpenMind投入了大量资源并持续研究了很长时间,在数据收集打标、模型训练方式和模型工程开发等方面都踩过许多坑,也拥有大量未公开的独有技术。这些都不是一时半会儿就能够超越的。粗略的评价,如果GPT4得分为100分,那么GPT3.5的得分可能在75分左右,而国内企业推出的大模型可能只有20到50分。因此,仅仅是使用GPT架构并将参数增加到几百亿并不会消除差距。这些报道更大的意义,是在‘人有我有’的公关层面。”黄颂说。
他同时认为,这一波的AI浪潮以AIGC技术为先锋,即通过AI算法来生成自然语言、图像、视频和语音等内容。这些应用应该会首先影响内容生产和创意行业、搜索和科研等需要处理和理解大量信息的领域,同时也可以提高企业的日常办公效率。
但也有与黄颂不同的观点。项立刚认为,中国的AI能力和全世界的AI能力相比,基本上是没有差距的,甚至中国是比较领先的。“AI除了要有算力、算法和模型之外,它还要有信息采集、信息传输、信息存储和智算中心。然后,AI还是要和传统的很多产品结合起来,形成新的终端,比如说我们的机器人。从这个角度来说,国内在智能汽车、工业互联网这些方面都是远远领先于美国。现在的情况是,我们在一些概念的炒作上面相对比较落后,技术芯片上面还有需要完善的地方,但是整个的产业发展,我觉得中国是有机会的。”项立刚表示。
与专家们相比,作为实践者的刘庆峰信心更足:“我认为,在中国今天做认知大模型,一方面跟OpenAI有一个赶超的过程,但将来一定会是通过专用领域达到并跑,甚至领跑。再由专业领域回过头来,在整个通用领域形成各自的优势。”
责任编辑:徐芸茜 主编:公培佳