10月24日,第六届世界声博会暨2023科大讯飞(002230)全球1024开发者节在合肥启幕,如期升级发布讯飞星火认知大模型V3.0。“星火认知大模型V3.0已整体超越ChatGPT,并在医疗领域超越GPT-4。2024年上半年,讯飞星火V4.0将发布,对标GPT-4。”科大讯飞董事长刘庆峰表示,大模型时代的序幕才刚刚拉开,只有与众多开发者、合作伙伴共创、共享,才能实现共同进化。
自5月6日星火大模型发布以来,讯飞开放平台新增143万开发者团队,同比增幅达331%。会议期间,科大讯飞联合行业龙头共同发布12个行业大模型,并宣布与华为共同打造基于昇腾生态的“飞星一号”算力平台,将对标GPT4开启更大参数规模的星火大模型训练。
整体超越ChatGPT
在5月6日星火认知大模型发布之初,科大讯飞便官宣了明确的阶段性任务,历经6月9日V1.5、8月15日V2.0的迭代后,10月24日,公司如期发布星火大模型V3.0,实现七大能力持续提升,全面对标ChatGPT,其中中文能力客观评测超越ChatGPT,英文能力对标ChatGPT48项任务结果相当,向市场提交了一份亮眼的答卷。用户数据方面,自讯飞星火9月5日全民开放后,当前已有1200万用户。
国务院发展研究中心国研经济研究院测评报告显示,星火大模型V3.0综合能力超越ChatGPT,达到国内领先、国际一流水平,在医疗、法律、教育行业的表现格外突出。“星火大模型在医疗领域的各项能力已超越GPT-4。”刘庆峰表示。
在刘庆峰看来,大模型想要赋能民生百业,需实现从多轮对话、主动对话再到启发式对话的跨越,以智慧阶跃推动行业纵深应用。此外,大模型不仅要有专业的知识,还要具备个性化的AI人设。
据介绍,讯飞星火大模型V3.0已新增虚拟人格功能,可根据性格模拟、情绪理解、表达风格来形成一个初始人设,再结合特定知识学习、对话记忆学习,形成更个性化的AI人设。目前,虚拟人格应用“星火友伴”已上线。
加速赋能行业
“大模型首先要在工业和科研领域造福人类,这才是真正解决社会刚需的地方。”刘庆峰表示。
今年9月20日,基于讯飞星火的羚羊工业大模型正式发布。短短一个多月内,羚羊工业互联网平台用户总量从43.2万户增至68.7万户,增长59%,平台服务企业次数由197.3万增至370.6万,增长88%,用户需求旺盛,工业大模型正在广泛赋能工业各个应用场景。
在TO B市场落地方面,科大讯飞在近日接待投资者调研中表示,面向企业及行业客户的产品既包括开箱即用的共性产品,例如代码、客服、办公等,也包括与行业know-how相关的营销、企业知识库等特定应用,并在通用大模型的基础上针对具体领域展开专项训练和调优。
以搭载星火代码大模型的智能编程助手iFlyCode为例,自8月15日发布以来,已与京东云、软通动力(301236)等107家机构实现深度对接应用。
在教育、医疗等科大讯飞的根据地业务领域,大模型的加持作用则更为显著。本次发布会上,搭载星火大模型V3.0的讯飞AI学习机亮相,首次发布启发互动式英语AI答疑辅学功能,升级百科问答助手功能,实现个性化解决、启发引导式提问、互动探究式学习。
医疗方面,科大讯飞在会上发布星火医疗大模型,并首发医疗大模型加持下的“讯飞晓医”APP及小程序。据悉,前述大模型已通过信通院和国家卫健委组织的标准规范评测。科大讯飞董事长刘庆峰表示,星火医疗大模型在医疗海量知识问答、医疗复杂语言理解、医疗专业文本生成、医疗诊断治疗推荐的问题解答率等方面已全面超越GPT-4。
会议期间,科大讯飞联合行业龙头共同发布12个行业大模型,包含金融、汽车、运营商、工业、住建、物业、法律等,持续加速大模型行业落地。
2024上半年对标GPT-4
科大讯飞曾在多个场合强调,将坚定投入通用人工智能认知大模型。伴随着本次星火V3.0发布,公司又立下了下一个阶段性目标,即在2024上半年对标GPT-4。
对标GPT-4的底气何在?持续繁荣的生态、自主可控的算力底座、深耕行业的先发优势,都是动力源泉。
数据显示,截至目前科大讯飞开发者团队已达553万,自5月6日星火认知大模型发布以来新增143.4万,增量较去年同期增长331%,其中大模型开发者新增17.8万。
当前,讯飞星火用户已达1200万,自讯飞智作2.0、讯飞写作产品发布以来,新增超10万名专业用户,提供新闻播报、教育培训、自媒体推广到企业宣传等服务。“讯飞星火大模型强调解放生产力、释放想象力,用户使用高峰期集中在10点、15点两个时段,充分验证了讯飞星火更贴近办公人群的使用习惯。”刘庆峰表示。
蓬勃的生态离不开自主创新的算力底座。早在2023年初,科大讯飞便携手华为昇腾启动专项攻关,联合研发高性能算子库,让国产大模型架构在自主创新的软硬件基础之上。据悉,二者共同推出的讯飞星火一体机,性能已可对标A100。
本次发布会上,科大讯飞与华为合作进阶,重磅发布基于昇腾生态的“飞星一号”大模型算力平台,并将在此基础上启动对标GPT-4的更大参数规模训练。
不过,刘庆峰也提到,国产大模型必须正视和GPT-4的差距。“国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上距GPT4还有差距。”他表示,认知大模型赋能千行百业是一场硬仗,绝不是靠吹牛能做成的,只有实事求是的科学精神,才能真正实现超越。