5月6日,科大讯飞(002230)正式发布并现场展示其大模型产品“星火认知大模型”,以及在教育、办公、汽车、数字员工四个领域的应用,特别是大模型与旗下教育产品AI学习机以及办公产品讯飞听见相结合后的落地场景。
科大讯飞董事长刘庆峰在发布会上表示,当前讯飞星火认知大模型在文本生成、知识问答、数学能力三大能力上已超ChatGPT,10月底将整体赶超ChatGPT。
讯飞星火7项能力 图源:科大讯飞
国产大模型混战
刘庆峰和科大讯飞研究院院长刘聪一同在现场进行了1个小时左右的实时演示。
姗姗来迟的科大讯飞亮出了“拿手活儿”,可以通过语音对话交互的星火大模型引起线上不少观众的关注。不过受到口音的影响,星火大模型在“听”问题时偶尔会出现失误。
“今天是科大讯飞星火认知大模型的发布会……请帮我写一篇欢迎词。”刘聪用一个相对简单的长文本生成热场,并现场展示了其语言理解、知识问答、逻辑推理、数学能力、代码能力与多模态能力。
“俗话说,男子汉大丈夫宁死不屈,但俗话又说,男子汉大丈夫能屈能伸。”在语言理解方面,星火大模型解释了两句话在不同场景下的含义,还能解答在和女朋友吵架时的正确做法,“应该要能屈能伸”。
又比如,当问到“孔子在2008年的奥运会上说了些什么”,星火大模型及时指出,孔子为古代人物不可能在奥运会上发言。但如果假设孔子在2008年奥运会上做汉语培训,它就会重新生成一个符合设定的故事。
刘庆峰表示,虽然目前大模型技术还有待攻克的缺陷,比如新知识难以及时更新、事实类问答容易“张冠李戴”,史实、传统典籍等容易“编造情节”等,但他认为这些问题在今年会有明显的改进。
“超出预期,国内能做到这个水平挺欣慰的。”一名长期关注大模型领域的从业者在看完科大讯飞发布会后向表示。
自3月16日百度率先公布“文心一言”以来,阿里、360、昆仑万维(300418)、商汤等公司相继对外展示了大模型项目进展,一时之间,国内大模型领域风起云涌。据民生银行不完全统计,国内已经有超过30项大模型产品亮相。
出门问问创始人、CEO李志飞预测,在中国,1-2年以后,会看到50家以上公司做大模型。
部分公开大模型进展的公司 图源:制图
为何各家公司如此密集地发布大模型产品?“AIGC会带来科技变革,且ChatGPT国内应用存在监管障碍,所以国内大模型存在市场空白。”浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林指出,各家企业密集抢跑,是为了在中文大模型领域占据先机,“大模型是根本,有大模型就有了AIGC领域的入场券。”
“不看谁发的早一个月还是晚一个月,要看今天这个时间点上谁的水平最高,我自己非常自豪地告诉大家,在我们能测到的各种平台中,讯飞的水平是最好的。”在会后媒体群访时,刘庆峰解释道,科大讯飞发布大模型的时间并不晚,星火大模型还在快速升级和迭代过程中,但在中文长文本生成方面,科大讯飞已经明显领先于其他友商。
刘庆峰表示,今年内大模型技术还将经历3次升级,预计到10月24日,将实现通用模型对标ChatGPT,中文超越ChatGPT的当前版本,英文能做到相当水平,并在教育、医疗等领域做到业界领先。
大模型开始拼场景
“谁能够在具备社会刚需的应用场景落地,谁就最先能形成自我造血的良性循环。”刘庆峰在会后采访中强调。
在4月的财报业绩会上,科大讯飞透露,公司自去年12月15日正式启动“1+N”认知大模型专项攻关,其中“1”就是指通用认知智能大模型,“N”就是大模型在教育、办公、汽车、人机交互等各个领域的落地。
尽管大模型领域热度正高,但距离谈商业化还为时尚早。
注意到,比起通用大模型,国内不少公司将关注点放在垂直领域中大模型的应用。4月11日,毫末智行发布自动驾驶生成式大模型DriveGPT(中文名“雪湖·海若”),且将在长城汽车(601633)即将量产上市的新车型上落地。5月5日,学而思表示正在进行自研数学大模型(MathGPT)的研发,将以针对数学领域的解题为核心。
在具体产品上,科大讯飞着重展示了星火大模型与已有的AI学习机和录音转写工具讯飞听见相结合的落地,大模型的技术应用得以直观显现。
大模型与学习机结合批改作文 图源:科大讯飞发布会
例如,在搭载星火大模型的科大讯飞AI学习机T20系列上,可以实现像真人老师一样批改作文,从检查错别字、到语句措辞,再到整体结构,整体打分并给出修改意见,售价7399元起。
而在办公领域,大模型加上讯飞听见,就是新一代的“讯飞听见会写”。 除了能够实现语音转文字外,还可以一键生成全文摘要、工作待办、工作计划、新闻稿件、宣传文案、多语种翻译等多种文本。
在上述C端服务之外,科大讯飞也展示了大模型与智能驾驶、智慧金融等企业用户结合的思考。刘庆峰坦言,关于大模型的商业模式仍在设想中,“N”中的每一个产品都可以变现,基于讯飞生态的超500万合作伙伴,也可以在通用大模型的加持下进一步发掘落地的机会。同时,还可以参考ChatGPT的收费模式。
“另外,我也特别看好的是认知大模型所带来的新机会。因为语言理解能力的提升,它可以使用工具,然后加上代码能力,在工业互联网领域会形成巨大的突破,会有力地推动万物互联时代的到来。”他表示。
此外,刘庆峰在演示中还特别提到了星火大模型在医疗场景中的可能性。他表示,在专业领域中,科大讯飞目前推出的智医助理“比GPT-4还要强很多”。
不过考虑到医疗领域的特殊性,科大讯飞尚未发布医疗领域专用大模型,预计将会在10月24日左右正式推出。