图片来源@视觉中国
文|硬科技星球
3月,随着OpenAI新一代模型GPT-4以及百度“文心一言”的正式公布,通用人工智能AGI的概念再次点燃全球社交平台。从最初的文字对话到如今的看图写代码,AGI领域终于迎来了属于自己的“iPhone 时刻”,而对话式AI这一充满无限可能的AI类型也再次展现出融合未来趋势的美妙图景。本月初,人工智能聊天机器人公司Character.ai获得一笔超2亿美元融资,由a16z领投,其联合创始人Mark Andreessen将加入Character.ai董事会。作为一家成立不到一年的公司,Character.ai在0收入的情况下达到10亿美元估值,并得到资本巨头青睐,发展不可谓不快,但其业务却非常“简单”——创建人人可用的AI聊天机器人。
在Character.ai,你可以和任何你想到的人物对话,无论是现实中的埃隆·马斯克还是漫威电影里的托尼·史塔克,任何人都可以创建属于自己的虚拟人格并与其对话,对方则会代入对应的身份和语言风格,看似简单的业务背后是真正的千人千面型AI未来。打造这一宏大目标的是谷歌早期员工之一,也是Transformer作者之一的Noam Shazeer,从谷歌离开之后,他的对话式AI如今成为投资领域关注的焦点。纵观全球,个性化聊天机器人作为流行趋势已愈发明显。从海外的Character.ai到Replika,各自都在探索“人人享有各自专属AI聊天机器人”的未来,而回望国内,该领域的发展也日益受到投资者关注,无论是自微软小冰团队独立的小冰公司,亦或者是由清华大学黄民烈教授创立的聆心智能,近年来都正逐渐成为新一轮革命的排头兵。
投资潮爆发,对话式AI价值凸显
近两年,以OpenAI为代表,对话式AI成为资本领域的香饽饽。今年1月,微软确认了对ChatGPT母公司OpenAI的新一轮数十亿美元投资,而Character.ai在0收入的情况下也于今年3月完成超2亿美元融资。根据PitchBook统计数据,2022年投资圈向生成式AI的投资总额达到13.7亿美元(折合人民币约93.69亿元),几乎为过去5年的总和。
这其中,对话式AI以自然语言处理技术(NLP)为核心,使机器可以理解、反馈人类语言并从交互中学习,最终实现人与机器之间的自然对话,成为众多企业冲击的技术领域。然而,很长一段时间里,对话式AI作为和人们日常距离最近的AI技术类型,一直被认为“不聪明”“没有条理”。这是由于对话本身是语言处理中最困难的任务,早期聊天机器人的表现都比较刻板和机械,以“关键词+模板”为主,将输入语句与预先定义的 FAQ 知识库进行匹配,但在随后,对话式AI的发展过程不断提速,共经历四个阶段:
规则引擎阶段:这一阶段主要是基于规则的对话系统,即设定一系列规则和模板,用于响应用户的指令和问题,但是由于规则的限制和模板的创新难度,导致该阶段的对话系统具有很大的局限性。
统计学习阶段:随着机器学习和自然语言处理技术的发展,人们开始尝试使用统计学习方法来构建对话系统,主要是基于概率模型的统计语言模型,如隐马尔可夫模型和条件随机场等,但是由于数据和算法的限制,该阶段的对话系统仍然存在很多问题。
深度学习阶段:随着深度学习技术的发展,人们开始使用神经网络模型来构建对话系统,主要是基于序列到序列模型和变形自编码器模型,如Google的Seq2Seq和Facebook的FastText等。这一阶段的对话系统在理解上下文和语义的能力方面取得了很大的进步,但是在生成多样性和流畅度方面仍然存在一定的问题。
GPT模型阶段:近年来,以OpenAI的GPT模型为代表的大型预训练模型的出现,使得对话式AI的生成能力和智能水平得到了飞跃式的提升。目前,GPT-3和GPT-4已经可以实现高度流畅的对话和知识问答,并逐渐应用于多个领域。对话式AI的发展经历了从规则引擎到统计学习,再到深度学习和GPT模型的阶段,随着技术的飞跃,其应用场景和智能水平也不断扩展和提高。根据《AI对话系统分级定义》,过去,只能够完成单一场景下的对话在L1和L2之间。当问题数量多、语义复杂时,拦截率较低,难以快速实现响应,客户满意度低,且维护成本较高。如今,随着大模型的发展,从数据、算法、算力等方面使对话式 AI 产生巨大变化,ChatGPT 为代表的的L4级别对话式AI无疑是工程、技术、数据等方面的综合成功,并朝着L5级别进一步迈进。如今,对话式AI在行业垂直类应用上已展现出其价值。以Character.ai为例,通过搭建端到端的工程栈,覆盖模型的研发与训练、数据、应用整条价值链。用户不仅能够随意与平台上训练好的海量对话式AI角色进行对话互动,还能够训练自己需要的任何虚拟角色,并保持角色的属性一致性。这些产品特性不仅将Character.ai自身的能力无限延伸,也保持了较高的用户黏性。在外界看来,Character.AI 拥有较大的商业发展空间,不仅能够面向C端以订阅式服务打造千人千面的Ai陪伴式应用,也能够面向B端用户打造符合其定制特性的个性化AI形象。无论智能客服、IoT语音助手、医疗诊断还是金融风险评估等领域,其商业价值快速提升,投资潮也随之爆发。而对千人千面的AI聊天机器人来说,其价值不仅在于简单的问答,还能够根据用户的口吻、情感等进行情感分析和智能回复,提升用户体验的同时,进一步融入更多领域。
多家概念股持续拉升,国内对话式AI争先冒头
放眼国内,对话式 AI 的市场潜力也不可小觑。根据利文联合头豹研究院发布的《人工智能系列报告:2021年中国对话式AI市场报告》数据,2021年,中国对话式AI市场规模为82.7亿元,到2026年,这一数字有望增长至265.8亿元,年复合增长率高达26.3%。与此同时,国内巨头“跑步入场”对话式 AI 领域,百度、阿里、字节、京东等大厂接连入局,各大 AI 创企也不甘落后。今年以来,以百度“文心一言”、复旦团队的“MOSS”为代表的功能型语言大模型路线,和以小冰公司“小冰岛”、聆心智能团队“AI乌托邦”等代表的拟人型语言大模型路线受到了广泛关注。随着众多玩家广泛深入,创新项目不断涌现,但无论是大型企业还是创业公司,在人才建设、技术突破、商业模式等方面都处于早期阶段,更需要长期坚持、投入和创新。国内,早在2021年小冰公司发布了全球首个 AI 社交平台“小冰岛”。在该平台中,人类用户可以创造各种人工智能个体,并形成一个共同生活的社交网络。在大模型领域,小冰公司发布了“小冰链”。小冰CEO李笛指出,小冰链采用自然语言处理技术,能够理解用户的问题,并给出相应的答案。此外,小冰公司在检索模型、生成模型、大模型和X-CoTA等方面也实现突破,于2022年宣布完成了总额10亿元人民币的新融资。北京彩彻区明科技在2021年推出的“彩云小梦”,基于常识和小说语料训练的中国本土语言模型在续写生成方面相比 ChatGPT 也有着不错的表现。其核心逻辑是用户输入一段文本,就可以用 AI 续写一段文字,用户还可以任意的增删改。2022年“彩云小梦”推出了2.0版本,用 NLP 技术驱动对话场景,在情节续写的基础上实现用户与 AI 虚拟人物的对话,提供更多互动性和情感陪伴。相较于前两者,2022年11月上线的Glow属于“新玩家”,但吸引了部分Z时代年轻用户。该产品和 ChatGPT 百科全书一样的回答不同,其定位为AI 虚拟聊天社交软件,主打聊天、陪伴等情感功能。GLOW 背后的公司 MiniMax 成立于2021年12月,以实现AGI为目标,由前商汤副总裁闫俊杰创立。在2022年上半年由明势资本领投了天使轮融资,此前米哈游参与了对 MiniMax 的两轮投资,目前正在谋划与红杉资本共同发起新一轮投资。2022年12月上线的“AI乌托邦”则对标Character.AI,由清华大学黄民烈教授创立的聆心智能团队推出,通过小程序和网页端向公众开放,也引发了Z世代用户群体的广泛关注。该产品基于聆心智能团队自研的超拟人大模型,根据大模型可控、可配置、可信的核心技术优势,优势在于允许用户快速定制 AI 角色,提供千人千面的AI形象,不仅能够满足用户聊天、陪伴的情感需求,还能够提供与 ChatGPT 相似的助理、百科功能。目前,聆心智能已完成Pre-A轮融资。
机遇和挑战,对话式AI成为泡沫还是希望?
2023 年作为经济全面复苏和发展的重要一年,数字化转型成为当前中国经济发展的“主旋律”, 其中人工智能技术在数字经济建设中发挥着重要作用。我国曾提出《新一代人工智能发展规划》,明确“三步走”战略:2020年实现我国人工智能总体技术和应用与世界先进水平同步;2025年实现我国人工智能基础理论重大突破,部分技术与应用达到世界领先水平;2030年实现我国人工智能理论、技术与应用总体达到世界领先水平。2022年,科技部等六部门联合印发的《关于加快场景创新 以人工智能高水平应用促进经济高质量发展的指导意见》,围绕构建全链条、全过程的人工智能行业应用生态建设十大示范场景,为加快推动人工智能应用。在这样的政策背景下,人工智能技术在助力稳定经济当年发挥积极作用,同时为培育新的经济增长点保驾护航。从市场前景来看,据IDC研究预计在未来5年内,对话式人工智能在金融、零售、制造、医疗、政府和教育等六大行业至少会带来30%-64%的价值提升。随着技术的不断发展和普及,对话式AI已经在许多领域展现出了它的巨大潜力,如客户服务、医疗诊断、教育培训等。对话式AI不仅可以为用户提供更加智能化、个性化的服务,还可以帮助企业降低成本、提高效率,对于推动产业升级和经济发展具有重要的作用。与任何新兴技术的出现一样,对话式 AI 仍存在一定的挑战。从技术方面来看,目前的对话式AI还难以完全替代人类的智能,特别是在情感理解、判断和创造性方面。其次,对话式AI的普及和应用还存在一些法律和道德问题,如数据隐私、安全性、责任和权益等方面。这些问题需要得到社会和政府的关注和解决。从应用层面来看,一是语言输入的问题,目前的对话式AI产品,仅支持正式的文本或语音,这提高了用户的使用门槛,一些方言、口音等语言会影响 AI 对原始输入的理解,进而产生错误或者无效的回答。二是AI的输出问题,无论是 ChatGPT 还是其它大语言模型,都可能面临着胡编乱造、不安全可信的问题,这不仅需要平台在模型层面做好控制,也需要做好相关政策的治理,避免产生“有害的应用”。以Character.AI为代表的对话式AI的出现预示着无缝人机交互时代的来临,也加速了国内外对话式 AI 领域的成长态势,但要打开市场,需要的不仅仅是模型的技术,还有场景化的应用开发。如今,海外企业在人工智能方向的投资和热情已经从技术本身走向了如何应用落地,也为国内行业探索带来启示。清华大学计算机科学与技术系长聘副教授、聆心智能创始人黄民烈指出:“行业发展需要推动大模型整个生态的发展,不仅需要底层大模型,也需要业务、垂直场景大模型、工具层,以及直接应用型的公司。”在他看来,教育、金融、数字产业将成为大模型应用生态的重要领域。随着高性能大模型的成本正在快速降低,未来对话式 AI 应用层的颠覆式创新或许不在技术,而在于产品设计的绝妙想法。那些更具有创业精神、产品基因的年轻团队,或许更能抓住这一次浪潮。目前来看,行业先行者们已经初步形成以数据为核心的飞轮效应,伴随用户与平台上的虚拟角色产生互动,海量的数据成为完善其基础模型的最佳基石,正如从量变引发质变的GPT-3一样,在虚拟人格方面的行业进展将大大超过人们想象。未来,随着对话服务场景的智能化和线上化,AI 对话引擎与产业深度融合将成为未来社会释放数字化叠加倍增效应、构筑综合竞争优势的必然选择,并有极大可能改变人类的生活和生产方式。而如何积极拥抱这门新的技术并通过 AI 实现更高的人生目标与价值、实现更广泛的应用并产出更高的业务价值,是个人与企业共同需要关注的命题。