AI激荡70载,身处操作系统演变的中心位置,在ChatGPT、文心一言等AIGC产品,GPT-4、Stable Diffusion、Midjourney等AI大模型的加持下,程序员现有的编程范式将会遭到怎样的冲击?面向的全新AI应用时代,开发者的思维、开发方式、工具又该做出怎样的改变?
继“新程序员:人工智能新十年”大会探讨程序员进入下一个AI十年的准则之后,3月25日,CSDN、《新程序员》联合主办的“新程序员大会(NPCon):AIGC 与大模型技术应用峰会”于北京环球贸易中心正式拉开帷幕。
在本次大会上午场的主论坛现场,CSDN创始人&董事长、极客帮创投创始合伙人蒋涛,创新工场AI工程院执行院长、SeedV实验室创始人王咏刚,华为云智能化软件研发首席专家王千祥,42章经创始人曲凯,在CSDN副总裁邹欣的主持下,就技术人如何利用通用人工智能、ChatGPT、AIGC、大模型、AI编程等重要话题,给出了干货满满的解答。
直播回放:https://live.csdn.net/room-iframe/programmer_editor/2OmZkkQB
以下是“AIGC与大模型技术应用峰会”主论坛的演讲精华。
GPT是人工智能时代的Windows
在CSDN创始人&董事长、极客帮创投创始合伙人蒋涛发表的《大模型时代的新应用开发者》主题演讲中,他提出AI时代的到来,为开发者产业带来了三大红利:人人都是开发者,家家都是技术公司,万亿技术云大生态。
据蒋涛介绍:“CSDN的最新开发者数据也证实了这一点。目前CSDN注册用户数超过4200万,去年新增了600万用户,新增用户中有60%都是大学生和高中生,高校计算机专业学生覆盖度90%,非常的年轻化。”
事实上,技术的演进所经历的阶段宛如一个轮回,回顾2011年,全球化移动应用市场大门打开之际,掘金海外还是瞄准国内市场、专注iOS还是Android亦或者是HTML5跨平台开发等都成为开发者抉择的方向。
12年后,开发者再次站在选择的十字路口,正如技术社区三倍速定律所彰显的那样,“一个技术要进入到真正的生态应用里,首先是在学术界被大家认可,接着进入到工程界,最后才进入大众视野。因此技术社区的动向往往能反映出未来的技术趋势”。从数据中,可以明显感知到GPT正在以前所未有的速度成为人工智能时代的Windows,AI发展也正处于iPhone 4时刻。
而为真实呈现ChatGPT等自动化编程工具对开发者的影响,蒋涛也分享了CSDN 最新上线的AI编程测试方法。同时,在大会现场,CSDN面向所有用户群体,重磅发布了一款快速开发GPT应用工具——InsCod(https://inscode.csdn.net)。
最后,蒋涛对于想要加入这场AI浪潮的开发者建议道,首先要去学表达,学会善用prompt;第二要学英文,因为前沿技术的英文资料更新速度更快;第三,发挥想象力,开始行动。
学会prompt,就能完成AI开发?
“我发现我们这些老一代程序员今天被AI技术的发展拉到了一个和刚毕业的大学生一样的门槛上,我不认为我做了十几年的自然语言处理技术,比一个今天刚毕业的大学生使用ChatGPT、GPT开发的应用有任何优势,这是一个我非常焦虑的时代和时刻”,创新工场AI工程院执行院长,SeedV实验室创始人王咏刚在主论坛上如是说道。
王咏刚表示,今天所有的计算机、系统都会被 AI 去重新改写,重新定义。这也引发了无数人思考:未来的程序员真的会被简化为提示词的编写员吗?然后由提示词操纵 AI?是不是这样一个非常简单的范式,就可以总结未来所有的 AI 开发?
就个人观点来看,王咏刚给出了否定的答案,其表示,“未来的 AI 开发应该是一种多范式的开发流程”。在他看来,世界上的任务天然地分为两类,一类是天生的不确定性任务,一类就是天生的确定性任务。这也让未来 AI 编程呈现出两种典型的范式:
*种编程范式是适用于端到端的感知类任务、创造性任务、探索性任务,它可以通过提示词得到结果。
第二个范式是强调控制力、结果确定性、计算精准性的应用任务。在这个任务里面,我们不能放任所有的事情都交给大模型一次来解决问题,大模型可能需要通过引入插件的方式,调用非常多的后台服务。
最后,王咏刚也分享道,“人类工程师在这个范式里被降级了,我觉得没办法,我们只能承认我的命运,我们也只能去拥抱这个时代,所以现在的我们,应该尽量少说话,早日开始行动起来。”
AI编程的边界在何处?
紧接着,华为云智能化软件研发首席专家王千祥在发表《AI编程:无尽的前沿》主题演讲中表示,AI编程基于GPT的代码生成取得了很大的突破。
在王千祥看来,GPT代码生成原理主要分为两个阶段:训练阶段,关键问题在于学什么和怎么学;生成阶段,通过自然语言输入,经过线上GPT模型,然后生成代码。
对于AI编程的边界究竟在哪里,王千祥通过GPT-4技术报告和微软研究院的报告发现,AI大模型在多数情况下超越了人类的编程能力,但是其距离*程序员还有很大的差距。
王千祥认为,AI编程肯定会超越Coding编程,因为现有的ChatGPT、GPT-4大模型工具的能力覆盖到了代码补全、翻译代码、解释代码、DeBug等多个维度。未来,这些工具必将覆盖到设计、搜索、迁移、运营等多流程中。
同时,王千祥也希望AI编程背后的新模型可以将统计方法与规则方法(常识)融合起来,并能适时地进行反馈学习,以及通过健康的生态得到良好的发展。
用生成式AI打通商业!
在ChatGPT、大模型彻底改变开发者编程方式之际,大家可以用它实现出什么,站在需求的角度来看,42章经创始人曲凯带来了《生成式 AI 的商业化落地思考》的主题演讲。
他认为,中国肯定会有自己的大模型,也可以有。因为可以把大模型这个事情定性成为一个工程问题,而不是一个技术问题,发现新大陆难,抵达新大陆实则没那么难。
具体来说,现如今大模型主要带来了三个维度的能力与改变:
在实际的落地场景和机会上,曲凯认为简单讲不外乎这三类:大模型、中间层、应用层。其中,*的机会集中在应用层:
不过,在开发者、企业尝试过程中,曲凯也分享了可能会面临的五大壁垒,包括:自己做大模型、自己有私有化数据、用户使用过程中有数据飞轮效应、用户有网络效应、有复杂的业务流系统等。
圆桌对话:ChatGPT 大航海时代
在上午主论坛的圆桌对话环节,由CSDN战略合作总监闫辉主持,CSDN 创始人&董事长、极客帮创投创始合伙人蒋涛,创新工场 AI 工程院执行院长、SeedV 实验室创始人王咏刚,华为云智能化软件研发首席专家王千祥,42 章经创始人曲凯作为嘉宾的圆桌对话正式展开,五位技术专家以“ ChatGPT 大航海时代”为主题,共论 ChatGPT 开辟的新领域、新应用、新机遇。
“我特别同意这是一个ChatGPT大航海时代,这是一个新时代的开始,如果再加一点,我觉得这不是一个在地球上的大航海时代,而是一个星际旅行的大航海时代”,创新工场 AI工程院执行院长、SeedV 实验室创始人王咏刚分享道。
他表示,人类发现美洲之后,然后在上面去建工厂、做开发,包括美国的西部大开发,实际都是以欧洲规则来进行的。因此,这也有可能引发一些担忧,目前大家用GPT开发程序,都是在PC、移动终端上进行开发,以及遵循相关的规则。不过,再过3-5年规则有可能会发生变化。宛如在星际旅行时,到了一个星球,这个星球可能像在电影上看到了,它可能特别接近一个黑洞,它的引力场、时间、行为全都不一样了,在这个时候,如果开发者的应用开发还在按照在移动时代、PC时代那样的方式继续做,可能就不适用了,这是3-5年后可能会出现的局面。
当谈及在开辟出大航海时代之后,ChatGPT反向会推动哪些维度进步时,CSDN创始人&董事长、极客帮创投创始合伙人蒋涛表示,GPT的能力汇集了所有的知识库,此时人类与它比拼的不是已有的知识,而是看它能否为我们产生新的知识,当然,这里新的知识并不是说让GPT写一篇科幻小说等等。更为重要的是,如果它的增量是科学发现,那么,我们现在社会的进步都是无尽的前沿。因此,他认为,未来我们可能会经历3-5年的前GPT时代,GPT会通过人类的提示等不断改进,但是5年之后,也许GPT会产生我们根本无法想象的事情,就如十几年前,众人无法想象出现在我们使用智能手机的现状。
华为云智能化软件研发首席专家王千祥则认为,ChatGPT 中可以将不同语言之间实现无缝转换的功能,具有两面性。一方面,大航海时代的确促进了很多交流;另一方面,也导致强势文化更强,有很多弱势文化可能被压缩了。这一点在大模型方面也是类似的,包括我们在训练大模型时,有时用中文语料训练的效果不行,但带上英文的效果就好。所以,ChatGPT 到来对我们文化影响力如何,还是需要持两面看待。
对于未来可能会创造的机遇,42章经创始人曲凯表示,“很多东西在当下是很难推出来的,就像十年前,我们很难想到现在*的应用是抖音之类的产品、最早的小红书只不过就是一个PDF……因此,我认为当前大家需要做的就是,先用起来,不用想那么多,还是站在用户需求的角度,看看当下的技术到底能实现什么东西,在这个过程当中再不断去调整。”
除了对大模型技术和AI新时代开发者未来发展的思考,在本次AIGC与大模型技术应用峰会上,我们还特设了“AIGC与大模型技术应用”与“AI编程技术应用”两大论坛,以及ChatGPT应用创新营特色活动。
分论坛1:大模型是通往AGI的必由之路吗?
其中,在“AIGC与大模型技术应用论坛”上,五位深入大模型应用的产业界代表分别带来了他们对于AIGC和大模型的思考,以及行业多年的实践经验,深入展现国内大模型技术生态。
首先带来演讲的是文因互联工程VP兼首席科学家宋劼。在她看来,ChatGPT的出现宣示着新的人工智能发展契机的到来。具体到金融领域,她发表了《探索新技术之大模型在金融AIGC领域的前景与应用》的主题演讲。
“在过去一段时间内,我们主动、被动接受到了有关ChatGPT和AIGC的各类讨论,大多围绕趋势、影响等维度展开。在强监管背景下,ChatGPT在金融领域落地有哪些局限性?金融机构应该如何构建自己的优势,以应对当下发展 ?”
在本次分享中,宋劼从技术分析及场景应用方面,对AIGC商业化落地的可行性和路径进行探讨,从中寻找可能的业务增长点。
此外,在宋劼看来:“金融领域的大模型终将实现,我们会成为整个历史浪潮中微小但有力的一份子。哥伦布就曾经错误地认为自己到达了印度,但他开辟的新航路依旧影响了全人类。无论这一次科技浪潮的最后能否完全实现通用人工智能(AGI),我们都已经走出了重要的一步。”
紧接着,来自网易伏羲实验室的资深研究员,NLP研究组及多模态算法负责人张荣升,以多年在这一技术领域的积累发表了《文本及多模态预训练技术的研究与应用》的演讲,介绍了网易伏羲在大模型上的技术积累,包括文本、多模态理解和生成预训练模型的建设,同时分享了大模型在歌词辅助创作、智能对话、文字游戏、互联网搜索推荐、AI绘画等落地场景的应用。
“ChatGPT的交互方式是大众化的,它真正理解使用者意图的能力也是革命性的。预训练模型在未来的趋势会朝多模态方向发展,大模型的使用会越来越流行。”张荣升如是表示。
超对称技术首席科学家吴恒魁则在演讲中基于“重整化理论”,对大语言模型的涌现现象建立数学框架。据他表示,超大参数语言模型遵循scaling law,即将参数和训练量扩大,能看到模型产生接近人类的逻辑和复杂推理能力,这样的现象属于复杂系统的涌现。而通过提出基于统计力学的连续相变理论来解释语言模型的涌现行为,为引入量子场论的重整化机制建立数学框架,这是他此次演讲的主要内容。
“大模型出现人类级别的逻辑和复杂推理能力是一种涌现行为,而随着模型复杂度增加,预测下一个词的GPT模型可能遵从“连续相变”的规律出现新的涌现行为。”吴恒魁讲道。
来自华院计算人工智能实验室资深研究员蔡华,在本场论坛发表了《让数字人更具个性和情感:ChatGPT技术的思考启示》的演讲。
他的演讲聚焦在ChatGPT为通用语音技术带来的变革上,其中的重点便是如何能够为数字人赋予个性和情感。同时,以华院计算实施的具体实践为例,说明了对话式框架的搭建,以及如何将对话与知识融合。同时,也指出了知识图谱如何能够让对话交互变得有感情和富有个性。
“大模型提供了更强大、更智能的交互方式,让虚拟数字人更有温度。未来的数字人将能理解他人的感受和情感,与他人进行个性化的互动。”蔡华表示。
最后,本场论坛主持人,句子互动创始人 & CEO,微软人工智能*价值专家 (AI MVP)李佳芮从开发者切实应用的角度,说明了她对于ChatGPT如何从0到1的构思,从技术原理、发展背景、应用场景和prompt等多个角度,说明了未来AGI时代的开发者需要哪些思维和技能。
“工业革命解决了‘重复体力劳动’的事情,人工智能未来解决‘重复脑力劳动’的事情。对话式人工智能已经到来,人类最终会与AI「共生」,让机器做机器擅长的事情,让人类发挥人类的特长,让人工智能拓展人类智能。”李佳芮最后总结道。
了解更多,请查看回放链接:
https://live.csdn.net/room/programmer_editor/Nc8cfWuo
分论坛2:AI编程的现状与未来
另一场主题为“AI编程技术应用论坛”主要为给开发者提供更多产学研界的前沿技术和实践案例。为此,论坛邀请到五位深入AI编程的*开发者,分享他们技术实践。
首先,由微软亚洲研究院高级研究工程师卢帅带来主题为《基于预训练的代码理解与生成》的讲解。他的演讲聚焦于“代码智能”,包括剖析基于人工智能技术的自动化程序理解和生成极大地提高程序开发者的生产力,如何开发出大规模通用预训练模型,并将其使用到软件开发生命周期的各个方面,包括代码补全、代码搜索、代码审查、缺陷检测及修复等方面。
“未来AI编程的发展趋势是一方面探讨如何利用大模型来完成任务,另一方面思考如何进化它,以覆盖更广泛的智能代码场景。”卢帅如是表示。
接着,aiXcoder联合创始人郝逸洋分享了大语言模型时代下应该如何进行代码的生成。包括如何利用LLM的技术进行代码开发辅助、代码模型和自然语言模型的区别,以及对交互式多模态LLM(如ChatGPT,GPT4)加持下的智能化软件开发的畅想。
在他看来:“如果 AI 作为操作系统可以直接控制硬件,程序员就能解放双手去编写驱动、操作系统和软件或是研发新的硬件,这就是软件 3.0 的图景。”
华为云PaaS技术创新LAB 技术专家申博基于华为云CodeArts Snap的实践,作了《GPT-4时代,重新思考AI编程》的分享。他的思考涉及包括生成式AI能做什么、边界在哪里,以及如何落地实现的各个方面。在他看来,我们需要重新思考AI编程,通过与现有工具的结合,软件分析及语言模型的实现,未来增强型的AI编程助手一定会出现。
“当模型越来越大,对硬件性能要求越来越高,有可能会遇到“数据荒”的问题,我们能否让 AI 自我演进,通过自我生成数据的方式学习,以达到与大数据同样的效果?未来自我创造智能是个有前途的方向。”申博表示。
来自清华大学知识工程实验室研究助理郑勤锴则分享了关于CodeGeeX的实践。和很多大模型是通过海外的架构和硬件进行训练不同,CodeGeeX*的特点是通过国产AI框架和硬件来实现训练,减少了核心技术被卡的风险。在本次报告中,郑勤锴分享了这款插件自动代码生成与预训练模型的产生背景、如何进行模型实现、VS Code与JetBrains IEDs插件介绍与功能,以及未来开源开发计划等方面。
关于程序员需要提升的能力,郑勤锴认为,“在将来,程序员需要具备一些更高级的技能和思维,比如Geek(极客)思维,开发者应该更加注重这方面的培养。”
最后,中国科学院软件研究所研究员、博士生导师王俊杰,分享了基于Pre-trained Large Language Model(LLM)的软件自动化测试的主题演讲,包括指出自动化测试仍存在哪些导致效率低下的问题,以及如何利用大规模的预训练模型来自动生成测试输入等。
“现在的大模型可能有些时候对开发人员来说有点‘不太专业’,但对测试人员来说‘刚刚好’。”王俊杰如此表示。
了解更多,请查看回放链接:
https://live.csdn.net/room/csdnlive5/CCEAhsEs
同时,随着人工智能和大数据技术的不断发展,AIGC和大模型技术已经成为了各行各业的重要发展方向。在本次AIGC与大模型技术应用峰会上,我们还特设了ChatGPT应用创新营特色活动。
此次,我们深入探讨了大模型技术对开发者的影响与潜在的研发应用场景、未来发展趋势,也不难看出,我们正在AIGC、大模型的引领下站在AI智能感知阶段的C位,而属于AIGC、大模型的时代也才刚刚开始。
未来,我们也期待AIGC和大模型技术将为我们带来更加智能化和高效化的工作流程、更加精准和个性化的服务、更加安全和可靠的系统,以及更加优秀和有趣的人机交互体验。