赵天奇在计算机视觉领域有着深厚的研究积累,他从北京邮电大学获得博士学位后,进入清华大学做博士后,徐大雄院士和戴琼海院士是他的导师。然而,除此之外,他还是一位创业者,他创办的北京聚力维度科技有限公司是北京专精特新企业,该公司获得了华为哈勃投资的股权融资。
初次见到赵天奇是在一个上海元宇宙论坛上,他在台上热情洋溢地介绍聚力维度的“赛博演猿”产品。透过演讲,看得出他对所做之事的专注与热爱。本次,张通社在线采访到赵天奇,请他聊聊关于聚力维度的故事。
聚力维度创始人 赵天奇
01边研究边创业要让电影级内容更普及
赵天奇在北京邮电大学攻读光学工程博士的时候,师从徐大雄院士,他是中国3D激光全息之父。尽管他有机会获得一份知名学府的教职,但他选择了一条与众不同的道路。“对于我来说,仅仅做科研和发论文是不够的,我一直认为将最新科技成果产业化,改变人们的生活,才是更有价值的事情。”赵天奇告诉张通社。
他从小就热爱电影,还对爱因斯坦、爱迪生等科学家崇拜有加。在攻读博士学位期间,他的研究课题都与数字影像相关,主要研究如何将2D影像转制3D影像的技术。
2012年,3D电影兴盛,赵天奇决定将自己的研究进行技术转化,成立了十二维度(北京)科技有限公司(以下简称“十二维度”),专门从事2D影视转3D影视的业务。谈到公司名称,赵天奇说道,“物理学里的弦论说宇宙有11个维度,既然做数字内容的公司,我就在11维度上加上一个想象的维度,就是十二维度。”
最初,十二维度开发的AI算法只能将30%的2D内容转换成3D,需要人工参与。经过4年的技术研发,AI算法已经可以完成100%的2D转3D任务了,这项技术能为影视公司省去数千万元的2D转3D人工成本。《饥饿游戏》、《狼图腾》、《寻龙诀》等脍炙人口的电影都用了十二维度的这项技术。
“迄今为止,2D转3D的业务仍是我们的主要业务之一,我们正在研究如何将这技术应用于虚拟现实和裸眼3D领域。”赵天奇说。
2016年,赵天奇前往清华大学做博士后,导师是两院院士戴琼海,他在立体视觉和计算摄影领域有深入研究。此时,十二维度已将院线级3D转制效率提升了1000多倍。然而,赵天奇并不满足于此,他意识到AI技术可以解决更多数字内容的难题,于是他开始积极探索AI在该领域的应用。
在赵天奇看来,数字内容行业的核心是故事,而故事的载体是什么呢?是人。人是数字内容的核心,也是成本的核心。
为了解决数字内容行业中“人”的问题,赵天奇计划利用人工智能来生成更高质量的数字人。恰好,上海聚力传媒有限公司(PPTV)找到了赵天奇,两家共同决定出资创办一家公司。这就是北京聚力维度科技有限公司(以下简称“聚力维度”),聚力维度专门提供数字人相关业务,而原来的十二维度成为聚力维度的全资子公司。
“我创办聚力维度的梦想是让每一个人都能创作出电影级别的内容。虽然电影在传情达意和表达思想方面是所有内容品类中最好的,但它的成本高昂且资源消耗巨大。我想通过技术手段将电影级别的内容变得更加普及,并且能够像直播一样实时呈现出来。”赵天奇告诉张通社。
因此,通过技术手段将数字人做得更加易用和优质,成为实现赵天奇梦想的重要手段。
02团队配置:影视与AI两条腿走路
虽然聚力维度仍是一家创业公司,但是赵天奇特别重视技术研究。他专门成立了一个名为“科幻成真实验室”的部门,负责公司大部分的科研工作。
“我们公司拥有庞大的科研团队,聚力维度产品的技术都源自于他们的研究成果,其中包括2D转3D技术和真人驱动数字人技术。目前,他们正在探索如何使用AIGC技术快速建立高质量的三维模型,这些模型可以达到影视级别,并且可以立即用于真人驱动。”赵天奇讲道。
聚力维度不仅注重技术研发,还具备少见的艺术基因。赵天奇招聘了许多艺术背景的职员,他们主要擅长三维建模、美术渲染等工作,这类职员的数量几乎与AI技术人员的数量相等。
然而,赵天奇需要的不是技术研发人才和美术创意人才的叠加,而是两类人才的融合。“艺术出身的人需要了解一些技术,技术出身的人需要了解内容方面的需求,两类人才要能站在对方的角度思考问题,所有人才能汇合成一个大脑去思考,才能解决问题。”赵天奇向张通社解释道。
赵天奇认为,两类人才的深度融合是聚力维度的一大优势。只有通过两类人才的相互融合,聚力维度才能更好地理解数字人这件事,才能在此基础上实现创新。
公司团队配置很大程度上决定了公司基因,而公司基因则决定了业务的方向。赵天奇带领团队率先在数字人技术取得了突破:只需一个普通摄像头和一台电脑或手机,人们就可以通过数字人技术将自己化身成为3D数字形象。这个形象可以是3D人物形象,也可以是一头猩猩或一尊石像,并能实时模仿真人的表情和动作。
03不用面部特征点技术让数字人呈现出上千种微表情
在过去的许多年里,为了让真人变成数字形象,通常需要使用笨重的动态捕捉设备,特别是在面部捕捉方面,可能需要戴上沉重的头盔才能准确地捕捉到微妙的表情变化。这种技术常常应用于影视制作、游戏建模以及近年来越来越流行的虚拟主播领域。
随着人工智能的成熟,许多团队正在尝试使用普通摄像头和AI来替代传统的动态捕捉设备,然而,这种方法通常设计“人脸特征点”技术路线,无法准确描述抿嘴、噘嘴、用力挤眼睛等复杂表情。
赵天奇告诉张通社,“我们没有使用人脸特征点的技术路线,而是采用了自己独创的技术方案,从零开始进行开发,这才使得数字人能够表达出上千种微表情的效果。”
他进一步指出,“要实现这一技术路线并不容易,需要对影视行业有十分深入的了解。”
这意味着,一个普通人无需经过专门训练,只需使用笔记本电脑的前置摄像头,就能化身为3D数字人,进行网络直播。这个数字人还能实时反映他的各种表情,如挑眉、吐舌、呲牙、噘嘴、用力眨眼等。
在虚拟主播和虚拟偶像方兴未艾的背景下,赵天奇认为市场对于数字人的需求可以归结为两点:低门槛和高质量。这正好与聚力维度解决方案的优势相契合——通过一个摄像头,普通人即可变身为数字人,而数字人不仅拥有精细的建模,还能完美地展现真人的各种动作和表情,让它看起来像真人一样有情感。
04和电视台合作打造高品质节目每一位主播都是潜在客户
赵天奇将这个数字人解决方案称为“赛博演猿”。他希望通过它让电视剧、综艺、广告、展览等内容形态变得更加超现实,更有想象力。
他告诉张通社,聚力维度的客户目前主要分为三类:展览展馆、电视节目以及网络平台(直播和短视频)。
聚力维度参与了央视著名节目《开讲啦》,还让撒贝宁亲身体验了“赛博演猿”。此外,聚力维度正与一家电视台合作,共同策划一台元宇宙节目。在这个节目中,各路明星将化身各色各样的数字人,一起录制打枪、打雪仗甚至撕名牌等综艺游戏。
“赛博演猿”的另一大应用场景在于网络平台,包括网络直播和短视频。“我国大概有2000多万的直播和短视频创作者、1000多万的音频创作者,他们都可以使用‘赛博演猿’进行内容创作,这会为他们减少演员、服装、化妆、道具等方面的费用。”赵天奇介绍道。
赵天奇认为高质量的数字人在网络直播场合有着天然的吸引力。聚力维度曾经与一家头部化妆品消费公司合作,推出一位名叫羽茜茜的数字人形象。当羽茜茜出现在直播卖货的直播间内,观看人数从100人直线增长至100多万,最高峰值达300多万。无独有偶,聚力维度为另一家硬件消费厂商制作的数字人,让该公司的直播间观看人数增长了20倍。
除了将真人主播换为数字人,聚力维度还为直播间增添了很多特效的功能,比如从一个飞机飞行的高度,一个镜头俯冲直接落在主播的正脸前。影视导演常用的各种镜头语言被聚力维度搬到了直播间里,这让直播表演变得更加活灵活现。
距离聚力维度创办已经有7年了,通过不断技术革新,它拿出了独具创新的数字人解决方案,但是赵天奇告诉张通社,“数字人赛道还处于早期阶段,未来还有非常广阔的想象空间。”可以预料到,随着行业进入成长期,聚力维度将发展得更快更好。
华为哈勃入股,这家专精特新用一个摄像头造出最强数字人!
作者:张通社 来源: 头条号 101009/20
赵天奇在计算机视觉领域有着深厚的研究积累,他从北京邮电大学获得博士学位后,进入清华大学做博士后,徐大雄院士和戴琼海院士是他的导师。然而,除此之外,他还是一位创业者,他创办的北京聚力维度科技有限公司是北京专精特新企业,该公司获得了华为哈勃投资
免责声明:本网转载合作媒体、机构或其他网站的公开信息,并不意味着赞同其观点或证实其内容的真实性,信息仅供参考,不作为交易和服务的根据。转载文章版权归原作者所有,如有侵权或其它问题请及时告之,本网将及时修改或删除。凡以任何方式登录本网站或直接、间接使用本网站资料者,视为自愿接受本网站声明的约束。联系电话 010-57193596,谢谢。