×

专业 · 专注 · 垂直
内容 · 数据 · 平台

联想控股于海华:探秘“元宇宙”,人机智能体将往何处去?

长按扫码
查看详情

投资时报首页 > 公司 > 正文

联想控股于海华:探秘“元宇宙”,人机智能体将往何处去?

公司 卓玛 2023-12-28 16:11:07 37967 分享: 字体大小:Aa-Aa+

人机融合智能体将是未来科技生产力、生产关系里的活跃因素,不可忽视

《投资时报》记者  卓玛

2023年,全球科技、社会、经济均迎来重要变化,生成式人工智能(AIGC)技术迅速破圈并成功开启商业化之路,拉开了新一轮科技引领生产力变革大潮的序幕。与此同时,中国经济发展也到了新旧动能转换的长周期,人工智能、大数据、物联网迅猛发展,“新质生产力”加快形成,中国制造业正加速转型升级,努力向智能制造迈进。

自2023年初以来,ChatGPT的亮眼表现为世界展示了AIGC的无限可能。该如何理解科技进步带来的机遇与挑战?又该如何把握这样一个投资趋势?

2023年12月20日,标点财经研究院联合《投资时报》、投资时间网在北京举办“见未来•2023第六届资本市场高峰论坛暨金禧奖年度颁奖盛典”,众多嘉宾齐聚一堂,共同打造了一场精彩的观点视听盛宴。

联想控股股份有限公司(下称联想控股,03396.HK)创新发展中心、前瞻技术研究院高级总监于海华,在此次论坛中进行了细致有料的分享,在题为《AIGC:人机融合智能体迈出第一步》的主旨演讲中,他表示,“我们认为,人机融合智能体是未来科技生产力、生产关系里的活跃因素,不可忽视。且AI技术会渗透到几乎所有行业,因为它是底层技术,会自底向上进行变革。”

于海华来自联想控股前瞻技术研究院,该研究院于2023年初启动成立,目的是在联想控股“产业运营+科技创新”战略指导下,构建前瞻技术开放创新孵化体系,筛选前沿科技领域的前瞻性种子技术,与高潜力创新团队共同设计产业化路线、共创IP,实现“产学研”联动,以产业带动生态资源,为联想控股产业运营持续输送高潜力持股企业、技术、人才,加强与联想控股旗下企业合作,推动联想控股在科技创新领域的可持续发展。

“我们主要就干三件事,围绕科技创新的生命周期,在上游发掘有潜力的种子技术,在中游和科研团队一起做IP共创,把技术做成产品,在下游帮助产品团队补齐产业资源,让它们发挥更大的产业化价值。”于海华如此表示。

元宇宙的三个维度

于海华认为,元宇宙(Metaverse)首先可以从物理世界(Physiverse)的“原”和数字世界(Digiverse)的“源”这两个维度来理解。AIGC(AI Generated Contents)是AI生成内容的简称,是指由生成式AI系统理解人类自然语言输入并自主生成数字化内容。AIGC的出现打通了物理世界与数字世界之间利用自然语言实现双向“感知、理解、生成”的技术路径。

理解元宇宙的第三个维度则是物理世界和数字世界的统合。AGI(Artificial General Intelligence)和ASI(Artificial Super Intelligence)是元宇宙的两个关键技术,AGI意指达到人类水平的通用人工智能,ASI则意指超越人类水平的高级人工智能。

AIGC已应用至多个领域

目前,大众能实际接触感知到的AIGC世界可能源自很多真假难辨的照片,比如AI生成的世界杯中国男足夺冠的图片,以及2023年5月22日AI生成的美国五角大楼爆炸的假新闻图片,后者甚至导致道琼斯指数瞬跌0.26%。

当然也有比较严肃的AIGC应用。于海华介绍称,“OpenAI在2023年3月发表了一篇论文,他们运用GPT大语言模型这一AIGC中的核心技术参加了美国多种考试,GPT3.5版本已在多种考试中表现出色,而用了一年左右时间升级到的GPT4版本已能在美国AP微积分BC(理工类大学入学资格,偏重数学概念理解、公式方程运用、符号交流及推理)中超越40%的人类,在美国律师资格考试中更是超越了88%的人类。”

“OpenAI论证,GPT类大模型有潜力成为人类史上类似于‘印刷术、蒸汽机’这样的通用基础技术,触发科技、社会巨大变革。”于海华说。

除了考试,AI在艺术领域同样表现出色。比如Midjourney这一人工智能程序,该程序由美国Midjourney研究实验室(11名创始成员,自筹资金)开发,可根据文本生成图像,于2022年7月12日进入公开测试阶段。Midjourney的底层算法参考CLIP和Diffusion开发了自有闭源生成模型,前端搭载在Discord社交通讯平台开放给社区用户使用,用户能利用它生成各种各样有特色的艺术图片,而通过数据飞轮和快速迭代建立护城河,网传该应用已实现约2亿美元年收益。

Midjourney尚需要相对复杂的格式化提示词脚本,但2023年新上线的OpenAI DALL•E3则完全使用自然语言形成脚本,能生成细节充沛的图片。此外基于文本生成视频、基于文本及2D图片生成3D模型,并可全程通过自然语言人机对话调优生成内容的AIGC技术,在2023年如同雨后春笋般涌现 其他如真人语音克隆系统,只需上传几十秒的真人语音就能输出以假乱真的AI语音,还能保留上传者的口音和语气风格,不但支持文本情感色彩,还支持超过一百多种语言。

一些AIGC的前沿探索团队,开始尝试利用Stable Diffusion可视化人脑信号,日本一个研究团队用fMRI脑磁活动数据训练编解码器,进行去噪优化并生成可视化图像。

总之,AIGC已在众多非严肃的娱乐领域有了很多惊艳的表现,在严肃科研领域也正在展露锋芒,比如AlphaFold这一系统已可预测并生成几乎全部已知蛋白质的3D结构。

于海华表示,AIGC背后能使之发挥巨大作用的核心技术是“大模型”,目前国内外都在积极投入这方面的研发。

联想控股股份有限公司创新发展中心、前瞻技术研究院高级总监  于海华

期待人机融合新加速节点

事实上,大模型并不是突然就有了这么强的能力,回溯根源,突变来自于2013年的一项技术侧进化——word2vec,奠定了从自然语言向量化表征过渡到预训练大语言模型智能理解、生成、交互的技术基础,这个技术解决了自然语言可计算的问题。

于海华称,在2013年之前是传统NLP语言模型,侧重建立并优化分词、句法、语法等抽象规则体系,针对每个特定任务,训练专门的模型对应,用人类对语言的理解去教机器。而2013年后是深度学习—生成式预训练模型,即把自然语言文本串转化为表征语义相关性的可计算向量,预训练过程以无监督学习为主,也就是让机器自学,同时预训练模型本身“涌现”出泛化能力,也可进一步微调优化。

同时还有用户侧的进化,从Web1.0到Web2.0再到Web3.0,从早期用户创造内容,到现在用户UGC生成主体,以及UGC技术瓶颈被AIGC打破,AI可以帮助用户生成大量有趣的内容。于海华表示,这个过程相对漫长,但已由量变引发技术跃迁。

联想控股前瞻技术研究院在2022年9月围绕元宇宙的进化整理了一张图谱,并随着技术的进化在不断更新。该机构认为“原宇宙”包含时间和空间两个维度,在过去几十年的时间里,随着电子化、信息化、数字化的发展,人们积累了大量信息化系统,同时自动化、软硬件的优化使技术堆栈越来越复杂。好的一方面是人们积累了大量好的数字内容,不好的一方面是造成了技术割裂,所有人类知识分散在不同的软硬件系统里,基于此,需要通用的智能技术。

“在此背景下,AIGC经历了几波起伏发展到今天,这是技术侧的进化——从物理原生世界向数字世界完善进化。”于海华称。

同时还有用户侧的进化,即“源宇宙”的进化。于海华表示,“目前,全球大概有50亿人都在网络化生存,人们离不开网络和智能手机等,人们的生活也在走向虚实共生社会进化。人与人之间的沟通通过自然语言表达,每个人的大脑实际就是自身的大语言模型,我们理解别人说的话,然后生成我们想说的话,也会借助IT技术把它表达成数字化文字和画面等多模态内容借助网络传播。”

但如何让机器理解人类的语言?AIGC技术就填补了这个空白,它可以理解人类告诉它的内容,并生成人类想让它输出的数字化内容。于海华表示,“AIGC技术从时间线上来讲,解决的是可重演的时间线问题。什么意思?就是人类积累的所有知识都可以喂给大模型,在掌握了这些知识后,所有积累过的知识大模型都可以重演,这是第一环。”而AGI技术就是下一个节点,它解决的是“势”的问题,让时间线变得可预测。

于海华表示,AI或者大语言模型积累了足够多的人类知识,可以越来越精准的预测出未来可能发生的事情,打通原宇宙和源宇宙这两个环后,就具备将来元宇宙终极形态成立的基本逻辑,也就是统合物理世界和数字世界,同时借助于通用人工智能,甚至将来超越人类水平的超级人工智能,来驾驭复杂技术,而人类只需要通过自然语言跟机器沟通交流。

“未来,元宇宙、原宇宙和源宇宙融合后,人机融合智能加速引擎将成为其中的活动主体,我们非常期待未来出现这个加速节点。目前,人类在AIGC领域迈出了第一步,我们在等待AGI迈出下一步。”于海华如此表示。

人机智能体将往何处去?

OpenAI出品的ChatGPT的上线是AIGC发展的里程碑,它让AIGC迅速渗透进大众认知。于海华介绍称,OpenAI成立早期是个非盈利机构,它聚集并吸引了最顶尖的人才,致力于解决最难的问题——对人类有益的AGI。2019年是重要的分水岭,当年因为Musk(马斯克)的离开导致该公司缺少资金来源,后来,该公司和微软结盟,从非盈利机构中拆分出一家新的“利润上限封顶”盈利性公司。正是在新公司的努力下,最终实现ChatGPT上线,在此过程中,微软已陆续投资约130亿美元,微软同时也拿到了OpenAI的先进技术优先使用许可。

ChatGPT上线后即开启了“闪电式扩张”模式,推出了ChatGPT Plus插件,使大模型可以上网,可以自己查找资料,同时还制作了APP,进入C端市场。但过快的发展速度也造成了一些问题,比如最近的CEO停职事件等。

那么未来,人机智能体将往何处去?OpenAI于2023年3月发表了一项研究,该研究根据所需教育水平、所需经验和所需在职培训情况把当前所有职业划分为5大类,评估GPT对不同类别职业的影响,结论显示,19%的现有职业中将有50%的任务受到来自GPT的直接或间接影响,所需受教育程度越高的职业受到的影响越更大。

于海华表示,从生态布局的角度讲,芯片、算力、模型、平台、数据、应用……参与其中的企业越来越多,但正是那些参与企业少,难以进入的领域才有较大的影响力,当然企业的投入产出也更大。着眼未来,AIGC将分化成三个赛道,底层算力芯片模型将自成一体进化,很多头部大公司均在自研自己的芯片+算力+模型体系;中间则会分化出不同场景面向小模型适配的平台应用数据;此外还有人机智能Agent。

联想控股前瞻技术研究院目前关注“多维信号传感数字孪生技术”这一机会,因为伴随着通信、传感、计算一体化技术日渐成熟,将大幅拉低物理世界模拟信号的复刻成本,并加速提升数字化孪生与源生精度,是支撑元宇宙应用场景的基石技术。

同时AIGC的发展也面临一些挑战,比如对教育科研体系的冲击,很多学生运用ChatGPT写论文,目前国际上部分大学已宣布禁用ChatGPT。此外还有千名专家成立了“反AI联盟”,呼吁暂停超强AI的研发,重新审视AI失控的风险。

于海华表示,未来,人类和AI之间的融合进化路径必定会启动,虽然现在AIGC仅仅迈出了第一步,但大势所趋,接下来的关键课题是如何让AI服务人类,而不是控制人类,使人类尽量别成为数字傀儡。

“我们认为人机融合智能体是未来科技生产力、生产关系里的活跃因素,不可忽视,且AI技术会渗透到几乎所有行业,因为它是底层技术,会自下向上进行变革。”于海华总结道。



×

登录您的账号

还没有账号? 注册
  • 忘记密码
  • 使用第三方账号登录

×

登录您的账号

还没有账号? 注册
  • 发送验证码
  • 使用第三方账号登录

×

注册您的账号

已有账号?
  • 发送验证码
×

忘记密码

输入与您的帐户关联的邮箱,我们将通过邮箱验证码来重置密码。
  • 发送验证码
微信

微博