联想控股于海华：探秘“元宇宙”，人机智能体将往何处去？

公司卓玛 2023-12-28 16:11:07 38010 分享： 微信微信 qq qq 微博微博海报海报字体大小：Aa-Aa+

人机融合智能体将是未来科技生产力、生产关系里的活跃因素，不可忽视

《投资时报》记者卓玛

2023年，全球科技、社会、经济均迎来重要变化，生成式人工智能（AIGC）技术迅速破圈并成功开启商业化之路，拉开了新一轮科技引领生产力变革大潮的序幕。与此同时，中国经济发展也到了新旧动能转换的长周期，人工智能、大数据、物联网迅猛发展，“新质生产力”加快形成，中国制造业正加速转型升级，努力向智能制造迈进。

自2023年初以来，ChatGPT的亮眼表现为世界展示了AIGC的无限可能。该如何理解科技进步带来的机遇与挑战？又该如何把握这样一个投资趋势？

2023年12月20日，标点财经研究院联合《投资时报》、投资时间网在北京举办“见未来•2023第六届资本市场高峰论坛暨金禧奖年度颁奖盛典”，众多嘉宾齐聚一堂，共同打造了一场精彩的观点视听盛宴。

联想控股股份有限公司（下称联想控股，03396.HK）创新发展中心、前瞻技术研究院高级总监于海华，在此次论坛中进行了细致有料的分享，在题为《AIGC：人机融合智能体迈出第一步》的主旨演讲中，他表示，“我们认为，人机融合智能体是未来科技生产力、生产关系里的活跃因素，不可忽视。且AI技术会渗透到几乎所有行业，因为它是底层技术，会自底向上进行变革。”

于海华来自联想控股前瞻技术研究院，该研究院于2023年初启动成立，目的是在联想控股“产业运营+科技创新”战略指导下，构建前瞻技术开放创新孵化体系，筛选前沿科技领域的前瞻性种子技术，与高潜力创新团队共同设计产业化路线、共创IP，实现“产学研”联动，以产业带动生态资源，为联想控股产业运营持续输送高潜力持股企业、技术、人才，加强与联想控股旗下企业合作，推动联想控股在科技创新领域的可持续发展。

“我们主要就干三件事，围绕科技创新的生命周期，在上游发掘有潜力的种子技术，在中游和科研团队一起做IP共创，把技术做成产品，在下游帮助产品团队补齐产业资源，让它们发挥更大的产业化价值。”于海华如此表示。

元宇宙的三个维度

于海华认为，元宇宙（Metaverse）首先可以从物理世界（Physiverse）的“原”和数字世界（Digiverse）的“源”这两个维度来理解。AIGC（AI Generated Contents）是AI生成内容的简称，是指由生成式AI系统理解人类自然语言输入并自主生成数字化内容。AIGC的出现打通了物理世界与数字世界之间利用自然语言实现双向“感知、理解、生成”的技术路径。

理解元宇宙的第三个维度则是物理世界和数字世界的统合。AGI（Artificial General Intelligence）和ASI（Artificial Super Intelligence）是元宇宙的两个关键技术，AGI意指达到人类水平的通用人工智能，ASI则意指超越人类水平的高级人工智能。

AIGC已应用至多个领域

目前，大众能实际接触感知到的AIGC世界可能源自很多真假难辨的照片，比如AI生成的世界杯中国男足夺冠的图片，以及2023年5月22日AI生成的美国五角大楼爆炸的假新闻图片，后者甚至导致道琼斯指数瞬跌0.26%。

当然也有比较严肃的AIGC应用。于海华介绍称，“OpenAI在2023年3月发表了一篇论文，他们运用GPT大语言模型这一AIGC中的核心技术参加了美国多种考试，GPT3.5版本已在多种考试中表现出色，而用了一年左右时间升级到的GPT4版本已能在美国AP微积分BC（理工类大学入学资格，偏重数学概念理解、公式方程运用、符号交流及推理）中超越40%的人类，在美国律师资格考试中更是超越了88%的人类。”

“OpenAI论证，GPT类大模型有潜力成为人类史上类似于‘印刷术、蒸汽机’这样的通用基础技术，触发科技、社会巨大变革。”于海华说。

除了考试，AI在艺术领域同样表现出色。比如Midjourney这一人工智能程序，该程序由美国Midjourney研究实验室（11名创始成员，自筹资金）开发，可根据文本生成图像，于2022年7月12日进入公开测试阶段。Midjourney的底层算法参考CLIP和Diffusion开发了自有闭源生成模型，前端搭载在Discord社交通讯平台开放给社区用户使用，用户能利用它生成各种各样有特色的艺术图片，而通过数据飞轮和快速迭代建立护城河，网传该应用已实现约2亿美元年收益。

Midjourney尚需要相对复杂的格式化提示词脚本，但2023年新上线的OpenAI DALL•E3则完全使用自然语言形成脚本，能生成细节充沛的图片。此外基于文本生成视频、基于文本及2D图片生成3D模型，并可全程通过自然语言人机对话调优生成内容的AIGC技术，在2023年如同雨后春笋般涌现其他如真人语音克隆系统，只需上传几十秒的真人语音就能输出以假乱真的AI语音，还能保留上传者的口音和语气风格，不但支持文本情感色彩，还支持超过一百多种语言。

一些AIGC的前沿探索团队，开始尝试利用Stable Diffusion可视化人脑信号，日本一个研究团队用fMRI脑磁活动数据训练编解码器，进行去噪优化并生成可视化图像。

总之，AIGC已在众多非严肃的娱乐领域有了很多惊艳的表现，在严肃科研领域也正在展露锋芒，比如AlphaFold这一系统已可预测并生成几乎全部已知蛋白质的3D结构。

于海华表示，AIGC背后能使之发挥巨大作用的核心技术是“大模型”，目前国内外都在积极投入这方面的研发。

联想控股股份有限公司创新发展中心、前瞻技术研究院高级总监于海华

期待人机融合新加速节点

事实上，大模型并不是突然就有了这么强的能力，回溯根源，突变来自于2013年的一项技术侧进化——word2vec，奠定了从自然语言向量化表征过渡到预训练大语言模型智能理解、生成、交互的技术基础，这个技术解决了自然语言可计算的问题。

于海华称，在2013年之前是传统NLP语言模型，侧重建立并优化分词、句法、语法等抽象规则体系，针对每个特定任务，训练专门的模型对应，用人类对语言的理解去教机器。而2013年后是深度学习—生成式预训练模型，即把自然语言文本串转化为表征语义相关性的可计算向量，预训练过程以无监督学习为主，也就是让机器自学，同时预训练模型本身“涌现”出泛化能力，也可进一步微调优化。

同时还有用户侧的进化，从Web1.0到Web2.0再到Web3.0，从早期用户创造内容，到现在用户UGC生成主体，以及UGC技术瓶颈被AIGC打破，AI可以帮助用户生成大量有趣的内容。于海华表示，这个过程相对漫长，但已由量变引发技术跃迁。

联想控股前瞻技术研究院在2022年9月围绕元宇宙的进化整理了一张图谱，并随着技术的进化在不断更新。该机构认为“原宇宙”包含时间和空间两个维度，在过去几十年的时间里，随着电子化、信息化、数字化的发展，人们积累了大量信息化系统，同时自动化、软硬件的优化使技术堆栈越来越复杂。好的一方面是人们积累了大量好的数字内容，不好的一方面是造成了技术割裂，所有人类知识分散在不同的软硬件系统里，基于此，需要通用的智能技术。

“在此背景下，AIGC经历了几波起伏发展到今天，这是技术侧的进化——从物理原生世界向数字世界完善进化。”于海华称。

同时还有用户侧的进化，即“源宇宙”的进化。于海华表示，“目前，全球大概有50亿人都在网络化生存，人们离不开网络和智能手机等，人们的生活也在走向虚实共生社会进化。人与人之间的沟通通过自然语言表达，每个人的大脑实际就是自身的大语言模型，我们理解别人说的话，然后生成我们想说的话，也会借助IT技术把它表达成数字化文字和画面等多模态内容借助网络传播。”

但如何让机器理解人类的语言？AIGC技术就填补了这个空白，它可以理解人类告诉它的内容，并生成人类想让它输出的数字化内容。于海华表示，“AIGC技术从时间线上来讲，解决的是可重演的时间线问题。什么意思？就是人类积累的所有知识都可以喂给大模型，在掌握了这些知识后，所有积累过的知识大模型都可以重演，这是第一环。”而AGI技术就是下一个节点，它解决的是“势”的问题，让时间线变得可预测。

于海华表示，AI或者大语言模型积累了足够多的人类知识，可以越来越精准的预测出未来可能发生的事情，打通原宇宙和源宇宙这两个环后，就具备将来元宇宙终极形态成立的基本逻辑，也就是统合物理世界和数字世界，同时借助于通用人工智能，甚至将来超越人类水平的超级人工智能，来驾驭复杂技术，而人类只需要通过自然语言跟机器沟通交流。

“未来，元宇宙、原宇宙和源宇宙融合后，人机融合智能加速引擎将成为其中的活动主体，我们非常期待未来出现这个加速节点。目前，人类在AIGC领域迈出了第一步，我们在等待AGI迈出下一步。”于海华如此表示。

人机智能体将往何处去？

OpenAI出品的ChatGPT的上线是AIGC发展的里程碑，它让AIGC迅速渗透进大众认知。于海华介绍称，OpenAI成立早期是个非盈利机构，它聚集并吸引了最顶尖的人才，致力于解决最难的问题——对人类有益的AGI。2019年是重要的分水岭，当年因为Musk（马斯克）的离开导致该公司缺少资金来源，后来，该公司和微软结盟，从非盈利机构中拆分出一家新的“利润上限封顶”盈利性公司。正是在新公司的努力下，最终实现ChatGPT上线，在此过程中，微软已陆续投资约130亿美元，微软同时也拿到了OpenAI的先进技术优先使用许可。

ChatGPT上线后即开启了“闪电式扩张”模式，推出了ChatGPT Plus插件，使大模型可以上网，可以自己查找资料，同时还制作了APP，进入C端市场。但过快的发展速度也造成了一些问题，比如最近的CEO停职事件等。

那么未来，人机智能体将往何处去？OpenAI于2023年3月发表了一项研究，该研究根据所需教育水平、所需经验和所需在职培训情况把当前所有职业划分为5大类，评估GPT对不同类别职业的影响，结论显示，19%的现有职业中将有50%的任务受到来自GPT的直接或间接影响，所需受教育程度越高的职业受到的影响越更大。

于海华表示，从生态布局的角度讲，芯片、算力、模型、平台、数据、应用……参与其中的企业越来越多，但正是那些参与企业少，难以进入的领域才有较大的影响力，当然企业的投入产出也更大。着眼未来，AIGC将分化成三个赛道，底层算力芯片模型将自成一体进化，很多头部大公司均在自研自己的芯片+算力+模型体系；中间则会分化出不同场景面向小模型适配的平台应用数据；此外还有人机智能Agent。

联想控股前瞻技术研究院目前关注“多维信号传感数字孪生技术”这一机会，因为伴随着通信、传感、计算一体化技术日渐成熟，将大幅拉低物理世界模拟信号的复刻成本，并加速提升数字化孪生与源生精度，是支撑元宇宙应用场景的基石技术。

同时AIGC的发展也面临一些挑战，比如对教育科研体系的冲击，很多学生运用ChatGPT写论文，目前国际上部分大学已宣布禁用ChatGPT。此外还有千名专家成立了“反AI联盟”，呼吁暂停超强AI的研发，重新审视AI失控的风险。

于海华表示，未来，人类和AI之间的融合进化路径必定会启动，虽然现在AIGC仅仅迈出了第一步，但大势所趋，接下来的关键课题是如何让AI服务人类，而不是控制人类，使人类尽量别成为数字傀儡。

“我们认为人机融合智能体是未来科技生产力、生产关系里的活跃因素，不可忽视，且AI技术会渗透到几乎所有行业，因为它是底层技术，会自下向上进行变革。”于海华总结道。