21世纪经济报道记者 曹媛 深圳报道
在漫威宇宙中,钢铁侠的AI管家贾维斯化身“超级秘书”,不仅负责斯塔克家族企业的运作,平常还是一个忠诚体贴的生活管家,甚至钢铁侠连生命安全都托付给了它。
平安集团首席科学家肖京认为上述场景在未来可能会实现,“很多靠知识和经验提供专业服务的领域,未来很可能会是少数优秀专业人员来调教、指挥一群机器人,为客户提供有温度的服务。”
在人工智能发展的七十余年,以GPT-4、DeepSeek为代表的大模型正重塑人类认知世界的方式。这场始于2017年Transformer架构的AI革命,通过“大数据+大算力+强算法”的黄金三角组合,引发了新一轮人工智能发展浪潮。
在当前年报季,上市公司也争相披露“含AI量”。如平安集团在年报中明确“全面数字化战略是2025开年的首要任务。”招商银行在年报中将“数字招行”的表述升级为“数智招行”,并强调“全力推进AI等前沿科技创新应用,拓展服务和管理半径,提升业务效率,降低交易成本,提升风控能力。”
就在AI赋能千行百业热潮中,肖京强调“市场竞争最终的胜负手还是在于核心技术水平”,而“忽视底层核心技术研发”的问题已初现端倪。
在智能涌现中,我们该如何看待这场AI技术革命。平安集团首席科学家肖京接受21世纪经济报道等采访,开展一场AI热下的“冷思考”。
智能涌现:技术、专业、场景、生态的四维协同
21世纪:近年来,以ChatGPT和DeepSeek为代表的人工智能技术引爆全球,如何评价这一轮AI技术带来的新变革?
肖京:DeepSeek这类人工智能技术的价值集中体现在智慧、效率两点:效率上,它会大幅提升社会、企业运转速度,提升效率;智慧上,它会推动社会、企业经营决策的模式从“后知、后决、后行”向“现知、现决、现行”,再到“先知、先决、先行”,我们可以真正用数据决策来代替经验决策,实现“聪明经营”。
目前,人工智能技术的有效应用,最主要的是要做到技术、专业、场景、生态的四维协同:一是要有技术,包括数据、算法、算力;二是要有行业专业经验和知识;三是要有实际场景,可以不断迭代、验证、升级;四是技术、业务、场景多方融合的生态,就可以不断迭代、打磨出多种多样的应用方案。
目前,人工智能带动产业升级趋势不可当,但是也有顺序,有些产业容易先赋能成功:一是行业本身数字化基础比较好;二是产业规模较大,涉及人数较多;三是利润率相对较高。如金融、医疗、教育等行业会最先受益。
21世纪:具体来看,DeepSeek这类人工智能技术如何改写金融业逻辑?
肖京:DeepSeek这类人工智能技术与金融业的融合将加速三个维度的颠覆:业务流程重构、服务模式革新、产业生态重塑。
DeepSeek模型参数全面开源大幅降低行业应用门槛,机构可简单通过私有化部署实现应用。但这只是一个入门级应用,适用于少量对专业性要求不高的场景,而具备科技能力的金融机构可基于开源模型,站在巨人肩膀上,结合自身专业数据与技术能力,构建垂域大模型,推动金融业的全面智能化升级。
未来,像金融这种靠知识和经验的专业服务领域,可能是少数优秀专业人员调教、指挥一群AI来服务客户,这样必然带来流程、模式和生态的彻底变革。
21世纪:平安集团已搭建起通用模型、垂域模型、应用模型三层大模型体系,为何要坚持自研垂域大模型?具体是如何自研的?
肖京:通用模型不具备很强的专业性,应用在专业领域时好像面面俱到,但实际上不是很精准。另外,DeepSeek只开源了它的模型参数,并没有开源训练数据和训练代码,DeepSeek也没有金融、医疗领域的训练数据,所以要通过自身能力、专业队伍去梳理、总结,然后得到高质量专业领域的训练数据。
训练数据生成也有几种方式,如可以用大模型,一定条件下让它生成一些训练样本,但会有很多幻觉,所以需要专业人员完善、补充、修改,最后形成数据。还可以从过去的历史案例中,通过专业人员手工总结、归纳、思考,把作业的完整过程总结归纳形成数据。
另外,所有训练代码也没有开源,专业团队需要去读懂不同大模型、不同能力是怎么训练的,然后复现这些技术能力。一旦我们有了复现技术、代码能力之后,就能做垂域的增强模型。
然后基于垂域模型,还可以进一步训练各个专属场景的模型,比如投资领域场景、复杂险种核保模型等具体场景模型。有了这些能力后,就能促进机构增加收入、降低成本、提高效率,也降低风险损失。
接下来,平安还将聚焦打造一系列的工具平台,包括智能体平台,模型训练、蒸馏、推理的工具平台,有了这些平台之后,就能基于各种场景快速打造一个模型矩阵。
这个模型矩阵是一个快慢思考结合的、适配各种场景的模型体系,可以更好地与业务结合起来,赋能未来的三类场景:一类是存量的业务场景升级,我们叫作“老树开新花”;第二类是“新枝发新芽”,指通过DeepSeek升级以后,可以借助大模型技术覆盖到原来触及不到的业务;第三类是“沃土生奇苗”,这是基于AI完全从0到1打造的原生应用场景。只有这样,才能充分发挥大模型平台、智能体平台的能力,真正做到为业务提效。
应用蜂拥:但核心技术才是最终胜负手
21世纪:从DeepSeek到Manus,你如何看待目前国内AI发展环境的变化?客观来说,目前中国在AI大模型领域与海外还存在哪些差距?
肖京:DeepSeek发布以后,各类大大小小的模型参数都开源了,加上大模型非常强大的泛化能力,这大幅降低了AI应用门槛,也加速了各行各业的AI应用拓展。
而Manus是基于大模型智能体的应用系统。很多人对它有误解,它既不是一个跨越式的技术进步,也不是国人“自嗨”,它是提供了一种大模型应用场景的解决方案。
但Manus的火爆也凸显出一个问题,即社会资源的投入可能会比较偏应用,因为大家觉得DeepSeek都开源了,是不是直接基于开源来做应用就行了?这会导致忽视底层核心技术研发。
这个问题在国内市场已经初现端倪,有些原本专注大模型底层研发的团队,最近迫于市场压力都不得不转向一些更加偏应用的领域。我认为这是“杀鸡取卵”,市场竞争最终的胜负手还是在于核心技术水平。
所以我们既不能像以前那样一窝蜂投入,之前很长一段时间的“百模大战”,都是低水平的重复建设、创新研发,这类问题要避免。我们更要避免忽视底层技术研发,需要保障核心技术研发的创新环境和土壤生态,只有这样中国才能真正地赶上,并且超过海外最高水平的AI能力。
21世纪:那中国在AI大模型技术领域的追赶路径是怎样的?
肖京:目前来说中国在AI大模型领域跟海外相比各有优劣,在算力、芯片、领军人才、原创的核心算法方面是有差距的,但差距一直在缩小,而且现在“绝对的依赖性”没有了。
DeepSeek这次的进展和突破,捅破了OpenAI先进算法的窗户纸。DeepSeek R1和OpenAI o1模型只相差一个月左右,并且由于DeepSeek是开源策略应用拓展更加快速。DeepSeek还完全由国内培养的青年人才完成的,这说明我们的人才队伍也有很大进步,但我国在领军人才方面还有差距。
中国的优势还在于擅长“集中力量办大事”,大模型技术有一个规模法则(scaling law),以前是算力越大、模型参数越大,涌现出来的能力也越强,现在DeepSeek还做了一个强化学习的规模法则,强化学习的迭代次数越多,它的思考能力也会越来越强,这实际上是一个“大力出奇迹”的技术,这种技术就特别适合擅长“集中力量办大事”的地方,容易形成产业优势。
风险之问:隐私边界与伦理重构的多重挑战
21世纪:AI大模型的应用目前存在哪些潜在风险?
肖京:这样颠覆性的变革肯定会带来一些潜在的风险,我认为有4类风险:一是AI本身带来的风险,比如数据安全、隐私保护、算法偏见、模型幻觉、数据泄露、模型篡改、生成不合规内容的风险。
第二,投入和产出不匹配的风险。AI大模型的应用很耗费资源,所以很多产品可能会出现投入资源和产出价值不匹配的风险,所以投入时需要价值导向,避免盲目地大干快上。
第三,社会风险。AI技术带来产业模式、流程、生态变革,会导致很多从业人员必须要进行技能转型,适应不同的产业业态,这就会带来一些社会风险。
第四,行业产生马太效应。比如未来有能力的头部机构AI应用能力会越来越强,但一些小企业就只能用一些简单应用,和大机构的能力差距会越来越大,形成马太效应、强者恒强。另外大家都用AI,如在金融市场上会导致策略趋同。
对于前两类风险,我们可以通过技术能力、管理水平的提升来解决,后两类风险就需要国家和行业共同努力,通过业态升级、岗位技能培训以及行业智能化、解决方案的开放服务等方式来解决。
21世纪:在应用AI技术时,如何平衡效率提升与风险防控?能否以平安集团举例说明?
肖京:效率和安全永远是难以平衡的,但是安全是我们的底线。金融、医疗行业是强监管行业,对安全要求非常高。
比如,平安集团AI模型上线有一个指标,叫“红线率”,比如AI医生去做咨询、收集信息,红线率一定要低于1%,有非常低的红线率才能让它上线。
此外,中国平安在十多年前就完成了集团大数据平台的建设,遵循合法正当、目的明确、授权同意及最小必要原则,打通全集团各种类型的海量数据(维权)孤岛,并建立了数据清洗、整合、更新、质量管理、标准化、脱敏安全,以及严格的权限管理、隐私保护管理规范、数据全生命周期安全管理等制度。
在此基础上,我们研发了蜂巢隐私计算平台,通过联邦学习、多方安全计算、先进密码学等技术,构建了面向金融行业“原始数据不出域、数据可用不可见”的数据要素流通范式。平安一直是严守数据安全底线,所有的系统都是本地化、私有化部署,不会调用公有云服务,所有数据都在平安系统内运行,这样,我们的AI系统就能够非常有效地从根本上降低数据泄露风险,为AI的应用保驾护航。