-->
在全球科技竞争的舞台上,大模型技术无疑是最耀眼的明星之一。在美国,大模型技术发展迅猛,而中国如何在这场科技竞赛中实现弯道超车?本文基于数势科技创始人黎科峰博士,百川智能联合创始人焦可,腾讯研究院副院长刘琼,蓝驰资本投资合伙人、TGO鲲鹏会(北京)学员石建平以及实在智能联合创始人张俊九等五位行业大咖在InfoQ主办的QCon全球软件开发大会的圆桌讨论整理。
石建平认为差距确实存在,但并没有想象中的那么大,国内团队的迭代速度非常快。他指出:“领跑者有其优势,但也付出了探索成本。国内追赶的速度会加快,所需的训练资源也会大幅减少。而关于芯片限制、禁运等问题,实际上,大部分真正有资源的大模型团队,在计算资源方面,并没有真正遇到最大的瓶颈。相反,资金方面的压力可能会更大,毕竟大模型是一个烧钱的领域。”焦可指出闭源模型客观上存在差距,随着技术的发展,对算力的要求越来越大,算力的限制是客观存在的。而开源模型的差距并不大,国内外的开源模型基本上处于同一水平线上。张俊九则提出了对标准和创新的反思。“我们是否应该将OpenAI等国外大模型的发展路径定义为正确的道路,这是值得反思的。目前,我们还在以他们为标杆,但未来可能并非如此。例如,Google的Transformer工程师自己也在反思这是否过于耗费资源。”“为什么这些事情没有在中国发生,而是在国外?我认为这是最大的差距。最大的差距是我们缺乏从0到1的创新。同时,前段时间也有人调侃,国外一开源,国内就创新,这既是一种自嘲,也是一种调侃。因此,我认为最大的差距在于创新。”
刘琼认为在大模型应用方面,中国仍有机会。“我们调研中发现许多行业已经开始探索大模型方面的应用,许多研究报告也指出,2024年将有更多应用落地,并将进一步加速发展。”同时,她认为国内在形态方面可能比国外稍微领先一些。尤其在端侧应用方面,大模型在更小尺寸或离人们更近的终端应用落地,在中国目前进展较快。许多手机厂商,如小米,已经推出了他们在手机侧的端侧大模型。同时,一些新能源汽车厂商也在进行这方面的探索和落地。焦可认为国内有多方面的优势,特别是在中文处理方面,国内的开源模型明显优于海外模型。海外模型中文语料库相对较少,例如LLaMA 2的中文语料只占0.13%。而我们从一开始就采用双语教学的方式,因此,国内开源模型在中文处理方面肯定会更好。另外,他认为今年可能会有很大的应用机会。包括Agent架构可能会落地。“在模型上面可能要慢一步,但是我们希望能在应用上能够快三步。”黎科峰博士从大模型的四个重要要素:算法、算力、数据和场景分析。他认为“随着算法的开源,这种差距将会缩小。数据方面,无论是整体数据还是中文数据,我们都需要正视差距。尽管中文在全球知识中的占比并不大,但语言本身没有国界。对于中文数据,中国的大数据量将导致中文理解能力更强。”黎科峰博士认为场景非常关键。回顾移动互联网时代,中国市场对于场景的理解和深耕始终具有巨大优势。这也反映无论是在移动互联网时代还是AI或大模型时代,场景理解和深耕是一个更加明确且持续具有竞争力的重要因素。张俊九则以实在智能为例,介绍了他们在应用层面的创新。“我们去年8月份推出了TARS大模型及基于大模型的RPA-Agent智能体产品和解决方案。那时,我们也是全球首创,解决了两个重要的技术难题。因此,在应用层面,我们在解决具体问题时,仍有很多变通和技术重构的优势。”
黎科峰博士在讨论中提出话题:我们应该跟随国外的发展,还是应该寻找更多创新的道路,或者探索更适合中国的道路?焦可认为根据大模型的Scaling Laws(尺度定律),可以选择在不同维度上进行增加,可以选择在数据层面、模型深度、模型宽度、时间维度和场景维度等多维度进行增加,不同的维度可以走出不同的道路。但总体而言,只要你是基于Transformer架构进行增加,本质上就是一个算力和数据驱动的事情,但是可以选择在不同的维度去Scale。石建平指出这是一个非常有争议的视角。“一方面,我们说中国缺少原创,另一方面,我们跟随别人后面。作为投资人和创业者,我们需要有勇气去赌未来有新的机会。虽然不是任何团队都有可能做出全球性的创新,但是当我们看到这样的机会和团队时,我们应该有勇气去赌。否则,我们将永远失去创新的基础。只做APP是不够的,我们需要底层的创新。”石建平认为行业里有很多人在做应用,做SFT(Supervised Fine-Tun-ing监督微调),做更深度的调整,解决行业应用场景等问题,这很好。同时,他鼓励有更大梦想的团队能够聚集大量资金去做更AGI的底层基础模型,进行更好的创新。
综合来看,中美在AI大模型领域存在多方面差距,但中国展现出强烈的信心与决心。面对现状,中国需认识到差距,同时发掘自身优势和机遇。利用算法开源,通过深化应用场景、开发数据集和端侧创新,中国有望实现快速发展。此外,原创性技术创新对长期领先地位至关重要,投资人和从业者在此过程中扮演关键角色,需支持创新并具备战略眼光,助力中国在全球科技竞赛中领先。
关于数势科技
数势科技是行业领先的数据智能产品提供商,拥有在大金融、高科技制造和泛零售等领域的专业洞察力及技术实力,为全球优秀企业提供基于大模型增强的智能指标平台(SwiftMetrics)、智能分析助手(SwiftAgent)、智能标签平台(SwiftCDP)及智能营销平台(SwiftMKT)系列产品,提升企业的数字化决策能力,推动企业数字化升级。
— END —
点击“阅读全文”了解数势科技
商务合作:business@digitforce.com
市场合作:marketing@digitforce.com
电话:010-53383810 (工作日10:00-19:00)地址:北京市海淀区花园路庚坊国际大厦15层