昨天,在2023人工智能计算大会(AICC)上,《北京市人工智能行业大模型创新应用白皮书(2023年)》发布。《白皮书》显示,北京是当前国内人工智能领域创新基础最好、人才资源最集中、研发创新能力最强、产品迭代最活跃的地区,现已拥有大模型创新团队122家,约占全国的一半,大模型数量居全国首位。
在全球范围内,世界各国均在积极推动大模型研发和应用。《白皮书》显示,目前美国和中国发布的通用大模型总数已占全球发布量的80%,成为大模型技术领域的引领者。从全国来看,北京对大模型布局最早,是当前国内大模型创新基础最好、科研团队最集中、技术实力最强、模型迭代最为活跃的地区。截至2023年10月,我国拥有10亿参数规模以上大模型的厂商及高校院所共计254家,分布于20多个省市/地区,其中北京有122家。
北京大模型应用市场空间广阔,已率先开展了多样化的应用实践。如衔远科技围绕北京一轻科技集团在市场需求跟踪、新型产品研发等方面的需求,打造了面向消费领域的品商大模型示范应用,形成商品智能反向定制、预测性生产、智能调度、智能营销等服务功能,加速消费制造领域“数智化”升级;360公司围绕银行在数字化转型方面需求,打造金融领域大模型,实现员工平均办公文档处理时间减少40%等。
《白皮书》也进一步提出了目前大模型应用落地面临的挑战,如算力资源供不应求、高质量数据成为严重掣肘大模型行业应用的症结、大模型幻觉问题离规模落地尚有差距、大模型应用存在“蹭热度”和同质化情况等。
大会期间,首批中文互联网语料库等一系列北京市人工智能领域创新成果集中发布。为满足大模型快速发展对高质量数据集的迫切需求,智源研究院联合拓尔思、中科闻歌宣布共建“中文互联网语料库”,为国内大模型产业发展提供安全、可靠的语料资源,并在大会上发布了首期104GB语料数据。同时,智源研究院联合阿里云、中科创达、蚂蚁集团等17家大模型企业发布《“中文互联网语料库”共建共享倡议书》,倡导坚持合作共享、安全合规、数据高质量等6项原则,推动人工智能产业健康持续发展。
大模型快速迭代离不开充足的算力资源支撑。本届大会期间,《2023-2024年中国人工智能计算力发展评估报告》发布,报告公布了我国城市人工智能算力排名榜单,北京连续六年蝉联第一。
为进一步夯实本市人工智能算力“底座”,北京人工智能公共算力平台也在大会上点亮,智谱华章、紫东太初等首批大模型企业签约入驻,将尽快实现公共算力资源高质量使用,加速重大科技成果产出。(记者 孙奇茹)