科大讯飞高级别高水平多语言基座大模型国际学术研讨会在沪成功举办,约30位国际专家共议AI技术普惠发展新路径
7月28日上午,作为2025世界人工智能大会技术方向的重磅议题,“科大讯飞高级别高水平多语言基座大模型国际学术研讨会”在沪举办。在全球数字化转型深入推进的关键时期,研讨会汇聚了来自亚洲、欧洲近20个国家和地区约30位人工智能领域的产学研各界代表,10位来自中国、英国、匈牙利、塞尔维亚、以色列、伊朗、泰国、马来西亚、柬埔寨等国的行业资深AI专家进行了主题演讲。
围绕“共建智能语言新生态,赋能全球数字文明”主题,各国专家共商推进多语言AI技术普惠发展新路径,探索构建更加公平包容的全球AI治理体系,以技术创新助力“全球南方”国家跨越数字鸿沟,充分展现产学研协同创新的国际合作格局。
中国方案:为世界AI发展提供第二种选择
科大讯飞研究院院长刘聪在主题演讲中明确提出:“我们希望构建全方位的多语言大模型和它的应用,给世界提供第二种选择。”
刘聪介绍,最新升级的星火大模型X1可以支持130+语种,在阿语、德语、法语、韩语、日语等重点语种整体效果已超过GPT-4.1。通过混合语种路由等技术创新,星火语音大模型支持100个语种语音识别,整体效果超过Whisper V3,星火语音合成大模型支持55个语种语音合成,效果业内领先。
刘聪在演讲中还系统阐述了讯飞星火多语种多语言大模型的下一步研发计划。他提出,未来的多语言模型将围绕三个核心方向展开:一是推进“语音+文本”多模态数据的共建共享,打通不同模态之间的语义壁垒;二是打造具备原生多语种语音能力的大模型底座,增强模型对全球语言生态的原生感知力;三是构建融合跨语言知识迁移能力的多语言通用大模型,实现不同语种间的知识迁移与泛化能力提升,全面支撑全球多语言AI应用发展。
科大讯飞智算业务部副总经理张骁认为,中国智算产业发展迅猛但面临效率挑战,行业普遍存在算力迭代过快、实际可用算力不足、存量算力使用效率偏低等痛点。针对这些挑战,他提出需要在“算力+算法+数据”三要素基础上,引入“应用+生态”形成五要素集合的解决思路。张骁表示,通过构建人工智能公共服务平台,实现算力高效调度和开发者生态建设,能够让算力资源得到有效利用,推动智算产业健康发展。
构建“以人为本的AI”:让每个人都拥有自己的“巴别鱼”
英国萨里大学“以人为本的人工智能研究中心”联合主任宋一晢教授认为,多语言AI犹如现实版的“巴别鱼”——源自科幻小说《银河系漫游指南》中那种能实时翻译任何语言的神奇生物,正在打破人们之间的语言隔阂。
宋一晢强调,人工智能的终极目标是服务人类价值、赋能每一个个体,这要求AI必须要围绕人的体验、创造力与福祉设计,同时也必须是可接触、可控制、对所有人都有益,而不是只属于少数人。
他表示,这意味着将AI从“云端”带到“用户端”,宋一晢介绍了团队开发的DemoFusion与NitroFusion技术,能够在一块普通GPU上运行超高清、实时的生成式AI模型,让每一位创作者都能在本地设备上拥有“超级计算能力”。
宋一晢为科大讯飞及其同行用讯飞星火大模型打破语言壁垒的开创性工作点赞,认为这是真正意义上的以人为本,通过连接不同文化和背景的人,确保人工智能造福于每一个人。科大讯飞多年前已提出用人工智能建设美好世界的使命让宋一晢印象深刻,“美好的世界是我们都想要的,在这个世界里,人工智能不是主导者,而是赋能者”。他表示,人工智能最终的目标是打造一种不仅“智能”,更是“直觉式、可接触、真正属于每一个人”的AI。
匈牙利语言学研究中心总干事Gábor Prószéky教授强调,数据质量优于数据体量,是构建可信大语言模型的关键。他指出,匈牙利语作为粘着性语言,具有复杂的词缀组合及自由语序,这为大语言模型的token划分和长距离依赖建模带来独特挑战。团队开发的PULI模型家族已促成与中国AI同行的合作,通过HuGME评估框架实现了从训练、语料建设到实际应用的完整闭环。
弥合AI数字鸿沟:每一种语言都应有属于自己的大模型
由于数字化语料稀缺,全球主流大模型对低资源语言的支持严重不足,小语种国家面临AI边缘化风险。如何弥合这一数字鸿沟,成为此次研讨会各国专家共同关注的核心议题。
塞尔维亚诺维萨德大学技术科学学院主任Vlado Delić教授指出,塞尔维亚语在通用模型中token占比不足0.1%,远低于斯洛文尼亚语。“语言模型不能只服务大语种,每种语言都应拥有体现其文化身份的大模型。”为避免在医疗、法律等关键领域出现误译风险,必须构建符合本国语言特点和文化语境的国家级大模型。
以色列人类语言技术协会创始人兼董事Avner Algom认为“语言服务不能只为大语种设计,小语种也应拥有技术平权”;泰国皇家理工大学、坦亚武里皇家理工大学科学与科技学院院长Nipat Jongsawat强调“语言主权不是选择,而是国家的战略必要”;马来西亚拉曼理工大学企业孵化与创业中心副主任Yu Yong Poh提出“文化理解力比参数规模更重要”;柬埔寨金边皇家大学计算机科学系教授Heng Sovannarith指出:“如果语言被技术遗忘,这个群体也会被时代遗忘。”
面对这一系列挑战,国际合作成为重要解决路径。塞尔维亚诺维萨德大学技术科学学院主任Vlado Delić教授还分享了与科大讯飞的合作前景,他表示,希望通过与科大讯飞的合作,将本国语言技术纳入全球AI生态。双方已启动合作规划,计划将塞尔维亚语及相关南斯拉夫语言接入讯飞的翻译设备与智能应用系统,并以2027年贝尔格莱德世博会为阶段目标,打造本地化大模型。
科技超越边界:文明对话的生动实践
此次研讨会上,来自以色列的专家现场演讲,伊朗专家通过在线方式参与学术交流,两国专家在同一学术平台上分享技术见解,展现了科技发挥着越来越重要的超越政治边界的独特力量。
以色列人类语言技术协会创始人兼董事Avner Algom分享了希伯来语AI技术发展经验。他指出,希伯来语虽是世界上唯一被成功复兴为现代口语的古老语言,但在自然语言处理领域仍属低资源语言。
Algom强调,语言服务不能只为大语种设计,小语种也应拥有技术平权。IAHLT基于开源模型,已训练出双语大模型(希伯来语+英语),并部署于教育、客服、医疗等场景。通过财政激励机制,联合产业界解决数据获取合法性、训练成本和落地门槛问题。
伊朗谢里夫理工大学教授Hossein Assadi在线参加了研讨会,他从技术架构角度阐述了大模型发展的存储基础设施需求。他表示,GPU能提供每秒万亿次浮点运算,但若存储系统无法足够快地流式传输数据或处理检查点,强大算力就会变得无用。大型语言模型的训练、微调和推理过程对存储系统提出严峻挑战,需要高带宽、低延迟以及大容量的高效检查点管理能力。当存储系统出现瓶颈时,数千个GPU集群就会陷入等待状态,无法发挥计算优势。因此,存储系统必须与计算能力同步扩展,才能有效支撑大规模AI模型的运行需求。
技术赋能全球:构建人类命运共同体新实践
此次研讨会还展现了中国多语言AI技术在实际应用中的丰硕成果。随着讯飞星火X1的全面升级,其多语言能力扩展至130余种,在翻译、推理、文本生成、数学等核心能力上已能对标国际一流大模型,特别是在幻觉治理方面取得显著突破,大大提升了大模型在行业应用中的可靠性。
至今,科大讯飞多语种技术已为华为、比亚迪、海尔等中国企业的1.2亿台套设备提供语音交互支持,涵盖23种语言,在非洲、东南亚等国家实地落地,为“中国智造”走出去提供语言与AI能力保障。在AI技术生态建设方面,科大讯飞已开放813项AI能力接口服务全球53万开发者,其中272项AI能力专门面向多语种需求。
此次研讨会的成功举办,充分体现了中国在全球AI治理中的积极作用。正如刘聪所言:多语言AI,是“一带一路”的技术桥梁。他表示,科大讯飞将以“技术赋能+生态共建”双轮驱动,携手全球伙伴共建开放平台,共享技术成果和应用场景,用“中国智慧”助力不同文化背景的国家弥合智能鸿沟,共同构建更加包容、更加普惠的全球人工智能生态。
通过这次研讨会,各国专家达成共识:在全球化深入发展的今天,多语言大模型不仅是技术创新的成果,更是推动文明交流互鉴、构建人类命运共同体的重要工具。宋一晢教授所倡导的构建“人民的AI”是一项全球共同使命,需要全球协作,确保AI技术能够服务所有社区,实现真正意义上的技术平权和普惠发展。
中国经验为世界AI发展提供了宝贵的“第二种选择”,让每种语言——无论大小——都能拥有反映其文化身份的大语言模型,为全球数字文明的繁荣发展注入了新的动力。
热门评论 我要评论 微信扫码
移动端评论
暂无评论