下载APP

扫码下载 网通社APP

扫码下载网通社APP

科大讯飞发布端侧多模态大模型与自研声学系统,推动智能座舱向主动服务演进

网通社小助理 2026-04-29 07:24

科大讯飞在北京车展上推出新一代多模态智能座舱解决方案,包含端侧部署的SparkAuto-EMM大模型、iFLYSOUND氮化镓母带级声学系统及面向海外市场的多语言交互方案。该方案旨在实现从“被动响应”到“主动服务”的转变,构建涵盖感知、理解、决策、执行与主动服务的完整闭环。 新发布的端侧多模态大模型支持0.5B至7B参数规模的阶梯式部署,适配不同算力平台,在无网络环境下仍可运行,并保障用户数据不出车。该模型能理解模糊语义和复杂意图,例如根据“有点闷”自动判断应开窗或启动空调,并支持多步骤任务规划,如“先加油再去机场,路上找一家川菜馆”,实现任务拆解、路径规划与服务调用。 同时,科大讯飞构建三层智能体生态:自研高频场景智能体、深度集成生态伙伴(如美团)的车端优化智能体,以及长尾场景的可扩展解决方案。所有智能体均围绕车载场景定制,强调首轮命中率高、交互路径短、弱网或离线可用,并兼顾驾驶安全。 针对中国汽车出口需求,其海外星火助理覆盖32种语言、60个国家和地区,采用母语者构建的语料库和52个高质量TTS发音人,结合本地数字生态(如导航、音乐、新闻),提供符合文化习惯的交互体验。目前中国出海前十车企中已有8家与其合作,累计搭载于100多款量产车型。 在声学领域,iFLYSOUND采用氮化镓音频功放架构,单通道峰值输出达300W,配合红宝石薄膜电容、低密度翅片散热等技术,在音质提升20%、重量降低30%的同时控制成本。该系统已获QQ音乐臻品音质认证,并搭载于魏牌V9X、东风日产NX8、极氪007GT、奇瑞星途EX7、风云T9L、昊铂S600等车型,累计装车超120万辆。 iFLYSOUND还集成超30项自研音频算法,支持声场分区、方位导航提示、无麦K歌、随行DJ等功能,实现“好听、好用、好玩”的多维体验。其中,随行DJ可根据车速、油门深度等实时数据动态混音,增强驾驶与音乐的互动性。 整体方案标志着智能座舱竞争进入系统级智能体能力阶段,强调对真实驾驶场景的理解、车规级工程落地能力及全球化本地适配,而非单一功能堆砌。

以上内容由AI创作,不代表网通社立场。如有问题请联系feedback@news18a.com
分享到
微博
空间
网通社快报

2025-10-14 14:16 星期一

长按识别二维码
下载网通社客户端