翻译百种语言“相投”安徽盛云智能实现AI语音新
发布时间:2025-12-10 10:22
在国家全面实施“人工智能+”行动驱动现代产业体系深度变革的背景下,一场致力于前沿技术应用和产业发展的思想盛会——“2025”在广州越秀国际会议中心举行。千余名行业精英、专家学者和企业代表出席盛会,汇聚行业智慧,共谋发展新篇章。 作为语音人工智能领域创新企业代表,安徽声云智能科技有限公司首席科学家洪庆阳教授受邀出席大会,并发表题为《SoundCloud语音技术实践——面向智能跨界的多语言识别与角色分离技术》的演讲,分享了基础技术研究技术和产业应用的最新成果和实践经验。涉外谈判、国际会议、跨语言客服……很多场景都需要跨语言翻译技术的支持。攻克多语言识别这一主要技术,盛云智能技术研发团队基于Whisper等先进的预训练模型,针对小语言进行了针对性的训练微调,并采用创新的zipformer流编码器和转换器框架,成功开发了高效的流识别模型。它不仅实现了高质量的实时语音转录,还扩展了同声传译等高级功能。洪庆阳教授在演讲中宣布,该技术已覆盖欧洲、东南亚等全球其他地区的100多种语言,显着提高了跨语言交流和信息处理的效率。 在多人协作的复杂情况下对话中,AI语音技术要面临噪声干扰、语音重叠、说话人数量未知等诸多挑战,是业界公认的技术难题。经过多年的持续研发,盛云智能技术研发团队已完成核心算法C++版本的3次迭代。通过融合神经网络分割、UMAP降维、HDSCAN聚类等前沿技术解决方案,不仅提高了分离精度,还引领业界实现了高度优化的“运行时绿​​色版”部署。洪庆阳教授表示,该方案兼容端端和云端的各种计算平台。在保证高精度的同时,实现了运行效率的显着提升,为智能会议系统、媒体制作、司法等多个场景提供了可靠的技术支撑所有的审判。 洪庆阳教授表示,盛云智能科技始终致力于将人工智能语音技术转化为赋能实体经济的实际生产力。公司系列技术技能是积极响应“人工智能+”行动,以原创技术驱动产品创新,实现千行百业智能化转型的典范。未来,声云将继续深耕语音技术领域,进一步为自主可控、高效智能的产业新生态的发展贡献力量。 从本次大会的召开和盛云智能科技等“人工智能+”企业的技术示范可以看出,加速从战略规划到规模落地,成为调整实体经济、提升整体水平的重要推动力。生产力因素。 (中国日报安徽记者站记者:朱立新) WS6937DDF0A310942CC4995C28 https://cnews.chinadaily.com.cn/a/202512/09/ws6937ddf0a310942cc4995c28.html 版权保护:本网站发布的内容(包括文字、图片、多媒体信息等)的版权归中国日报网(中国日报国际文化传媒(北京)有限公司)独家使用。未经中国日报网事先同意和许可,禁止转载和使用。向中国日报提交评论:rx@chinadaily.com.cn