端到端神经网络语音合成系统
倒映有声的核心技术基于端到端的深度神经网络架构,类似Tacotron或WaveNet系列模型,通过文本输入直接生成高质量语音波形。创新点在于融合了独创的情感控制模块:使用条件生成对抗网络(cGAN)引入情感标签作为额外输入,通过动态调节音高、语速和韵律参数(如F0和时长),实现精细的情感(如高兴、悲伤)与情绪(如冷静、激动)表达。该系统还集成了多语种支持机制,通过共享编码器和语言特定解码器提升跨语言表现。
融资次数
2
员工数量
小于50人
专利数量
6
经营范围
服务:基础软件服务,应用软件服务,计算机系统服务,计算机系统集成、互联网信息服务,产品设计,网页设计,电脑动漫设计,个人形象设计,市场营销策划,企业形象策划,技术进出口(法律、行政法规禁止经营的项目除外,法律、行政法规限制经营的项目取得许可证后方可经营)(依法须经批准的项目,经相关部门批准后方可开展经营活动)
主营业务
专注于TTS(语音合成)技术,提供基于端到端神经网络的音频合成系统及多样化的行业解决方案
杭州倒映有声科技有限公司
有限责任公司(自然人投资或控股)
¥123万
2019-05-28
肖朔
wangyang@daoying.ai
浙江省杭州市余杭区五常街道高教路970-1号5幢4楼403-5室