多通道语音分离(Multi-Channel Speech Separation)
基于深度聚类(Deep Clustering)的麦克风阵列处理技术,通过复数域时频掩码(cTFSM)模型在噪声环境下实现声源分离。结合自适应回声消除(AEC)模块,在信噪比<5dB场景仍保持85%以上识别率。
跨模态驱动引擎
融合视觉语义理解与语音特征同步的技术框架,通过LSTM-CNN混合网络实现文本到面部动作的端到端映射。创新性采用关键点光流估计(Optical Flow Keypoints)算法,解决数字人口型与语音的亚毫秒级同步问题。
动态神经声码器(Dynamic Neural Vocoder)
基于生成对抗网络(GAN)的高保真语音合成技术,通过解耦基频建模与韵律建模实现声音的细粒度控制。采用端到端架构直接学习原始波形分布,突破传统声码器参数限制,显著提升合成语音的自然度与情感表现力。
融资次数
8
员工数量
100-499人
专利数量
140
经营范围
智能技术、网络技术开发、技术咨询、技术服务、技术转让;计算机软硬件的技术开发、销售;人工智能产品、计算机产品、人工智能软硬件的技术服务;人工智能信息咨询;语音网关、软硬件产品、电子产品销售;增值电信业务;面向成年人开展的培训服务(不含国家统一认可的职业证书类培训);软件开发;数据处理和存储服务。(依法须经批准的项目,经相关部门批准后方可开展经营活动)
主营业务
提供人工智能驱动的语音通话和数字人交互产品与行业解决方案,以AI数字劳动力助力企业服务升级和数字化转型。
南京硅基智能科技集团股份有限公司
有限责任公司
¥1,579万
2017-08-08
司马华鹏
18520099699
guijixs@guiji.ai
南京市雨花台区凤信路20号万博科技园C号楼5层