硅基智能 - 公司详情 - 核心技术

多通道语音分离（Multi-Channel Speech Separation）

基于深度聚类（Deep Clustering）的麦克风阵列处理技术，通过复数域时频掩码（cTFSM）模型在噪声环境下实现声源分离。结合自适应回声消除（AEC）模块，在信噪比<5dB场景仍保持85%以上识别率。

跨模态驱动引擎

融合视觉语义理解与语音特征同步的技术框架，通过LSTM-CNN混合网络实现文本到面部动作的端到端映射。创新性采用关键点光流估计（Optical Flow Keypoints）算法，解决数字人口型与语音的亚毫秒级同步问题。

动态神经声码器（Dynamic Neural Vocoder）

基于生成对抗网络（GAN）的高保真语音合成技术，通过解耦基频建模与韵律建模实现声音的细粒度控制。采用端到端架构直接学习原始波形分布，突破传统声码器参数限制，显著提升合成语音的自然度与情感表现力。

科创行业

新一代信息技术人工智能

细分行业

图像、视频与音频生成

融资次数

员工数量

100-499人

专利数量

140

经营范围

智能技术、网络技术开发、技术咨询、技术服务、技术转让；计算机软硬件的技术开发、销售；人工智能产品、计算机产品、人工智能软硬件的技术服务；人工智能信息咨询；语音网关、软硬件产品、电子产品销售；增值电信业务；面向成年人开展的培训服务（不含国家统一认可的职业证书类培训）；软件开发；数据处理和存储服务。（依法须经批准的项目，经相关部门批准后方可开展经营活动）

主营业务

提供人工智能驱动的语音通话和数字人交互产品与行业解决方案，以AI数字劳动力助力企业服务升级和数字化转型。

公司全称

南京硅基智能科技集团股份有限公司

公司类型

有限责任公司

成立时间

2017-08-08

法定代表人

司马华鹏

邮箱

guijixs@guiji.ai

地址

南京市雨花台区凤信路20号万博科技园C号楼5层