VidAU - 公司详情 - 核心技术

基于改进的One-Shot生成对抗网络(OS-GAN)，结合三维形变模型(3DMM)先验知识约束。创新性开发梯度解缠训练框架，在保持源身份特征的同时精确分离表情、光照参数，实现高保真换脸效果。配备人脸活动检测(LAD)安全模块确保技术合规使用。

采用视觉-语音-文本三流融合Transformer架构，集成场景保持技术(Scene-Consistent GAN)与语音特征迁移算法。首创音频流与唇形运动的联合优化模块，在语音翻译时同步适配目标语种的发音口型，突破传统字幕覆盖式翻译的技术局限。

基于深度学习的语音合成(VITS)与面部动作编码系统(FACS)融合架构，通过解耦语音特征、口型参数与面部表情向量，实现跨语种、多口音的数字人视频生成。核心技术包含高精度音素-视位映射模型及轻量化神经辐射场(NeRF)渲染引擎，支持1080P级真实感输出。

科创行业

新一代信息技术人工智能

融资次数

经营范围

人工智能基础资源与技术平台;人工智能行业应用系统集成服务;网络与信息安全软件开发;技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广;信息系统集成服务;人工智能通用应用系统;人工智能应用软件开发;软件开发;货物进出口;技术进出口;信息咨询服务（不含许可类信息咨询服务）;网络技术服务;;

主营业务

AI视频创作平台与视频出海本土化解决方案，通过AI视频生成与智能编辑技术简化视频生产流程

公司全称

广州位道科技有限责任公司

公司类型

有限责任公司(自然人投资或控股)

成立时间

2024-06-18

法定代表人

陈秋娜

地址

广州市天河区天河北路侨林街47号2601房Z73