潮起时:互联网大咖闯入儿童赛道,做了款不一样的AI伴学机器人
潮起时:互联网大咖闯入儿童赛道,做了款不一样的AI伴学机器人
“市场上欠缺一款真正为低幼儿童设计、既好用又完整的智能设备。”
来源|多知 作者|徐晶晶
生成式AI的浪潮涌动下,近两年教育行业迎来一波久违的人才“回流”。一个明显的标志是许多昔日离场的创业老兵,正集体回归教育主场。
本文的主角——AI创业公司奇点灵智与其高配置的创始团队,便是其中之一。其三位联合创始人均是拥有近二十年连续创业经历的资深人士,具备研发国民级教育产品的经验:
创始人兼技术负责人包塔,兼具扎实的学术背景与丰富的产业经验。他曾是清华人工智能实验室研究骨干。毕业后,他职业生涯的前10年与本系同学周枫等人联合创办网易有道,曾推出月活千万的“网易有道词典”,后者累计服务用户超10亿。2017年,他加入美团,担任美团副总裁、美团金融CTO。
联合创始人徐毅斐,毕业于清华大学生物医学工程、中科院心理所。曾担任字节跳动“大力智能台灯”的平台产品负责人。更早前,他是创新工场第一代产品经理,深度参与点心手机操作系统,之后创业投入儿童教育领域,创作出《鲸鱼岛的冬天》《皇帝的一天》等多个在AppStore登榜的Pad互动书产品。
联合创始人胡琛,和包塔同为网易有道联合创始人,也是清华计算机系96级的连续创业者代表。曾经在2010年创立团800团购导航和折扣电商折800,技术加营销的复合背景使得他在消费者洞察及商业化增长上拥有多个教科书级的实战案例。
01 从“奇点临近”到“奇点灵智”
“20世纪的技术进步,超过过去2000年,21世纪仅需要25年。”
“21世纪20年代末计算机通过图灵测试,机器智能和人的智能没有区别。”
“2045年,机器智能将超过人类10亿倍。”
20年前的经典著作《奇点临近》,以其对AI极具前瞻的预见,启迪了包括包塔在内的无数人。
“如今回看,这些预测不仅毫不激进,反而在诸多领域显现出提前应验的趋势。这背后无疑是蕴藏着巨大的产业机遇。”对于该书,包塔颇为激赏,甚至决定将公司命名为“奇点灵智”以致敬,“灵智相比临近,更直观表述了人类对AI的终极幻想”。
而这支创始团队的集结,更是一个关于信念与选择的故事。
时间拉回到2年前的暑假,刚刚离开美团的包塔和曾在有道一起创业的胡琛相约碰面。他们曾经如此幸运,大学毕业时刚好是中国互联网的第一波.COM热潮,也就开启了个人在互联网行业的起点。过去的十多年,他们亲历了由iPhone带来的移动互联网繁荣。如同胡琛所言:“我们是从DOS走到Windows又走到App的一代人。”因此,当2023年人工智能革命浪潮涌起时,他们敏锐地感知到前所未有的机遇,“面对这波浪潮,当然会激动不已,摩拳擦掌,很多以往无法实现的想法,终于有机会去成真,哪怕只是有机会试试。”
包塔当天在望京的咖啡馆办了张1000元的充值卡,之后的两个月里,二人每周碰面,讨论了情感陪伴App、多剧情AI互动游戏、陪猫狗玩耍的宠物机器人等各种机会后,最终决定,为孩子们创造一个由AI大模型在底层驱动的陪伴型机器人。
彼时,正投身于车载大模型研发的徐毅斐也接到了一通令其心绪久久未宁的电话。电话那头是他的旧相识胡琛。
“你给孩子做了10年产品,就真放得下?现在是AI能力爆发的前夜,你难道不想把之前的遗憾补上吗?”
因为这通电话,徐毅斐当天心绪翻涌,彻夜未眠。2021年离开字节跳动大力教育时,曾经多次在儿童教育方向创业的他本以为会彻底画上句点。更何况,此时的他已在上海定居,在上海的安稳之家与北京的创业洪流之间,横亘着京沪双城奔波的现实。
或许是心中放不下对儿童产品的热爱,一个月后,徐毅斐北上,与包塔、胡琛成功在京会师,也开启了之后两年里每周双城奔波的再创业之路。
至此,奇点灵智的故事完成了它的序章。而今,奇点灵智已获得由星连资本领投的数千万元天使轮投资,这也标志着三位创始人的创业路驶入了快车道。
事实上,从2023年7月公司成立,到2025年8月首笔投资落定,中间的七百余个日夜,是一段心无旁骛、全力以赴的蛰伏之旅。
“当时市场上火热关注的都是大模型基座,我们对于硬件创业的想法略超前,应用的热潮是从2024年后才开始的,2025年才是硬件。大家很难想象两年后的行业状态和技术能力能实现到什么样,所以我们就先闷头做出来,无需多言,干就完了。”与多知对话时,包塔的话语中透露出务实的底色。
静默两载,利剑将出。这三位老兵究竟会如何重新定义他们的产品?
02 “市场上欠缺一款真正为低幼儿童设计、既好用又完整的智能设备”
接下来,这支团队必须回答一个关键问题:在广阔的AI应用领域中,他们的第一步应落子何处?
初期,团队系统评估了多个细分赛道,最终锚定的方向是——低幼儿童智能硬件。
可以细拆为两个关键词:“低幼儿童”、“智能硬件”。
包塔的核心洞察是:“各年龄段人群都有专属的成熟硬件(如小学生有智能手表、中学生有手机),唯独低幼儿童,始终欠缺一款真正为他们设计、既好用又完整的智能设备。这意味着存在显著的市场空白。”
低幼儿童为什么一定需要一款好用的智能硬件?这是否是伪需求?
此前,团队在用户调研中发现一个普遍现象:尽管妈妈们经常购买多款同类产品(比如买多支点读笔),却始终找不到一个能长期陪伴孩子成长的工具。
这背后的核心诉求在于,家长希望孩子能独立专注地玩耍,并在玩耍中有所收获。而在过去,实现这一平衡的关键角色,只能由专业的幼教老师担任。
可以看到,当前市面上并不缺乏低幼儿童硬件产品(比如益智玩具、点读笔、故事机等),但这些产品普遍存在的问题是智能化程度低、功能单一,这也导致产品使用周期短,无法满足孩子的成长性需求。
团队还需要回答的一个问题是,低幼儿童需要的长期陪伴产品为什么必须是实体智能硬件,而不能只是一款App?
要回答这一问题,关键在于理解低幼儿童的陪伴需求。一次用户访谈中,一位妈妈的反问令包塔印象深刻:“孩子能搂玩具小熊睡觉,但能搂个Pad上床睡觉吗?”
这句话道出了关键差异:对于低幼儿童,真正的陪伴源于触手可及的实体交互所带来的安全感与情感连接。孩子们需要的不是某个功能设备,而是一个能拥抱、能对话的“伙伴”,这是任何屏幕内的虚拟世界都无法替代的。
故而,研发一款既能让家长放心、又能让低幼孩子长期使用的陪伴硬件,便是奇点灵智最初看到的机会所在。
需要指出的是,奇点灵智提到的“低幼儿童”明确指向3-8岁年龄段的孩子——他们是闲暇时间最充裕的人群,且处于三年级之前没有学习压力的“快乐启蒙”黄金窗口期。
从供给端来看,包塔判断,大模型结合多模态技术的突破,为弥合这一需求落差提供了巨大契机。
包塔说:“这一年多来的认知迭代,让我更加确信,借助日益强大的大模型能力,打造能持续吸引孩子兴趣、长期陪伴的硬件是可行的。这类产品的核心挑战就在于维持孩子的兴趣——传统单功能硬件普遍难以做到这一点。在低幼阶段,学习本质上是融入玩耍的过程。只要产品能持续激发兴趣,让孩子玩起来,就有无限契机融入学习。学与玩完全可以有机融合。”
事实上,低幼儿童智能硬件(不含学习机)本身是一个不小的市场,奇点灵智团队认为,借助AI技术重塑交互与陪伴体验,存在创造更长效价值产品的机会。团队锚定的,正是一片广阔天地、大有可为的新蓝海。
03 让AI小外教“主动看见”并引导孩子开口
经过一年多的产品打磨,奇点灵智的首款产品——“多奇AI小外教机器人”应运而生。
胡琛坦言,去年想出“多奇”的产品名,就同步申请了商标注册。“我们觉得公司叫奇点灵智嘛,多奇是对关键字‘奇’的继承——它既是人们对科技与人工智能的感受;同时也是对小朋友的美好期许,我们都知道好奇心是孩子最宝贵的品质,需要多呵护和培养。兴趣驱动、快乐成长,就是我们产品价值观的一部分。”
(图源自奇点灵智)
为何聚焦家庭桌面,而非户外随身场景?
这一决策的答案藏在一组用户数据中。徐毅斐分享道:“我们曾拆解过孩子们一周的时间轨迹分布。结果显示,他们超过70%的时间待在家中,而其中在桌前的时间占比尤其高。这一规律在不同年龄段的孩子身上高度一致。”换言之,家庭桌面是孩子们毋庸置疑的核心生活场域。
从核心功能来看,多奇解决的是让孩子开口“说”英语的难题。
团队选择从英语切入,是基于三重考量:第一,英语是教育领域中需求最明确、体量最大的单一市场;第二,它高度依赖语境,而多数家长无力提供;第三,大语言模型在语言教学上的应用路径最为清晰,可以发挥的价值更为明确。
语言的习得过程,通常被划分为听、说、读、写四个关键维度。多奇的核心突破在于解决“说”这一双向互动难题。与之形成参照的是,当前市场上的英语教育产品(比如熏听机、点读笔等)多聚焦“听”“读”等单向输入。
多奇是如何解决让孩子“说”英语这件事的?在设计上,它深度模拟了优秀幼儿英语教师的三种关键能力:
1.察言观色,主动引导:它能“看见”孩子并主动发起对话,弥补幼儿不善提问的短板。
2.循循善诱,鼓励表达:从单词到短句循序渐进,保护初学者的表达信心。
3.因材施教,动态调整:识别不同孩子,并用符合其水平的中英双语与之进行交流。
主动交互也是多奇区别于其他AI陪伴产品的核心交互特质。
当孩子坐在多奇对面时,开启观察模式的多奇就能(通过摄像头)看见孩子,察言观色,主动发起对话;甚至能从零基础的单词教起,并根据孩子表现实时调整难度与引导策略。
这一“主动”哲学,源于徐毅斐此前对传统智能硬件的一个深刻洞察。
几年前,还在大力智能台灯团队时,徐毅斐便收集过20个孩子一个月的台灯学习数据,发现了两个明显的问题:一是台灯亮着的屏幕本身就是干扰源,容易吸引孩子乱点屏幕;二是孩子写作业时,面对屏幕上的众多App常常无所适从。
因此,多奇选择了另一条路:化被动为主动,让AI主动先行感知。通过摄像头识别桌面内容,多奇得以在孩子开口前就理解场景,从而将产品从“等待指令的工具”升维为“洞察需求的伙伴”。
04 “让孩子回归最自然的实体空间进行学习”
功能之外,多奇的设计哲学与体验细节,同样构成了其产品力的核心。
外观上,多奇被设计成一个兼具科技感与呆萌感的桌面“精灵”。它拥有一双能表达丰富情绪的眼睛,并配备了两个功能各异的摄像头:顶摄用于精准捕捉孩子的手势、动作及与道具的相对关系;前摄则持续关注孩子的位置、状态与情绪。
尽管胸前拥有一块屏幕,占据了一半机身,但团队明确反对将其变为动画播放器或触控终端。徐毅斐强调:“这块屏幕不是放在孩子面前的Pad平板,而是机器人进行反馈的‘表达器官’,我们希望它更像静静站在书桌上陪你一起的小精灵。所以我们力求屏幕上呈现的图形和文字都简单、直观、清晰。”也就是说,对多奇而言, 屏幕退居为“背景”元素,只负责两件事:将抽象概念具象化,呈现可视化复杂概念(如将单词学习转化为对应的形象演示),以及对孩子的创造给予即时的视觉正反馈(如孩子口述故事时提供AI实时生成的画作)。
这一切源于一个根本洞察:让孩子回归最自然的实体空间进行学习,是激发潜能的关键。
徐毅斐深入阐释了实体空间对孩子的独特价值:
“从一出生,孩子认知世界的起点就是实体空间。触觉与触摸体验,对于他们的认知发展至关重要,尤其是在手部精细动作快速发展的幼龄阶段。常有人问,为什么不像学习机那样把所有内容都塞进屏幕里?我认为,好的交互应该回归人类最自然的状态。对幼儿来说,键盘、鼠标、触屏这些操作的门槛都很高。我之前创业时曾尝试过在Pad大屏甚至智能音箱上做内容,就深刻感受到孩子们适应这种交互的困难。
什么才是最自然的交互?答案就在孩子们本能热爱的游戏中——尤其是亘古不变、跨越文化的‘过家家’式角色扮演。无论是男孩拿着小铁皮人勇斗怪兽,还是女孩沉浸在魔法公主的世界里,甚至是当下流行的儿童桌游,其核心魅力都在于实体空间中的沉浸式扮演体验。 孩子们在这种最天然的游戏形态中完全投入,不仅是玩耍,更是在进行一种深度学习和自我探索。
这种实体空间中的角色扮演,正是孩子沉浸式学习与自我感知提升的黄金路径。 他们需要调动全身感官,亲手操作道具(怎么拿玩具),模拟真实情境(怎么翻书、布置场景),并在扮演中自然而然地组织语言、表达情感、理解角色和关系——这是对语言组织能力、想象力、共情力及自我认知能力的全方位锤炼。
所以我们的理念是:让孩子回到实体空间,同时让实体空间和信息世界联通。这就是为什么多奇虽然有屏幕,但我们设计的原点,都落在促进孩子与实体桌面、实体道具的丰富互动上——本质上是将数字智能融入并服务于他们最本真的‘过家家’世界。”
05 “我们不希望孩子把它当工具,而是当作一个活的生命”
让多奇具备活人般的生命感,是团队的核心设计原则,这主要体现在交互、表情与材质等方面。
交互上,多奇支持被孩子呼唤或触摸唤醒,也能像真人一样主动发起互动。例如,当孩子走到它面前却不说话,多奇会主动打招呼,模拟人与人之间的自然反应。
更为关键的是表情设计。多奇拥有丰富的专属表情,但它的脸上并不会显示学习内容。
徐毅斐阐释了背后的思考:“我们刻意将‘表情’与‘内容’分离。国外曾有一款出色的儿童机器人——MOXIE(注:2020年推出,售价799美元,现已停产,其母公司Embodied曾获亚马逊、英特尔等投资),其脸部是一整块屏幕,表情与教学内容(如菜单、按钮)会交替出现,这会导致一个诡异的现象:你朋友的脸上突然弹出了操作界面。”
“我们希望多奇的人格是独立且稳定的。当它陪伴孩子时,始终以完整的‘角色’存在,用自己的情绪反馈孩子。一旦表情与教学内容混用一张脸,孩子就会将其视为平板、学习机之类的工具,而非一个可以信赖的伙伴。”
从材质来看,材质是塑造产品性格的第一触点。团队的设计哲学是:多奇的肤感必须在“科技感”与“亲近感”之间取得平衡。
基于此,毛绒材质虽受孩子欢迎,却因“属性错位”与“卫生隐患”被排除。一方面,它会将“陪伴机器人”拉回“玩具”的认知;另一方面,它也难以通过家长关于“清洁度”的严格审视——例如,妈妈们通常不会允许一个在地毯上放过的毛绒玩具再被放回床上。
最终,团队选择了一种特殊的肤感处理工艺,其带有一些人类肤感的柔软,又保留了骨架的硬度。“我们希望孩子把多奇当作是一个有生命的伙伴。因此特别处理了接触表面,赋予它一种类肤的柔软触感——就像你触碰朋友的手或胳膊一样,皮肤是柔软的,但能感觉到其下的骨骼支撑。我们不希望孩子举起它的时候,感觉像拿起了一个冰冷的相机或者扫描设备。”徐毅斐说道。
目前产品定版的萌趣外形,是由2024年初的玩具熊原型草图开始,历经多轮创意聚焦于“小熊猫”和“小精灵”两个版本,并在当年暑假由妈妈们和孩子们的背靠背多轮投票下,最终定版“小精灵”外观。“去年秋天拍摄样片的时候,小朋友们对多奇是啥意见不一,有的说是兔子,有的说是小羊。”
实际上,多奇的设计原型刻意回避了对单一真实动物的模仿参照。徐毅斐道破了其中的策略:团队有意在“熟悉感”与“疏离感”之间寻求平衡。融入部分动物元素能带来亲近感,而避免过度具象则保留了神秘感,从而为孩子预留了宝贵的想象空间。
相较引进成熟IP,团队选择自研原创IP有着更深层的战略考量。
胡琛解释道,自研原创IP的核心优势在于“世界观构建的自由度”。团队想创造一个沉浸式的学习和玩耍场景,这需要能自由设定情节与角色。而成熟IP限制颇多。他举例说:“Hello Kitty没有设计嘴巴,不能随意配音说话,否则会破坏其原有设定。”
他进一步点明两者的本质差异:“若产品定位是AI玩具,成熟IP授权能带来更高溢价;但对于教育产品,妈妈们异常的‘不上头’,能清醒区分什么是限量版的营销概念,什么是产品的长期价值。”
可以看到,倡导回归实体空间进行交互学习、主动发起交互、具备活人感,这些特质都让多奇明显区别于市面上其他AI儿童陪伴产品。多奇的差异化,源于奇点灵智团队对低幼儿童的教育硬件本质的深刻理解。
06 “好的产品得让孩子和家长都接受”,“学与玩完全可以有机融合”
包塔指出,市面上陆续推出的陪伴产品大多局限于“AI能力 + 硬件形象”的组合,以玩具和陪伴为主,离教育属性较远。而真正有效的产品,必须实现 “AI能力+硬件形象+内容体系”的三重融合。
他举例道:“仅凭(AI玩具的)语音(交互)很难高效教会孩子一个单词。低龄儿童的认知特点是,其思维是高度具象化的,不认识‘菠萝’,就必须让他先看到菠萝。可以用语音实现陪伴,但要用语音实现高效率的教育通路,会面临挑战。
此外,还需要多模态交互与体系化的内容设计,将知识点拆解后,循序渐进地融入互动,让孩子在玩中自然吸收。
“好的产品得让孩子和家长都接受,做到让小朋友觉得是在玩,同时让家长认可是在学习,这样的东西才能够真的做到市场认可。如今,依托新一代AI的能力,我们有契机将‘学’与‘玩’更深度、更自然地融合,真正实现孩子体验愉悦、家长认可价值的正循环。”包塔说道。
公测期间的用户留存数据初步验证了这款产品的吸引力。胡琛透露,低龄儿童的注意力集中时间通常仅为15-20分钟,而多奇的孩子主动使用时长已远超这一均值。他进一步指出:“在传统20分钟的录播课中,孩子平均开口说英语可能只有8次;但在多奇的实体互动设计下,孩子的开口次数实现了大幅提升。这正是多奇创造的显著优势。”
从效果外化来看,通过家长端App,孩子每天的开口次数、学习状态及单词掌握进度均被量化呈现。
当前,多奇已经启动了最后的公测阶段,奇点灵智方面并未透露多奇正式面世的时间和具体价位。胡琛表示:“创新型产品需要一个好口碑从积累到扩散的用户体验过程。现在多花一些时间蓄力,也是为了更负责任地实现我们的愿景——打造一款能长久陪伴孩子成长的好产品。相信不会让大家等太久。”
当被问及是否担心大厂入局竞争,包塔坦然回应:“商业本身就是动态的,市场一旦验证成功,资本与玩家涌入是必然。创业公司的核心优势在于灵活性与先发优势。我们在儿童交互数据、场景理解、个性化推荐上的积累,会形成一定壁垒。就像今年大厂卷入的AI会议录音硬件类产品,硬件本身差异不大,真正的壁垒在于用户数据和个性化体验的飞轮效应。”
谈及AI硬件的发展趋势,徐毅斐认为:“手机因为iPhone带来了多点触屏的交互方式,带来了整个智能机的代际革命。我们现在看到这一波的 AI 技术,对自然语言更好的理解,和用多模态理解实体空间里人的行为,这两者结合起来其实本质上是更原生的人类世界的交互模式,而不是一定是个GUI图形界面了。这样的能力一定会需要新的硬件形态、新的产品去承载。但这个答案不会是突然来一个外星生物,完全脱离现实的状态出现,它的出现一定是逐渐演进的过程。”