36氪出海·AI|对话Nooka唐垲鑫:95后用AI重写康德,新一代平台会重新定义创作者


“谁能定义新的创作者,谁就能做成新一代内容平台。
前言



对话 Kaixin
不顾模型能力的 AI 创业
是刻舟求剑
AI NOW!:Nooka 是你第一次创业,为什么会想做内容平台,以及选择音频切入、而不是图文或视频?
Kaixin:我是2024年底开始认真考虑创业方向,到今年2月份正式出来。当时我注意到两个变化。
一个是 TTS(Text-to-Speech,文本转语音)技术的跃升。当时市面上主流 SOTA 模型生成的语音效果第一次达到了“可以听、听得下去”的水准,不会再想过去一样听起来就很人机、很出戏。也就是说,AI 音频内容的可消费性成立了。
另一个是语言模型构思能力的大幅发展。当 thinking model 的价格也更加普惠(Gemini 2.0 Thinkg),语言模型能给对内容和思想进行更深度的思辨,并引入合适的外部信息和线索而不只是浅层摘要。
这两个判断加在一起,我觉得音频这件事可以做了。它不是“AI 可以生成内容了”,而是“AI 可以生成高质量的、能被听进去的内容了”。
AI NOW! :这一点很有意思。因为很多人更多是“我想创造什么”出发去创业,而你是先划定模型能力的边界,再在边界里找机会。
Kaixin:因为这件事我之前有深刻教训。
出来创业前我去年是在商汤,在里面带团队负责一个 C 端 AI 产品的开发。我们当时想做的是一个 design agent,有点像最近出来的 Lovart。其实当时即使是 sota 的 Claude 3.5 也无法做到可用的效果,我们 bet 自研模型能在这个垂直方向上能力有所突破,但进展迟迟 delay。为了尽快上线,不得已只能通过产品策略去补齐模型的能力缺陷,用策略来补 AI 的短板。但这就是刻舟求剑。当等到 Claude 3.7 或 Gemini 2.5 Pro 出来的时候,这些努力都会被吞没掉;只有产品架构和模型能力的演化是能共振的方式才是优雅的——等到 Claude 3.7 或 Gemini 2.5 Pro 出来的时候,一切都要推倒重来。
这个问题其实只要看 Devin 和 Cursor 就是很好的例子。Devin 早期融资比 Cursor 更多,架构更超前——它从 day1 就就要做「全 AI 程序员」。但问题就在于太超前了,模型能力承载不了,结果导致任务完成率很低。Cursor 的选择就很务实,这个代码工具从一开始就很明确,只做当前模型能100% hold 住的功能。模型进化后,他们不是简单堆新功能,而是重新思考"现在模型能稳定实现什么新体验"。所以你看,当其他 AI 编程工具还在挣扎时,Cursor 已经靠精准匹配模型能力带来的用户体验形成了壁垒。
所以我们的教训就是,不能脱离模型能力去造产品,会成为先烈。得搭建和当前模型能力和未来模型演化都能共振的产品架构。
AI NOW! :回到 Nooka,音频平台的内容形式也有很多,为什么你们选择拆书这个方式?
Kaixin:确切的说我们是重构书,不是做摘要,也不是简单压缩。
音频内容哪里来,从内容制作能力上我们构建的 AI Agents 已经可以做的很好了,更关键的是输入的“内容种子”会是什么。相比新闻、话题,书籍——尤其是那些“人类经典”的书,作为内容种子提供了有更长时效性的信息知识价值。书籍自带 IP,结构清晰、信息密度高,以及通过 AI 来“对话重构”一本书的内容,可以避开绝大多数版权限制。
说到底是书能带来内容质量的基础保证。因为我们在模型上也做了很多构建,导致后来你给它一个字它也能扯出来8分钟内容,各种抛梗讲段子。但我觉得这个本质上是没有消费价值的。既然我们想要完成的是消费闭环,那就要从原点保证产出质量。
AI NOW!:如果用户想了解一本书,为什么不是直接去读呢?
Kaixin:我觉得知识传播的形式创新和深度阅读是并行的。20分钟的康德音频肯定无法替代800页的原著,真正理解康德还是需要读原著。但能读完《纯粹理性批判》的人毕竟是极少极少数。
今天,大家的注意力和信息接收方式,甚至大脑都在已经被短视频、碎片化信息重塑了——这是技术发展带来的不可逆趋势。如果知识压缩确实是个大趋势,那么20分钟的版本可以帮助康德思想传播得更广,是不是也是一件好事。


AI 不做摘要
AI 只会让书「活起来」
AI NOW!:所以你对此并不持悲观态度。说回来,Nooka 对书的重构,具体来说是什么样?
Kaixin:我们不是做摘要,也不是简单地把书念出来。真正的重构是让知识活起来。
比如讲康德的「先验观念论」,如果直接照搬哲学术语,99%的人会立刻关掉。但如果你说:想象一下,你戴着一副永远摘不掉的 VR 眼镜,看到的所有「现实」其实都是你大脑渲染的结果——这就是康德在200年前提出的核心观点。
这时候用户马上就能 get 到:噢,这不就是《黑客帝国》的设定吗?
这是目前英文版的处理方式。如果是日语用户,我们可能会替换一个押井守《攻壳机动队》的例子,让大家更容易在不同的语言背景下理解。
AI NOW!:你们如何训练模型,让它能实现这种动态解读?因为这是一个非常不标准化的处理方式,重构康德这件事上,AI 明显更可能会拿笛卡尔和叔本华来做比较,而不是黑客帝国。
Kaixin:秘诀在于「人设化」而不是一般的信息类比和关联。
我也看过一些 AI 去做的播客,很明显很看出它被设定了第一段讲什么、第二段引入讨论、最后如何收尾等等,可以说是一个有起承转合的八股文模式。但我们是给 Nooka 设定了不同风格的主播,一个像 Lex Fridman,博闻强识、擅长深度探讨,还有一个是 Joe Rogan 那样的脱口秀,很开放的段子手。
AI NOW! :所以用户听到的不是一个 AI 在努力牵强附会,而是这两个人格的模型在沿用他们的气质风格甚至学识储备在聊天。
Kaixin:没错。我们把他们所有的语料喂给 AI,再加上后期调试,就可以了。他们现在已经讲了1000本书,这个数很快会到1万本,最近我们正在重置内容。
AI NOW! :1000本到一万本难度大吗,你们选书的标准是什么?
Kaixin:先做1000本实际也是为了先拿到用户的反馈,再进一步去调优内容的生成。现在的1000本就是畅销书榜,《乔布斯传》《马斯克传》《英伟达之路》这些都有,也有很大一部分人类经典——比如康德,其实这些书大家以为没人看,也一样在卖得最多的 TOP 1000榜里。
AI NOW! :我非常好奇的是,在小红书以及一些社交媒体上,你们为什么会选择《纯粹理性批判》,选择康德而不是比如马斯克来“引流”?
Kaixin:哈哈,这纯粹是我们的个人喜爱。我们团队有一位哲学 PhD,现在是我们的全栈开发。她本科学的计算机,后来在清华读的哲学和人工智能交叉方向 PhD。
我相信做 ToC 产品非常重要且不可避免的一点就是,一定会带着你自己的价值观或者审美。《纯粹理性批判》确实也是对我自己影响最大的书之一。
互联网产品经理
无法在 AI 时代存活
AI NOW!:创业前之前你在大厂、创业公司、AI 头部公司几次横跳,当时为什么离开字节?在很多人看来你28岁就是一个二级部门负责人,是很好的职业机遇。
Kaixin:那几年确实升得挺快的,但在字节干到退休肯定不是我想要的。我在字节最后一年做的产品也是和 AI 相关的,那是2023年,当时已经能直观感受到大模型发展的突飞猛进。这件事让我非常兴奋,同时也希望能离技术底层更近一些。所以从字节出来后,聊了一圈我就去了零一万物。
AI NOW!:在字节做 AI 相关产品离技术还不够近吗?
Kaixin:说实话,直到去了模型公司创业,我才真正明白在大厂做 AI 产品和亲手打造 AI 产品的本质区别。
在字节时我们的工作模式很清晰:产品经理负责定义问题,比如"这个功能能不能提升1%的留存",然后规划一个大致的实现路径,剩下的交给开发团队去完成。那时候我觉得自己也算懂技术,毕竟学过计算机,也能写点代码。但本质上我们还是在用移动互联网时代的产品思维工作——技术实现是一个相对确定性的黑箱,我们只需要关注输入和输出。
去了模型公司做 AI 后,我发现自己的认知完全不够。大模型产品的技术边界是动态的、高度不确定的。同样是做一个对话功能,背后接 GPT-4o 还是 Claude 3.7还是 Gemini,采用怎样的 prompt engineering 策略,设计什么样的容错处理机制,每一个选择都会最后的实现完全不同。
这些不是在会议室里开几次会就能搞明白的,必须亲自己构建 benchmark 和搭建、测试应用,才能真正摸清每个模型的"脾气"。在大厂的时候,我们每周也会开两三次会讨论产品方案,但很少真正深入技术实现的细节。而现在,我可能花一整天就为了找到一个最合适的 temperature 参数,这是看再多 paper 也替代不了的。
AI NOW!:你认为 AI 时代还有产品经理吗?
Kaixin:我觉得产品经理这个角色在 AI 时代会发生根本性变化。
你不能只是个会提需求的人,必须同时是个懂模型特性并且能大致预判其动态发展的技术实践者,同时是个能预判用户体验的产品设计师。AI 时代一定需要这种全方位视角,产品经理这个互联网时代的独立工种是不会存在的,因为不可能脱离技术去构建产品,那一定会有大问题。
现在我们做 Nooka 这个产品,我自己就写了大量代码,我可能有一半时间在写代码。
AI NOW!:回到你做 Nooka 的出发点这个问题上。模型 TTS 和文本能力的双重进步让你选择了 AI 重构书这个方向,人在这个创作体系中还能扮演什么角色?
Kaixin:确实,AI 已经可以覆盖掉内容生产中很大一部分了——结构、风格、对话节奏这些事情,它都可以生成得很自然。但它做不了两件事:一个是判断,什么是“好”;另一个是生成种子,也就是最初的 idea 从哪来。
大模型的机制决定了它只能输出高概率的 token 序列,它的本质是“归纳”,不是“创意”。如果没有外部输入,它是没法自己决定“要不要聊一个奇怪的切口”、“这个跳跃值不值得一讲”的。但只要你能不断输入新的想法,它就能很好地展开,甚至构造出结构很完整的内容。
所以我们现在在做的事情,其实不是“让 AI 去创作”,而是“构建一个系统,持续发掘人类的微小提问和兴趣点”,然后 AI 负责把它们推演出来。
AI NOW! :你想通过构建这个系统,去激发新的创作者。
Kaixin:没错,在这个结构里,你可以不写稿,不剪辑,不主持,只要你能提出一个特别的视角,就能成为一期节目的起点。创作发生在消费过程里,也就是说,你一边听,一边已经在参与下一轮生成。
AI NOW!:B 站弹幕很多也非常精彩,它们和你的思路有什么区别?
Kaixin:B 站很多弹幕是高质量的,它的问题是没有被再次消费——因此无法进入创作的闭环。它停留在表达这一层,没有形成生产力。
抖音评论也一样,抖音作品下面有成千上万的评论,但它们完全没被组织起来,也没有形成分发机制。所以你说它是内容创作吗?它有时候是,但它撑不起来一个平台。
我们现在在做的,是看有没有可能让这些轻表达——比如一句评论、一个想法——被 AI 接住、展开、变成一个新的可消费的内容单元。只要这件事能成立,用户其实就从“观众”变成了创作起点。
这不是“门槛低一点的创作”,而是换了一种起点。AI 捕捉到每一个人思考中的闪光火花,绘制和拓展成对更多人有启发的内容。
AI NOW!:你相信仅仅靠触发就能产生新的内容生产力?
Kaixin:快手、抖音最开始都是工具,后来都成为了巨大的内容和社交平台。我相信谁能定义新的创作者,谁就能形成新一代内容平台。
AI NOW! 问所有人
2025年以来 AI 给你最大的震惊?
本文来自微信公众号“AI闹(ID:ainowainow)”,36氪出海经授权转载,如需转载请联系原作者。
欢迎填写表单,获取 AI NOW! 专访机会
AI 技术正在加速全球化进程,全球化带来的市场需求与数据流动反哺着 AI 创新。36氪出海·AI 栏目携手 AI NOW!(AI 闹),聚焦 AI 从业者的多元化视野,挖掘从技术研发到市场落地的实践,探索如何融合 AI 与各行业知识,把握未来 AI 应用场景趋势。如果您是 AI 创业者,或大企业 AI 业务负责人,欢迎扫描下方二维码,填写表单,获得 AI NOW! 专访机会。由于沟通专访的企业较多,AI NOW! 团队希望首先了解您的基本情况,并在筛选后与您联系,请您尽量留下具体、准确的信息。期待共同打造 AI 时代最好的人物访谈。


在全球经济复杂格局的当下,英文报道不仅是向海外客户和消费者传递价值主张的重要手段,也是企业在世界范围内的认知沉淀。英文媒体 KrASIA(kr-asia.com)致力于向世界介绍中国商业和文化。英文网站约60%的读者为东南亚核心国家的商业人群。KrASIA 通过优秀的搜索引擎优化,专业的英文内容和可靠的社交媒体矩阵,以及全球顶级信息数据平台彭博终端和道琼斯 Factiva 等外部收录平台,帮助中国公司提升全球品牌。如果您的公司对英文传播有相关需求,或者希望与 KrASIA 合作提供出海服务,欢迎扫描下方的二维码填写表单,获取 KrASIA 媒体服务刊例和工作人员的联系方式。

加入36氪出海学习交流群



抱团交流
一个集大神卖家与逗趣同行于一体的交流群,扫码添加客服微信(备注“进群”哦)。

目前100000+人已关注加入我们












下一篇:速查listing!这一热门词汇正匿名维权,已有115家店铺被冻结!
上一篇:亚马逊“赃物新政”落地倒计时!你的供应链链条经得起查吗?
文章为作者独立观点,不代表AMZ520立场。如有侵权,请联系我们。