这听起来像是“扣子空间”(KoeiTalk)在AI语音合成领域又有了令人瞩目的新进展!如果属实,这确实是朝着更自然、更人性化的语音合成迈进了一大步。
“文字秒变真人级播客”这一点强调了其"速度"和"效果":
1. "速度 (秒变):" 意味着转换过程非常快,效率高,大大降低了内容创作者制作有声内容的时间成本。
2. "真人级 (Realistic):" 这是关键,表明其合成的语音在音色、口型(如果结合唇动)、情感表达、自然度上已经达到了非常高的水平,非常接近真人说话。
而“停顿、语气词都像人”这一点更是"灵魂所在":
"停顿 (Pauses):" 真人说话时会有自然的停顿,用于思考、强调或换气。AI能够学习并模拟这种自然的停顿,会让播客听起来不那么刻板、机器感十足。
"语气词 (Fillers like "嗯"、"啊"、"那个"):" 这些看似随意的词语是人际交流中非常重要的部分,能传递情绪、表示思考过程,增加语言的流畅感和真实感。AI能合成这些语气词,是语音合成技术迈向“类人”的重要标志。
"总结来说,如果扣子空间真的实现了这些功能,那么它带来的影响可能包括:"
相关内容:

智东西
作者 | 李水青
编辑 | 漠影
https://oss.zhidx.com/a4175ccd35a43ef55fdc5db652ecd008/68388480/uploads/2025/05/6836ca59aec94_6836ca59aa96b_6836ca59aa93a_%E6%89%A3%E5%AD%90%E7%A9%BA%E9%97%B4%EF%BC%9A%E6%96%87%E6%9C%AC%E8%BD%AC%E6%92%AD%E5%AE%A2%E6%96%B0%E5%8A%9F%E8%83%BD%E8%A7%A3%E6%9E%90.mp3
你敢信吗?上面这段播客竟然是AI生成的。
智东西5月28日报道,昨日晚间,字节跳动旗下Agent协作平台扣子空间推出一键文本生成播客功能,可几分钟完成原本需要几个小时的工作,生成“真人级”的播客音频。
当别人还在为音频剪辑秃头时,聪明人已经让AI免费打工。在扣子空间的对话框输入转播客的提示词,AI能快速通过思考、读取文档、访问链接、搜索话题等步骤策划一个播客选题,然后转为多角色对话的播客音频。最重要的是,完全没有AI生成语音的“机械感”。上线才半天,今天早上网站服务器已经被挤爆。

无需插件,输入文字提示词就可生成播客
不得不说,Agent只是刚刚开始打工,就已经让人叹为观止了。
智东西第一时间进行了体验。本以为AI播客会很假,结果连老板听了都问是不是找了专业配音。
体验地址:https://space.coze.cn/
一、AI一键免费生成播客,“真人级”多角色对话
一键生成真人级播客,扣子空间这回首先是击中了媒体人的需求点。不过受益的远不止于媒体人,几乎各个领域的人都可以找到应用场景。我们今天把这些场景都试了试。
1、媒体向:搜索+策划+录制+剪辑,热点话题跟得快
从科技新闻、文娱热点、养生话题多个例子来看,扣子空间生成的播客都能达到真人级模拟,并且内容兼顾话题度和深度,基本上能把一个问题或事情说透,同时也有一些地方可以优化。
(1)科技产业热点→对话播客,1分钟输出多角色对话
智东西首先体验了将热点新闻转为播客。扣子空间帮我制作了题为《WWDC在即,苹果如何顶住AI压力?》的双人对话播客,全程仅花了1分多钟。
提示词:将这篇文章内容重点,转化为播客
https://mp.weixin.qq.com/s/1_ZUr7zLacK9e4bkuD16Ww,采用双人对话方式,一个男性一个女性,时长3分钟左右。
https://oss.zhidx.com/0c04c30f2d39c5b5a2ce304d79ac0de5/68388480/uploads/2025/05/6836ad4e01d11_6836ad4df1ed4_6836ad4df1ea6_1-1%E8%8B%B9%E6%9E%9C.mp3
播客音频
从音频效果来看,这段播客声音听起来非常像人声,包括一些停顿和语气词,都让人很舒服。同时扣子空间生成的播客内容专业度上还比较OK,没有出现事实错误,并且紧密围绕苹果2025年WWDC的相关预告进行了解读,做到了切热点、有观点。
(2)文娱流量话题→吃瓜集锦播客,AI先搜索后创作
提示词:《浪姐6》中陈德容和房琪一开始都遭到网友吐槽,为什么前者能口碑翻盘后者却一蹶不振?结合网络搜索信息,生成一则播客。
https://oss.zhidx.com/53f22e3ee53091db07ac9bd33d52d3ad/68388480/uploads/2025/05/6836ad5484064_6836ad547d909_6836ad547d8c4_1-2%E6%B5%AA%E5%A7%90.mp3
播客音频
从输出内容来看,这则播客不仅网罗了《浪姐6》中陈德容和房琪口碑变化的全过程,还从受众心理和个人成长多个角度进行了深入分析,兼具热度和深度。不过,这是个娱乐话题,如果能有一些娱乐化的配乐音效就更好了。
从扣子空间的工作过程可以看到,它能快速完成“规划搜索+事件梳理+观点点评+多角色对话”制作,在帮媒体人抢新闻时效方面还比较有用。

生成过程
(3)日常健康议题→养生妙招播客,真人般关怀
提示词:天气开始变热,天天喉咙发干感觉是上火,喝什么花茶调理比较好,要不伤胃的。结合网络搜索信息,生成一则播客。
https://oss.zhidx.com/e1dec03bfdfb998b3789d48e1d909ad9/68388480/uploads/2025/05/6836ad5bd97ca_6836ad5bd3280_6836ad5bd3252_1-3%E5%81%A5%E5%BA%B7%E8%8A%B1%E8%8C%B6.mp3
播客音频
从生成的音频来看,这种“真人感”增加了我对这些养生知识的兴趣和信任度,这个任务对AI来说就很简单了。
2、学生职场向:笔记/文献/纪要转音频,考学升职有帮手
学生和职场人也能用扣子空间生成播客,帮助达成学习目标,或者完成职场任务。
(1)课程笔记→有声课,通勤时“听”知识点,备考不枯燥。
提示词:基于上传的中国新闻史课程的笔记,生成《申报》的发展历程播客,信息准确,讲解生动。

文档内容(部分截图)
可以听到,扣子空间内容处理上逻辑灵活。比如原文中“在史量才接办初期,该报纸发行量只有 7000 多份,到 1922 年创刊 50 周年时,已发展成为平均日销 5 万份的大报。主要采取了以下措施:开展广告业务,设广告推广科……”这一说明描述,被扣子空间灵活转化为“史量才采取措施→报纸发行量大涨”这样的正序口语描述。
https://oss.zhidx.com/868024be59cc8349fa1421ec110a2158/68388480/uploads/2025/05/6836ad61a77ee_6836ad61a33d6_6836ad61a33a3_2-1-a.mp3
播客音频
同时,适当的内容延伸必要且准确。比如对于原文中“《申报》总主笔陈景韩把新闻采访写作要求归纳为 3 条,一曰确,二曰速,三曰博”,扣子空间展开解释“就是准确、迅速和广博”,有利于学生对于重点内容的理解。
不过,扣子空间也存在一些人类常犯的小问题。比如“然后”和“也”这两个字眼使用较多。但我要求它减少这两个字眼,再生成一遍之后,效果得到明显改善。

优化调整过程
https://oss.zhidx.com/579350ccc62eed78e00dbc5fe7ffc9e2/68388480/uploads/2025/05/6836ad6918a58_6836ad6914d3c_6836ad6914d16_2-1-b.mp3
重新生成的音频
(2)外文文献→中文播客,快速了解学业及科研的最新咨询。
提示词:基于以上文档生成播客,翻译准确,不要做过多延伸。
文档内容是《Nature》杂志网站上刊登的一篇英文报道,主要讲述了香港高校向哈佛国际学生抛出橄榄枝的时事。

文档内容(部分截图)
播客内容探讨了特朗普政府政策对于美国的科研环境的冲击,以及中国的科研机构在吸引全球人才上面的机会和挑战,基本覆盖了外文文献的主要信息点,并且符合没有“过多延伸”的严谨风格。
https://oss.zhidx.com/f1a909924f583ed1c7d426fdf18e0432/68388480/uploads/2025/05/6836ad80f2c34_6836ad80eedb2_6836ad80eed76_2-2.mp3
生成音频
(3)会议纪要→述职音频,自动分段+重点强调,打工人通勤时回顾。
提示词:基于以上文档生成播客,内容要求:自动分段+添加重点提示音,增加鼓励的话语。
文档内容主要是xx运动公司一则关于“618大促”的会议纪要。

文档内容(部分截图)
从音频效果来看,扣子空间在抓重点能力上比较突出。女播主问出了一个很核心的问题,“现在社会新潮有很多,他们怎么把这些社会趋势转化为618促销策略?”男播主顺势进入主题:“他们是抓住了三个比较核心的趋势,分别制定了不同的策略。”而后,两位播主就围绕这三个方面进行深入解读。
https://oss.zhidx.com/cf0b693709383f045b0042f6e1a8064a/68388480/uploads/2025/05/6836b661082ee_6836b660e9fe2_6836b660e9fad_%E8%BF%90%E5%8A%A8%E5%A4%A7%E4%BF%83.mp3
生成音频
但播客并没有按提示词要求“增加鼓励的话语”。不过这影响不大,作为一位职场人,我更需要的是对会议信息重点的不遗漏,这点扣子空间做的还是很好的。
3、生活向:寻求情感育儿消费指导,搜索资料成定制化播客
文本转播客功能在日常生活中也有一些应用场景,比如提出情感问题以获取心理咨询对话,寻求好物推荐以获得导购指引,输入童话文本输出睡前有声书等。
(1)情感问题→心理咨询对话,就像有朋友帮你疏解压力。
提示词:Crush的女孩约会了近一个月,出去打球吃饭都挺好的,今天突然说不想交往了,问原因也说不出来,但之前明明说感觉不错,为什么我越主动她越回避?我还需要坚持吗?围绕上述话题生成一则播客。
对于感情问题,扣子空间真是手到擒来,不仅根据问题进行了场景化分析,并且随着讨论深入,还得出了“放手是比较明智的选择”结论。
https://oss.zhidx.com/0b7f65a7c062ecd7bbf96f661a708f14/68388480/uploads/2025/05/6836ad853415b_6836ad852f9e6_6836ad852f9b5_3-1.mp3
生成音频
(2)好物推荐→有声购物指南,一个贴身的AI导购。
提示词:不想再送玩具了,8岁男孩和5岁女孩更适合什么既有创意又实用的儿童节礼物?基于搜索内容,生成一则语音播客。
https://oss.zhidx.com/c3337c9bee14a473b8f80fadef8e90e1/68388480/uploads/2025/05/6836ad8c004e1_6836ad8bf047d_6836ad8bf044f_3-3.mp3
生成音频
扣子空间不仅生成了儿童节礼物推荐的语音播客,还把相关的礼物推荐文本内容保存为《儿童节礼物推荐播客文本.md》,等于听完播客我就可以照着礼物清单来进行挑选了。

礼物清单
二、网站+播客组合生成,扣子空间有百种玩法
文本生播客还有更高阶的玩法,那就是多功能组合。
比如智东西将生成网站和播客这两个能力组合使用,就能得到一个嵌入了博客节目的新闻专题网。
提示词:将
https://mp.weixin.qq.com/s/1_ZUr7zLacK9e4bkuD16Ww和
https://mp.weixin.qq.com/s/xJar7eCZx1uJ8yfhWJ6-PA这两个链接的内容分别生成两则播客,并嵌入到主题为“苹果2025WWDC系列报道”的网页里,这个网页需要你帮我生成,风格是深蓝色带有光点的科技风。


地址: https://space.coze.cn/web?uri=
7509379729976655891%2F%E8%8B%B9%E6%9E%9C2025WWDC%E6%8A%A5%E9%81%93-80a4218a52.html
自2025年4月启动内测、5月全面开放以来,扣子空间已经具备播客生成、Agent搜图、电商运营、网站制作、应用开发等多种能力,并集成了集成高德地图、飞书文档、图像生成等60+官方工具,可以说发展飞速。
扣子空间正成为人们提供AI免费打工人的平台。不少试用上扣子空间的人赞叹“Coze空间就像给AI装上了手脚”、“一个50000行的Excel喝杯咖啡就整理好了”。同时,各路网友也踊跃提出“优化插件代码”等改进意见。

用户对扣子空间的评价
结语:智能体时代,AI免费打工成趋势
不得不赞叹,扣子空间生成的播客和真人录制的语音效果几乎没有区别了,AI免费打工的图景正成为现实。
以播客制作为切口,我们看到Agent协作使得资料搜索、事实梳理、观点提炼、脚本撰写、录制剪辑、网站设计都在几分钟内由AI完成,并达到准确深入的水平,这确实是技术为我们带来非常直观的工作方式的变革。同时现阶段产品仍有可改进的方面,比如目前的文本转播客功能在音色选择、音效搭配、形式变换上都可以更加丰富。
Agent协同时代已经向每一个普通人打开了大门,而后可能是铺天盖地AI生成内容的来袭,如何让AI生成内容保持较高质量,满足人们对信息和文化内容的需求,这是平台、用户及政策制定方都需要关注的重要问题。