AI Studio 可以直接提取播客的 Transcript,可以使用 Google 的各种模型,更重要的是免费。
选择 Chat with models, 模型 Gemini 3 Flash Preview, temperature 0.2。
具体步骤如下:
- 上传播客的音频文件(一般后缀为 .mp3 或 .m4a)
- 使用下面的提示词
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
| ## 任务 * 根据提供的音频文件,提取主题为 xxx 的播客逐字稿 (transcript) 。 * 按照 {规则} 要求,参考 {Show notes} 编辑 {逐字稿}。 * 为 {逐字稿} 划分段落,并拟定段落标题。 * **注意: 保留全部信息,不可添加、删减或遗漏任何内容。**
## 输出 * 使用Markdown格式输出逐字稿,段落标题使用 `##`。 * 在中英文单词之间添加空格。 * 输出语言和音频的语言保持一致。
## 规则 * **去除口语化词语**:删除所有不必要的语气词、口头禅和重复词句,例如“嗯”、“啊”、“那个”、“这个”、“对吧”、“然后” 等。 * **增加必要标点**:根据语境和语义进行断句,正确地添加和修改标点符号,确保文稿节奏清晰。 * **划分内容段落**:根据内容关联度和发言人转换,把内容分成独立的段落,清晰展示发言。 * **修正核心词汇**:根据逐字稿涉及的领域,参考 {Show notes},修改关键的词汇和术语(如人名、书名、概念),确保内容正确性和严谨性。 * **处理模糊内容**:如果原始意图极其模糊,请保留原句并在其后用 `[编辑标记:此处意思不明确]` 的格式进行标注。
## Show notes
## 约束 * **禁止删改原意**:严禁对文稿进行摘要、总结或改写,必须保留所有实质性信息。 * **禁止过度清洗**:仅删除“嗯、啊、那个”等无意义语气词;如果口语词涉及上下文逻辑(如“但是...”),必须保留。
## 指令 遵循 {任务} ,{输出} , {规则} , {指令} 的各项要求,启动任务。
|
- 点击 AI studio 的 run
- Enjoy !
一些补充信息:
Gemini web 对音频大小有 100 M 限制,AI Studio 上暂时未遇上音频大小过大问题。
至于如何下载播客的音频文件,不再这篇博客的讨论范围。 :)