AI Studio 可以直接提取播客的 Transcript,可以使用 Google 的各种模型,更重要的是免费。

选择 Chat with models, 模型 Gemini 3 Flash Preview, temperature 0.2。

具体步骤如下:

  1. 上传播客的音频文件(一般后缀为 .mp3 或 .m4a)
  2. 使用下面的提示词
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
## 任务
* 根据提供的音频文件,提取主题为 xxx 的播客逐字稿 (transcript) 。
* 按照 {规则} 要求,参考 {Show notes} 编辑 {逐字稿}。
* 为 {逐字稿} 划分段落,并拟定段落标题。
* **注意: 保留全部信息,不可添加、删减或遗漏任何内容。**

## 输出
* 使用Markdown格式输出逐字稿,段落标题使用 `##`
* 在中英文单词之间添加空格。
* 输出语言和音频的语言保持一致。

## 规则
* **去除口语化词语**:删除所有不必要的语气词、口头禅和重复词句,例如“嗯”、“啊”、“那个”、“这个”、“对吧”、“然后” 等。
* **增加必要标点**:根据语境和语义进行断句,正确地添加和修改标点符号,确保文稿节奏清晰。
* **划分内容段落**:根据内容关联度和发言人转换,把内容分成独立的段落,清晰展示发言。
* **修正核心词汇**:根据逐字稿涉及的领域,参考 {Show notes},修改关键的词汇和术语(如人名、书名、概念),确保内容正确性和严谨性。
* **处理模糊内容**:如果原始意图极其模糊,请保留原句并在其后用 `[编辑标记:此处意思不明确]` 的格式进行标注。

## Show notes

## 约束
* **禁止删改原意**:严禁对文稿进行摘要、总结或改写,必须保留所有实质性信息。
* **禁止过度清洗**:仅删除“嗯、啊、那个”等无意义语气词;如果口语词涉及上下文逻辑(如“但是...”),必须保留。

## 指令
遵循 {任务} ,{输出} , {规则} , {指令} 的各项要求,启动任务。
  1. 点击 AI studio 的 run
  2. Enjoy !

一些补充信息:
Gemini web 对音频大小有 100 M 限制,AI Studio 上暂时未遇上音频大小过大问题。

至于如何下载播客的音频文件,不再这篇博客的讨论范围。 :)