最近把一个很小但经常出现的需求单独做成了一个页面:AI YouTube Transcript。
这个页面不是想做一个很大的视频 AI 工具集合,而是先把一条很具体的路径讲清楚:当我只需要从 YouTube 视频里找到一句话、确认时间点,并把 transcript 带到下一步时,能不能少一点来回切换。
目前这页主要想把下面这条路径做顺:
- 粘贴 YouTube 链接或视频 ID。
- 选择可用语言。
- 打开 transcript 文本。
- 搜索需要确认的句子或关键词。
- 通过时间戳回到视频里的对应位置。
- 复制文本,或按后续用途导出 TXT、SRT、VTT。
我自己遇到这个需求时,通常不是为了重新看完整个视频,而是想快速找到某个片段、确认上下文,再把文本放进笔记、字幕、剪辑或资料整理流程里。所以 TXT、SRT、VTT 在这里不是 「多几个导出按钮」,而是对应不同的后续用法。
现在这版我刻意做得比较克制,只保留最核心的能力。因为一旦想 「顺手多做一点」,页面就很容易从一个好理解的小工具,变成一个什么都想管、但什么都不够清楚的入口。
边界也写得很明确:只有源视频暴露了可用的 subtitle 或 caption track,页面才可能加载 transcript;如果没有可用 track,就没有内容可搜索或导出,文本质量也取决于原始字幕轨道。
页面在这里:
https://aiyoutubetranscript.com/
想听听大家建议:
- 这种小工具页面,第一屏应该先强调 「搜索和导出 transcript」,还是先解释来源和限制?
- 如果你要把视频内容转成笔记、字幕或素材,TXT/SRT/VTT 这几个出口够不够用?








