NotebookLMなどの音声解説を想定した自分のみのPodcastを管理するツールを作った

背景

NotebookLMは便利だが、音声解説のUIが使いにくい

  • NotebookLMの音声解説、便利ですよね
  • 長いテキストをベースにしていても、7分前後でコンパクトに耳から情報を接種できるのが好きです
    • ジムで身体を動かしている最中とか散歩のときとか細切れでも気兼ねなく聞けるのでよい
  • 自分の聞きたい切り口毎にPodcastを作れるのもよいです
    • 例: ブックマークしたけど見れてない情報をニュース的に聞く
    • 例: epub / pdfで配布されているテキストを章毎あるいはトピック毎にPodcastを作ってもらう
  • しかし、NotebookLMの音声解説のUIが使いにくい!
    • 聞こうと思ったらダウンロードが始まるから数十秒待たされる
    • 複数エピソードの連続再生ができない
    • 使い慣れたPodcastクライアントから聞きたい

自分用の音声ファイルをどこにホストするのか問題

  • Overcastは有料機能でブラウザから音声ファイルをアップロードすることができる
  • 「これは便利だ!」と思ったが、いわゆるshownote的なところが空っぽなので、どういう内容なのか、どのURLやファイルや章をベースにしたのかなどが分からない
    • Table of Contentsや簡単なサマリーがテキストで見たい
    • OvercastのFile Uploadsにshownoteの情報を保持する機能は残念ながら存在しない

不特定多数が聞けるPodcastとして公開したいわけでもない

  • じゃあ、ちゃんとしたPodcastとして公開したいかというとそうでもない
    • 内容は自分の役に立つ範囲で適当で別によい
  • ちゃんとはし過ぎたくないが、使い慣れたPodcastクライアントからはいい感じに聞けるようにしたい

解決方法

アイディア: Google Driveに音声ファイルを公開する

  • Google DriveでPodcast用の音声ファイルをホストする
  • ファイルやフォルダはリンクを知っている人のみが閲覧できる形式にしておく
    • こうしておけば検索エンジンからも辿れないし、ファイルのIDは基本的に予測不可能
    • もし何かしらの経路で見れた / 聞けたとしても、それはAIによって要約された情報なので、それ自体は問題ない(はず)

PodcastのRSSフィードをどうやって作るか問題

  • 音声ファイルの置き場所はGoogle Driveでいいとして、RSSフィードやshownoteの情報をどうやって保持するかが次の問題
    • ちゃんと管理はしたくないので、DBやyamlで管理などはやりたくない
    • 音声ファイルの集合があれば、もうそこからスタートできる状態にしたい
  • Macはコメントをメタデータとして保持できる
    • Finderからだと数百文字しか入力できないが、コマンドラインからだと数万文字くらいなら余裕
    • shownoteの用途としては十分
  • いい感じにRSSファイルの生成などを管理してくれるコマンドラインツールを作った
    • Podcast for Myselfということでpodselfというツール名にしています

音声とテキストの両方から効率よく情報を仕入れることができます。こういうのが欲しかった。

自分で使ってみた感想

  • 自分が欲しいと思っていたものなので、普通に便利!
    • 連続再生や音声ファイルの事前ダウンロードなどはいつものPodcastクライアントが面倒を見てくれる
      • Overcastだと、Apple Watch単独でPodcastを聞けるので、気軽に積読になっていたものを消化できるようになった
    • shownote機能が便利!
      • 音声で聞いていると「ええっと、さっき言ってたあの単語は...?」となるが、shownoteにはテキスト情報でまとまっている
      • shownote自体をLLM Agentに作らせて、自分用にカスタマイズできる
        • 例: 大本が英語だったとしても、shownoteは日本語にできる
        • 例: 重要な単語は定義を必ず書かせることができる
        • 例: テキストになっているので、日報などにコピペも簡単
    • 大本の情報のURLやファイル名が書いてあるので、深掘りしたい場合にもさっとできる