数日前にリリースされたGTP-Realtime-2を触ってみたのですが、思ったよりも精度が高くて驚いてます。
(なお、私はリアルタイム翻訳系のAPIを触るのは初めてです)
PoCとして、面接対策アプリ(Teamsなどの音声出力から拾える面接官の質問内容をもとに、話すべきスクリプトを自動表示する)を作ってみました。
私が事前に入力したプロフィールをもとにしたスクリプトをちゃんと表示してくれる。
(ただしプロフに書いている情報で答えられない質問については当たり前のようにエピソードを捏造する)
レスポンスも早く、多分非英語話者が頑張って考えて喋りだすよりも待ち時間は短いと思います。
コストも、数十分間遊んで1ドルかからずで、実用範囲。
技術の進歩は素晴らしいなーと思いつつ、これだけ高性能ならもう、面接対策としての英会話の能力っていらないのでは?って思ってしまいました。
日記帳でした。