今日CAがリリースしてましたが…
https://www.cyberagent.co.jp/news/detail/id=28817
いざ商用プロダクトへの適用を考えようとすると、考慮するポイントや、現状での限界がいろいろ目についてしまい、お金もらうプロダクトへの適用に二の足を踏んでしまったりするのですが、最近の皆さんの仕事ではいかがですか?
私はこの領域全然詳しくないので素人の感想ですが、日本語という言葉が複雑すぎて結局はガラパゴス化が進んで行くのね...という印象を受けています。日本の市場だけでも十分大きな会社を作れるので良いですがやはりどこか世界と切り離されてる感がありますよねー
(私がChatGPTなどに求めているのは情報の収集やまとめ、コーディング周りの効率化なので英語で特に困っていないので特にご縁は無さそう)
一番使うLLMsプロダクトはGitHub Copilotですが、日本語対応LLMsプロダクトには期待してますよ!適用分野はいくらでもあると思うし、LLMsプロダクトがすべてアメリカの企業に握られているのは不健全だと思うので。
ただ、まずはChatGPT/GPT-4並の品質のプロダクトを持ってきてほしいです。話はそこからだ。
逆に、GPT-4級なものを作れたならこの先数年は利用されると思ってます。4より数段劣る3.5でさえ普通に便利なレベルですから。
日本語のSpeech to Textやデータ探索系サービスをお客様システムに導入するプロジェクトをやってきましたが、口語における日本語の方言への扱いが難しかったです。
他言語の方言がどれくらいあるのか、違うのかわかりませんが、お客様の東北支店での導入時、KPI達成にかなり苦労しました…
OCRのプロダクト導入を検討していた時、日本語の対応してなさで諦めたことが多々ありました。
今回の流れに日本が上手く乗るためには日本語の活用進んで欲しいですねー
英語話者に比べて日本語話者が少ない分、日本語に絞ったLLMの品質向上にかかるコストはかかってしまいますよね。
なんとかものになってほしいと願っています。
社内のデータを問い合わせできるチャット、みたいなユースケースはありそうですがどうでしょうね