10000人以上のプロフェッショナルが集まるコミュニティに参加してディスカッションに参加しませんか?
無料サインアップでコンテンツにアクセスが可能になります。

コメント

コメント一覧

そんな革命がある日突然起きるのか?とは思ってはいましたけど早速か・・・?

まだあくまでも疑惑なので確定づける情報がくるか続報が気になりますね。

パクってでも何でもやる中国の技術力が欲しい

中国は知財のコンプラが緩いので、自由にAIを開発できますね

そうですね。資金力もありますし。

とはいえ、日本は韓国とかよりも競争力低いですし、、

他の国はすごいなあと思ってます

調査したところでDeepSeek側が金払うとも思えないな

米国に法人とかないでしょ

既存の上位モデルの出力を学習データセットを作るために使う蒸留と呼ばれる手法を、OpenAが利用規約上禁止しているGPT-4oなどをソースとして利用したのではないかという疑いのようです。


たとえその疑いが事実であったとしても、これまでOpenAIやAnthropicなどが出来なかったコンパクトな計算資源で高品質なLLMの学習を成立させたのは事実で、その観点でこれまで出来なかったことを実現させています。出来るならOpenAIが自分でやって圧倒的な価格競争力を実現して競合を引き離していればよいわけですし。


蒸留の禁止については例えば著作権などを根拠とした判例があるわけではなさそうで、利用規約でそのように主張しているに過ぎません。プロプライエタリなソフトウェアのリバースエンジニアリングだって、ほとんどの規約で禁止されているのにあちこちで内緒でやっていたりするので、(仮に実際にやっていたとしても)DeepSeekがことさらに倫理にもとるようには思いません。もちろん、そのような行為を応援するわけではありませんが。。。


興味深いのは実際上どうやって防ぐかで、API経由の推論である以上、当然に普通のユーザーが機械的かつ大量にクエリーを投げることになります。蒸留用のデータセットを作ることを目的とした使用を検出するってどうやってやるんだろう。。。

少し語弊があるかなと思います。


> コンパクトな計算資源で高品質なLLMの学習を成立させた


これですが、本来は学習データを用意するために、膨大なGPUを使います。学習データのフィルタリングやらなんやら...


そのデータをまんまGPTのをパクってきているので、そのぶんGPUを使わないのは当たり前の話なんですよね。


またモデルの試行(チューニング)にもかなりのGPUを食うわけですが、これもGPTで既に洗礼されているものをパクってるので、そりゃGPUを使わないわけです。


なので、揚げ足っぽかったらすいませんが...


実現した、というのは少し違和感があり、当然の結果だと思っています。

(編集済み)

異なる視点の指摘をありがとうございます。学習データセットの整備は人的にも資源的にも軽いタスクではない点について、おっしゃっていることはよく分かります。


DeepSeekの原論文は読んでいないのですが、解説記事を見る限りでは、計算量の削減に新規性のあるアイデアを採用しているように見えます。たとえば、R1の元になったR1-Zeroの強化学習でルールベースで計算可能な報酬評価を採用したり、それを可能にするために正しい出力が一意に決まるコーパス(数学の解法ではないかと推測されているとのこと)を用意したり、といった部分です。


今後のLLMの研究に、上記のようなアイデアが下敷きとして採用されていくかどうかで、「単に既存LLMの出力を利用して楽しただけ」なのか、「低コストなLLMの開発手法に真に有用な貢献をしたのか」が分かるかもしれませんね。私は後者だといいなと思っています。

(編集済み)

仮に疑惑が事実だったとしてもデタラメだったとしても、使う人は使うし使わない人は使わない、な気がします。。

私も専門外ですが「他の中国IT企業を含めた中華圏とそれ以外」みたいな構図の強化をするだけ、となりそうと思ってる気がします、。、

驚かないですねー😂

まぁOpenAI もインターネット上のデータを同意無しにスクレイピングしたかもしれない咎で著作権に関する多数の訴訟を抱えていますけどね。


勝手にデータを取得して LLM を作ったかもしれない会社 vs その LLM から勝手にデータを取得して LLM を作ったかもしれない会社

(編集済み)

これの通りじゃないですか?

中国の企業がってところに注目して知らずにバイアスかかってる人多い気がします…

投稿者

DeepSeek research チーム

1. 平均年齢: 35 歳以下。

2. 米国または海外の大学で教育を受けた後の帰国者数: ゼロ。


とのことだが、それよりも女性メンバー3人が同じ顔してるのが気になってしょうがない 🤣

https://x.com/jenzhuscott/status/1884606633344651358

蒸留ってDeepSeekに限らず米国でもいろんなスタートアップが試みている技術手法ですが、OpenAIのデータを使ったと言ってもちゃんとOpenAIにお金払ってますし。

今まで何ら問題もなかったのに、Deepseekが近い性能のものをリリースしてから急に「蒸留は不正利用だ」と文句つけてきたことにはさすがに米国テック業界の焦りを感じました。

(編集済み)

Wizが調査した結果チャット履歴含む100万件超のログが閲覧できた可能性が出てきましたね


https://www.itmedia.co.jp/news/articles/2501/30/news173.html

openAIだってやってるくせにと思ってしまいました笑

コミュニティ
企業一覧
求人
給料