【米国株】知識蒸留の基本的な仕組みとは!?サイバー攻撃はどこから…?

【米国株】知識蒸留の基本的な仕組みとは!?サイバー攻撃はどこから…?

【米国株】知識蒸留の基本的な仕組みとは!?サイバー攻撃はどこから…?

728: 山師さん 2025/01/29(水) 13:08:30.77 ID:RjmokD4t0

中国の人工知能(AI)スタートアップ企業ディープシークが世界を驚かせた最新のAIモデルは、米オープンAIのコンテンツを学習させる手法を用いて開発された。第2次トランプ政権でAIの政策責任者を務めるデービッド・サックス氏が指摘した。

サックス氏は28日、FOXニュースに出演し、ディープシークは「知識蒸留」と呼ばれる手法を採用していると説明した。新しいAIモデルが既存モデルに何百万もの質問を繰り返すことで、既存モデルの知識を学び、推論プロセスを模倣する開発手法だ。

シリコンバレーの著名ベンチャーキャピタリストとして知られるサックス氏は、「ディープシークがオープンAIのモデルから知識を蒸留したという確固たる証拠がある」と指摘。「オープンAIがこれを喜んでいるとは思えない」と話した。

5: 山師さん 2023/03/22(水) 21:00:42.55 ID:y6L3fjON0 (´・ω・`)お前らプレの時間だよ! 8: 山師さん 2023/03/22(水) 21:01:16.34 ID:s/lY2XNQa >>5 銀行に投棄してんの?   12: 山師さん 2023/03/22(水) 21:02:45.95 ID:y6L3fjON0 >>8 ( […]

NO IMAGE

202: 山師さん 2022/02/27(日) 19:45:11.61 ID:2p0w/guJ0 インデックスファンド引き上げる話すると、30年後は絶対に上がってるという人が出てくるけど 30年後に確信があるなら、その過程として10年後も5年後も見えてるはずなんだよな 一番近くでどこまでの将来が見据えられてるのか教えてほしいわ 221: 山師さん 2022/02/27(日) 19:49:06.36 […]

NO IMAGE

549: 山師さん 2022/09/20(火) 20:40:06.20 ID:71b9V4RPM なんでipqhone14出たのにsoxl爆上げしてくれないの、、、   553: 山師さん 2022/09/20(火) 20:41:03.16 ID:PbLsE2mt0 >>549 毎年恒例やし   575: 山師さん 2022/09/20(火) 20:46:50.97 […]

17: 山師さん 2022/12/17(土) 09:17:09.38 ID:M29et48qd 🇺🇸イーロン・マスク *ツイッター社の売却模索 *買収時と同値(1株$54.20)にて Musk Is Seeking New Twitter Investors at Same Price He Paid – BBG こいつ何がしたいん?ストーカー凍結したか […]

612: 山師さん 2023/05/27(土) 00:09:42.15 ID:b8HP8yJx0 データセンター向けGPUは将来、学習は NVDA、推論はAMDって棲み分けになる気がしてきた。 NVDA売ってAMD買おうかな 621: 山師さん 2023/05/27(土) 00:11:17.34 ID:pg9UbyEba >>612 わざわざ分ける意味ある? 同じ拠点で使うなら学習に使 […]




756: 山師さん 2025/01/29(水) 13:12:36.72 ID:e5pmyUbV0

>>728
「知識蒸留(Knowledge Distillation)」は、機械学習におけるモデル圧縮技術の一種であり、大規模なAIモデル(教師モデル)から小型のAIモデル(生徒モデル)へ知識を効率的に移転する手法のこと。

基本的な仕組み

1. 教師モデルの出力を利用

既存の大規模モデル(例:GPT-4)が大量のデータを学習済みであるとする。

このモデルに対して膨大な質問を投げかけ、その出力(回答)を収集する。

2. 生徒モデルの学習

小型のモデル(例:GPT-3相当)が、教師モデルの出力を模倣するように学習。

通常の教師あり学習では「正解ラベル(例:猫の画像 → ‘猫’)」を使うが、知識蒸留では「教師モデルの予測(例:‘猫:95%、犬:5%’)」を活用する。

3. 温度パラメータの調整

知識蒸留では、出力の確率分布を調整する「温度(Temperature)」パラメータが使われる。

高温(Soft Target)だと確率分布が滑らかになり、微妙な違いも学習可能。

4. 生徒モデルの性能向上

小型モデルが、教師モデルの高度な推論やパターン認識を学習し、元のデータセットを使わなくても高精度のAIが得られる。

利点

計算コストの削減:小型モデルなので、推論時のリソース消費が少ない。

高速な処理:モバイル端末や組み込みシステム向けに最適化できる。

知識の圧縮:大規模モデルの持つ情報をコンパクトにまとめられる。

問題点

知的財産権の問題:第三者のAIモデルから知識を「蒸留」する場合、それが許可されたものでなければ倫理的・法的に問題になる可能性がある。

品質の劣化:生徒モデルは教師モデルの単純化版であり、完全に同じ性能を発揮できるとは限らない。

今回のケースとの関係

「ディープシーク」が「オープンAIのモデルから知識を蒸留した」とされているが、これは「知識蒸留」の技術を使ってGPT-4などのモデルに大量の質問をし、その回答データを使って独自のモデルを学習させた可能性を示唆している。もしこれがオープンAIの利用規約違反や知的財産権の侵害に当たるなら、倫理・法的な問題になりうる。

 

770: 山師さん 2025/01/29(水) 13:15:52.95 ID:vK/e6MMD0
>>756
なるほどねぇ
まさに天才的発想だけど、教師モデルがないと成り立たないんだな

 

850: 山師さん 2025/01/29(水) 13:33:09.21 ID:RjmokD4t0
>>756
AAPL「これや

 

874: 山師さん 2025/01/29(水) 13:40:43.10 ID:FY+jac/h0
>>756
OpenAIはo3のオリジナルは公開しないで自社で蒸留済みのo3だけ公開すればいいんじゃね?

 

882: 山師さん 2025/01/29(水) 13:43:27.94 ID:RjmokD4t0
>>874
ちゃんと読めば蒸留が防ぎにくいのがわかる



730: 山師さん 2025/01/29(水) 13:09:02.22 ID:xQ7Fo/b60

DeepSeekサイバー攻撃、中国メディア「全て米国から」
https://i.imgur.com/zHEXcAP.jpeg

wwwwww

 

734: 山師さん 2025/01/29(水) 13:09:29.72 ID:ZEPRmfcJ0
>>730
それはまあそうだろうなって

 

737: 山師さん 2025/01/29(水) 13:09:41.34 ID:on0in3zr0
>>730
これもう完全に戦争だろ

 

744: 山師さん 2025/01/29(水) 13:10:39.50 ID:B7pwYO/O0
>>730
仲良くしてほしい🤭

 

745: 山師さん 2025/01/29(水) 13:10:42.55 ID:09/ceZTd0
>>730
よほど都合が悪いようだなm9

 

764: 山師さん 2025/01/29(水) 13:14:16.01 ID:Y36i0QNc0
>>730
米国のIPアドレスに偽装した中国国内からの攻撃の線もあるよな
中国人だってNVDA株大好きだろ🙄

 

795: 山師さん 2025/01/29(水) 13:20:01.91 ID:oYpO4Q8h0
>>764
中国内も競争激しいからねえ

 

892: 山師さん 2025/01/29(水) 13:45:23.88 ID:SUGcrOqP0
>>730

 

748: 山師さん 2025/01/29(水) 13:11:19.56 ID:u7pOGcHu0
その他LLMがdeepseekを参考にしまくり始めたからな
もう世界が動いてしまってるからどうなるやら

 

802: 山師さん 2025/01/29(水) 13:21:51.20 ID:yRscfY/b0
deepseek側もこのまま黙ってるわけないだろうしまたNVDA下がると思ってる
その時に買うよ



引用元: https://ift.tt/MzwRmQc

続きを見る

米国株ETFまとめ速報カテゴリの最新記事