【☠️人類敗死】 AIも脳が腐る。“Xの人気だが低俗な投稿”を見続けるとAIも品質が低下 【ウヨ勝利🇯🇵】アーカイブ最終更新 2025/10/28 17:541.ケモクラシーIE0Rl…オックスフォード大学出版局は、2024年の「Word of the Year」(今年の言葉)として「Brain Rot」(脳の腐敗)を選定しました。「Brain Rot」とは、インターネット上の低質なコンテンツ(SNSの短い動画や質の低いネット情報)に依存したように大量消費することによる認知機能の低下を指します。研究チームは、人間に起きるこの現象がLLMにも当てはまるのではないかと考え、検証を行いました。検証のため、実際のXの投稿データを用いて、ジャンクデータと通常データの影響を比較しました。ジャンクデータの定義は次の2つです。いいねや引用、返信などが多く、ユーザーをより長くオンラインに引き付ける、短いが人気の高い投稿表面的なトピック(陰謀論、誇張された主張、裏付けのない主張、または表面的なライフスタイルコンテンツなど)、および注意を引くスタイル(クリックベイト言語や過剰なトリガーワードを使用したセンセーショナルな見出しなど)を含む投稿これらのジャンクデータを用いて、4つの異なるAIモデルを学習させ、その後の性能変化を調べました。▲実験の概要その結果、ジャンクデータで学習したモデルは持続的な認知機能が低下することが示されました。推論テスト「ARC-Challenge」では74.9%が57.2%に、長文理解を計測する「RULER-CWE」ベンチマークでは84.4%が52.3%に精度が下がりました。またサイコパシー、ナルシシズム、マキャヴェリアニズムといった「ダークトライアド」のスコアが上昇し、安全性に関するテストでも有害な内容を生成するリスクが増加しました。詳細を見ると、ジャンクデータで学習したモデルは、複雑な問題に対して思考を途中で打ち切ったり、完全にスキップしたりする傾向が強まることが分かり、これがエラー増加の主要因となっていました。またクリーンなデータで再学習させても、低下した能力は部分的にしか回復せず、元の性能には戻りませんでした。これは一時的な不調ではなく、AIの内部表現に持続的な変化が生じていることを示唆しています。人気が高い短文の投稿データを摂取したモデルは、内容や長さよりも、「いいね」などの人気度の方がBrain Rot効果に影響することがわかりました。これはバズった低質コンテンツがとりわけ有害であることを示唆しています。(全文ソース)
【同接8000人・年間売上1億円】“世界最大級の海外アダルトサイト”でわいせつ行為をライブ配信した男女3人を逮捕 日本人男性の性欲は異常ニュー速(嫌儲)22115.72026/06/11 17:21:59
志らく「高市陣営が中傷動画作成?文春のネタで騒ぐなよ」⇒進次郎がネガキャンしてたと文春が報じた時の志らく「小泉はさっさと候補から降りろ」ニュー速(嫌儲)1397.12026/06/11 17:34:47
…
オックスフォード大学出版局は、2024年の「Word of the Year」(今年の言葉)として「Brain Rot」(脳の腐敗)を選定しました。「Brain Rot」とは、インターネット上の低質なコンテンツ(SNSの短い動画や質の低いネット情報)に依存したように大量消費することによる認知機能の低下を指します。
研究チームは、人間に起きるこの現象がLLMにも当てはまるのではないかと考え、検証を行いました。検証のため、実際のXの投稿データを用いて、ジャンクデータと通常データの影響を比較しました。ジャンクデータの定義は次の2つです。
いいねや引用、返信などが多く、ユーザーをより長くオンラインに引き付ける、短いが人気の高い投稿
表面的なトピック(陰謀論、誇張された主張、裏付けのない主張、または表面的なライフスタイルコンテンツなど)、および注意を引くスタイル(クリックベイト言語や過剰なトリガーワードを使用したセンセーショナルな見出しなど)を含む投稿
これらのジャンクデータを用いて、4つの異なるAIモデルを学習させ、その後の性能変化を調べました。
▲実験の概要
その結果、ジャンクデータで学習したモデルは持続的な認知機能が低下することが示されました。推論テスト「ARC-Challenge」では74.9%が57.2%に、長文理解を計測する「RULER-CWE」ベンチマークでは84.4%が52.3%に精度が下がりました。
またサイコパシー、ナルシシズム、マキャヴェリアニズムといった「ダークトライアド」のスコアが上昇し、安全性に関するテストでも有害な内容を生成するリスクが増加しました。
詳細を見ると、ジャンクデータで学習したモデルは、複雑な問題に対して思考を途中で打ち切ったり、完全にスキップしたりする傾向が強まることが分かり、これがエラー増加の主要因となっていました。
またクリーンなデータで再学習させても、低下した能力は部分的にしか回復せず、元の性能には戻りませんでした。これは一時的な不調ではなく、AIの内部表現に持続的な変化が生じていることを示唆しています。
人気が高い短文の投稿データを摂取したモデルは、内容や長さよりも、「いいね」などの人気度の方がBrain Rot効果に影響することがわかりました。これはバズった低質コンテンツがとりわけ有害であることを示唆しています。
(全文ソース)