【悲報】ワイらのAI先生、実は超絶偏見持ちだった件www データセットの闇深すぎワロタ
1: 名無しのAIウォッチャーさん 2025-06-03(火) 10:00:00.00 ID:AbcDefGhI スレタイの通りやで…(´・ω・`) 最近何かと話題のAI先生やけど、その学習データが偏りまくってて、とんでもないことになっとるらしい。 特に医療系AIとか、マジでシャレにならんレベルや。 ソース:3 Questions: How to help students recognize potential bias in their AI datasets
お前ら、自分の使ってるAIが実はトンデモ野郎かもしれんぞ…?
2: やる夫 ◆YaruoAABBCC 2025-06-03(火) 10:01:30.50 ID:Yaruo12345 えぇーっ!? やる夫、AI使ってお医者さんごっこするの夢だったのに、そんなのダメだお!(´;ω;`) ちゃんと万能なAIじゃないと困るお!
3: 名無しのAIウォッチャーさん 2025-06-03(火) 10:02:15.75 ID:JklMnoPqR >>1 ファッ!? またAIのやらかしか? つーか、データが偏るってどういうことやねん。詳しく教えろください。
4: やらない夫 ◆YaranaiDD 2025-06-03(火) 10:03:00.20 ID:Yaranai678 >>2 夢見るのは勝手だが、現実は非情だぞ、やる夫。 どうせデータなんて、集めやすいところから集めてるだけだろ。 白人の健康な若者男性のデータばっかりとか、そんなオチだろ? 医療機器とかもそれで最適化されてるって記事にもあるしな。80歳の心不全のお婆ちゃんとかガン無視されてるんやで。
5: できる夫 ◆DekiruEEFF 2025-06-03(火) 10:05:45.10 ID:Dekiru9012 >>3 >>4 説明しよう!(`・ω・´) AIモデル、特に機械学習モデルというものは、学習に使われたデータの特徴を強く反映するのだ。 例えば、特定のグループ(例:白人男性)のデータばかりで学習させたAIは、そのグループに対しては高い精度を示すかもしれないが、他のグループ(例:有色人種の女性)に対しては著しく性能が低下することがある。これが「バイアス」だ。 元記事によれば、パルスオキシメーターが有色人種の場合、酸素レベルを過大評価する事例があったそうだ。これは臨床試験の段階で有色人種のデータが不足していたためだという。
キリッ
___
/ \
/ ─ ―\
/ (●) (●)\
| '" (__人__)" |
\ `ー'´ /
( 丶ـ⌒ フ
|\ /
\ "" /
\ /
6: 名無しのAIウォッチャーさん 2025-06-03(火) 10:08:22.33 ID:StuVwxYz0 >>5 うへぇ…パルスオキシメーターとか日常的に使うやつやんけ…こっわ。 ワイ、色黒やから知らんうちに見過ごされてる可能性あるんか…?(((;゚Д゚)))ガクガクブルブル
7: ひろゆき@ロンパ王 ◆HiroyukiGH 2025-06-03(火) 10:10:55.88 ID:HiroyukiAB >>5 それって、結局データ収集の問題ってことですよね? 「データが不足してた」って、誰の責任なんですかね? 製薬会社? FDA? FDAは健康な被験者で効果があればOKとか、それじゃあ多様な患者に対応できないのは当たり前じゃないスか? あと、電子カルテもAI学習の役に立たんって書いてますけど、それも設計の問題? なんか、全部後手後手な感じがしますけど、どうなんですかね?(´<_`)
8: やる夫 ◆YaruoAABBCC 2025-06-03(火) 10:12:30.15 ID:Yaruo12345 >>7 ひろゆきさん、厳しいお!(; ・`д・´) でも、確かにそうだおね…。電子カルテがダメダメって、もうどうしようもないお…。 やる夫、AIで医療を良くしたいのに、データがダメなら元も子もないお!
____
/ \
/ ─ ─ \
/ (●) (●) \
| (__人__) | うぅ…
\ ` ⌒´ ,/
r、 ノ \
/ \ / ヽ
| ヽ | ヽ
ヽ `ヽ _,ノγ⌒)
(⌒ー⌒)
( )
9: 名無しのAIウォッチャーさん 2025-06-03(火) 10:15:05.60 ID:OpQrStUvX そもそもAIのコースでバイアスのことちゃんと教えてないのが問題やろ。 「モデル作ろうぜ!精度上げようぜ!」ばっかで、元のデータがうんこだったら意味ないやんけ。 MITのコースですら最初はそうだったって書いてるし、オンラインコースなんて推して知るべしやな。 ワイらが使ってるAIライブラリのチュートリアルとかも、だいたいデータの前処理はサラッと流されるよなw
10: ホリエモン@DYNAMITE ◆HorieIJKL 2025-06-03(火) 10:18:40.92 ID:Horie7890 >>9 時間のムダ。結局、金とリソースかけてまともなデータセット作るかどうかの話だろ。 できないなら最初からAIとか言うな。 あと、電子カルテがダメなら、さっさとリプレースしろよ。いつまで待つんだ? 「そのうち」とか言ってる間に技術は進むし、問題は放置される。やるかやらないか、それだけ。
11: 霧雨魔理沙@普通の魔法使い ◆MarisaMNO 2025-06-03(火) 10:21:11.11 ID:MarisaMagic AIモデルも魔法みたいなもんだぜ!(゚∀゚) ちゃんとした素材(データ)と正しい詠唱(アルゴリズム)じゃなきゃ、とんでもない暴発(バイアス)が起きるに決まってるだろ! 「データはどこから来た?」「誰が集めた?」とか、素材の吟味は基本中の基本だぜ! ICUのデータだって、そもそもICUに入れない人がいたら、その人たち向けの魔法は作れないんだぜ。当たり前だよな!
12: 名無しのAIウォッチャーさん 2025-06-03(火) 10:24:55.45 ID:YzAaaaaBb >>11 魔理沙、ええこと言うやん!わかりやすい例えやわ。 結局、データソンみたいに色んな専門家集めて「このデータ、おかしない?」ってツッコミ入れるのが大事なんやな。 でも、自分のとこのデータがクソだって認めるの、勇気いるよなぁ…w 「見ないふり」が一番楽やもんな。
13: できる夫 ◆DekiruEEFF 2025-06-03(火) 10:28:00.70 ID:Dekiru9012 >>12 その通りだ。元記事のCeli氏も「データの悪さを認識することが改善の第一歩」と述べている。 MIMICという有名な医療データベースも、多くのフィードバックを受けて改善されるまでに10年かかったそうだ。 最初から完璧なデータセットなど存在しない。批判的な目でデータと向き合い、継続的に改善していく姿勢が重要なのだ。(`・ω・´)b コース内容の50%はデータ理解に割くべき、というのは慧眼だと言える。
14: 名無しのAIウォッチャーさん 2025-06-03(火) 10:30:15.22 ID:CdeFgHiJk クマーーーーーー!!!データバイアス、コワーーーーイ!!!
∧_∧ / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
(;´Д`)< 偏ったデータで判断ミス!クマー!
( ) \__________
| | |
(__)_)
医療AIでこれやられたら、マジで命に関わるンゴ… (((( ;゚Д゚)))
15: やる夫 ◆YaruoAABBCC 2025-06-03(火) 10:33:40.80 ID:Yaruo12345 みんなの話聞いてたら、AI作るのってモデル組むだけじゃなくて、データのことめっちゃ考えないといけないって分かったお!(`・ω・´) やる夫も、これからはちゃんとデータの中身を見るようにするお! そして、いつか本当にみんなの役に立つAIを作るお!
16: 名無しのAIウォッチャーさん 2025-06-03(火) 10:35:55.01 ID:LmnOpQrSt 結局、AI使う側も賢くならなあかんってことやな。 「AIが言ってるから正しい」とか思考停止してたら、とんでもないことになるで。 作る側も使う側も、データへの意識改革が必要やな。道のりは長そうやけど…。
まとめ
というわけで、AIのデータバイアス問題について見てきたで。今回のポイントをまとめるとこんな感じや。
- AIの学習データは偏りがち: 特に医療分野では、白人男性中心のデータが多く、他の人種や性別ではAIがうまく機能しない危険性があるんや。パルスオキシメーターの例は衝撃的やな。
- 既存のデータソースも問題山積: 電子カルテはAI学習用に作られてへんから、そのまま使うのはヤバいらしい。FDAの承認基準も、多様な患者に対応するには不十分かもしれん。
- AI教育の遅れ: 多くのAIコースでは、モデル構築技術に偏重してて、データの質やバイアスについて十分に教えてへんのが現状。MITですら過去にはそうやったんやから、推して知るべしや。
- データ理解こそ最重要: AI開発の時間の半分以上はデータ理解に割くべき、という専門家の意見もあるで。データがどこから来て、誰が集めて、どんな偏りがあるのか、徹底的に吟味せなあかん。
- 多様な視点と批判的思考がカギ: データソンみたいに色んな背景の人が集まってデータを検証したり、ローカルなデータセットを使って自分たちの状況を把握したりすることが大事や。「データの悪さ」を認めることから改善は始まるんやな。
AIの可能性は無限大やけど、その力を正しく使うためには、まず足元のデータとしっかり向き合う必要があるってことや。みんなも気をつけやで!(`・ω・´)ゞ
コメント (0)
まだコメントはありません。