【悲報】ワイらのAIチャットボット、実は情報不足で嘘つきまくってたwww Google先生が衝撃の事実を暴露
1: 名無しのAIウォッチャーさん 2025-05-17(土) 10:00:00.00 ID:AbcDefGh 【悲報】ワイらのAIチャットボット、実は情報不足で嘘つきまくってたwww Google先生が衝撃の事実を暴露
ソースはこれな Deeper insights into retrieval augmented generation: The role of sufficient context
最近のRAG(検索拡張生成)ってやつ、便利だけどたまにトンデモ回答してくるよな? あれ、もしかして与えてる情報が足りてないだけかもしれんぞ…Google先生がそう言ってるわ。 お前らどう思う?🤔
2: 名無しのAIウォッチャーさん 2025-05-17(土) 10:01:30.50 ID:JklMnoPq またGoogle様がなんか言い出したんかw RAGって結局、検索結果の質次第だもんなぁ。ゴミ入れたらゴミ出てくるのは当たり前体操じゃね?
3: やる夫 ◆YaruoCrAZY 2025-05-17(土) 10:02:15.12 ID:YaruoDazo やる夫は最新AI技術で最強のQ&Aボット作りたいお!(`・ω・´) でもハルシネーションは困るお…「十分なコンテキスト」ってやつが鍵なのかお?
4: やらない夫 2025-05-17(土) 10:03:45.90 ID:YaranaiZo >>3 どうせ「十分なコンテキスト」とか言っても、それを判定するのが難しいんだろ。 結局AIが「わかったフリ」して嘘八百並べ立てる未来しか見えんがな。┐(´д`)┌
∧∧
( ゚∀゚) < やらない夫は期待しないぞ
(| O|)
~((_)
)~
し`J
5: できる夫 ◆DekiruEXPT 2025-05-17(土) 10:05:20.33 ID:DekiruMan >>4 説明しよう――Googleの研究では、その「十分なコンテキスト」を判定する「autorater」というLLMベースの評価器を開発したそうだ。 Gemini 1.5 Proを使ったら、93%以上の精度でコンテキストが十分かどうかを判定できたらしいぞ。
____ / /| / ※※※ / L L____L/ |(●) |(●)| < これで判定するわけだ | ▼ | | | ー | | ヽ__ノ_ノ
6: 名無しのAIウォッチャーさん 2025-05-17(土) 10:06:55.77 ID:OpqRstUv >>5 ファッ!?93%ってマジかよ! それならワンチャンあるんちゃう?嘘つきAI撲滅できるかもしれん。
7: 永遠の初心者さん 2025-05-17(土) 10:08:10.22 ID:Shoshinsha あの…RAGって何ですか…?(´・ω・`) コンテキストって、文脈のことですか…? ググっても専門用語が多くてよくわからなくて…
8: できる夫 ◆DekiruEXPT 2025-05-17(土) 10:10:30.88 ID:DekiruMan >>7 RAGとは「Retrieval Augmented Generation」の略で、検索して得た情報を元にAIが文章を生成する技術のことだ。 例えば、君が「今日の天気は?」とAIに聞くと、AIが天気予報サイトを検索して、その情報を元に「今日の天気は晴れです」と答えるようなイメージだな。 その「検索して得た情報」が「コンテキスト」だ。それが質問に答えるのに十分じゃないと、AIが間違った情報を言ってしまうことがあるんだ。
9: ひろゆき@考える人 2025-05-17(土) 10:12:45.01 ID:HiroyukiDesu >>5 それってGoogleのモデル(Gemini)が優秀だったって話ですよね? 他のオープンソースのモデルとかでも同じ精度出るんですか? あと、その「十分なコンテキスト」の基準って、結局人間が「これくらいあれば十分っしょw」って決めた「ゴールドスタンダード」にAIが合わせにいってるだけじゃないすか? それって本当に「客観的」に十分って言えるんですかねぇ?🤔
___ / \ /─ ─ \ / (●) (●) \ | (人) | < うーん、それってあなたの感想ですよね? \ `ー' / / \
10: 名無しのAIウォッチャーさん 2025-05-17(土) 10:15:00.25 ID:VwxyzAbc >>9 ひろゆきキタ━━━━(゚∀゚)━━━━!! 相変わらずの切れ味っすねw でも確かに、基準が人間ってのは気になるな。
11: 名無しのAIウォッチャーさん 2025-05-17(土) 10:17:33.80 ID:CdeFgHi
コメント (0)
まだコメントはありません。