AIトレンドまとめ

AIトレンド情報を2ちゃんまとめサイト風にお届け(´・ω・`)

【悲報】ワイらのAIチャットボット、実は情報不足で嘘つきまくってたwww Google先生が衝撃の事実を暴露

公開日: 2025-05-17|タグ: AI, RAG, ハルシネーション, Google

1: 名無しのAIウォッチャーさん 2025-05-17(土) 10:00:00.00 ID:AbcDefGh 【悲報】ワイらのAIチャットボット、実は情報不足で嘘つきまくってたwww Google先生が衝撃の事実を暴露

ソースはこれな Deeper insights into retrieval augmented generation: The role of sufficient context

最近のRAG(検索拡張生成)ってやつ、便利だけどたまにトンデモ回答してくるよな? あれ、もしかして与えてる情報が足りてないだけかもしれんぞ…Google先生がそう言ってるわ。 お前らどう思う?🤔

2: 名無しのAIウォッチャーさん 2025-05-17(土) 10:01:30.50 ID:JklMnoPq またGoogle様がなんか言い出したんかw RAGって結局、検索結果の質次第だもんなぁ。ゴミ入れたらゴミ出てくるのは当たり前体操じゃね?

3: やる夫 ◆YaruoCrAZY 2025-05-17(土) 10:02:15.12 ID:YaruoDazo やる夫は最新AI技術で最強のQ&Aボット作りたいお!(`・ω・´) でもハルシネーションは困るお…「十分なコンテキスト」ってやつが鍵なのかお?

4: やらない夫 2025-05-17(土) 10:03:45.90 ID:YaranaiZo >>3 どうせ「十分なコンテキスト」とか言っても、それを判定するのが難しいんだろ。 結局AIが「わかったフリ」して嘘八百並べ立てる未来しか見えんがな。┐(´д`)┌

     ∧∧      ( ゚∀゚)  < やらない夫は期待しないぞ      (| O|)    ~((_))~      し`J

5: できる夫 ◆DekiruEXPT 2025-05-17(土) 10:05:20.33 ID:DekiruMan >>4 説明しよう――Googleの研究では、その「十分なコンテキスト」を判定する「autorater」というLLMベースの評価器を開発したそうだ。 Gemini 1.5 Proを使ったら、93%以上の精度でコンテキストが十分かどうかを判定できたらしいぞ。

   ____   /     /|   / ※※※ /  L  L____L/  |(●) |(●)| < これで判定するわけだ  |  ▼ |  |  |  ー |  |  ヽ__ノ_ノ

6: 名無しのAIウォッチャーさん 2025-05-17(土) 10:06:55.77 ID:OpqRstUv >>5 ファッ!?93%ってマジかよ! それならワンチャンあるんちゃう?嘘つきAI撲滅できるかもしれん。

7: 永遠の初心者さん 2025-05-17(土) 10:08:10.22 ID:Shoshinsha あの…RAGって何ですか…?(´・ω・`) コンテキストって、文脈のことですか…? ググっても専門用語が多くてよくわからなくて…

8: できる夫 ◆DekiruEXPT 2025-05-17(土) 10:10:30.88 ID:DekiruMan >>7 RAGとは「Retrieval Augmented Generation」の略で、検索して得た情報を元にAIが文章を生成する技術のことだ。 例えば、君が「今日の天気は?」とAIに聞くと、AIが天気予報サイトを検索して、その情報を元に「今日の天気は晴れです」と答えるようなイメージだな。 その「検索して得た情報」が「コンテキスト」だ。それが質問に答えるのに十分じゃないと、AIが間違った情報を言ってしまうことがあるんだ。

9: ひろゆき@考える人 2025-05-17(土) 10:12:45.01 ID:HiroyukiDesu >>5 それってGoogleのモデル(Gemini)が優秀だったって話ですよね? 他のオープンソースのモデルとかでも同じ精度出るんですか? あと、その「十分なコンテキスト」の基準って、結局人間が「これくらいあれば十分っしょw」って決めた「ゴールドスタンダード」にAIが合わせにいってるだけじゃないすか? それって本当に「客観的」に十分って言えるんですかねぇ?🤔

             ___            /     \           /─    ─  \         / (●) (●)  \         |    ()    | < うーん、それってあなたの感想ですよね?         \    `ー'     /         /          \

10: 名無しのAIウォッチャーさん 2025-05-17(土) 10:15:00.25 ID:VwxyzAbc >>9 ひろゆきキタ━━━━(゚∀゚)━━━━!! 相変わらずの切れ味っすねw でも確かに、基準が人間ってのは気になるな。

11: 名無しのAIウォッチャーさん 2025-05-17(土) 10:17:33.80 ID:CdeFgHi

コメント (0)

まだコメントはありません。

コメントを投稿する