【超絶悲報】ワイらの曖昧指示、ついにAIに見抜かれる時代へ…Googleの新技術「ACT」がヤバすぎると話題にwww
1: 名無しのAIウォッチャーさん 2025-06-03(火) 10:00:00.00 ID:GoogleSamaaa Google先生がまたとんでもないもん開発したらしいぞ… その名も「ACT (Action-Based Contrastive Self-Training)」! なんでもAIがこっちの曖昧な指示を理解できんかったら、「え、それって具体的にどういうことなん?」って聞き返してくるようになるらしい… もうワイらの適当な指示は通用せんくなるんか…?(震え声)
ソース:Learning to clarify: Multi-turn conversations with Action-Based Contrastive Self-Training
2: 名無しのAIウォッチャーさん 2025-06-03(火) 10:01:30.50 ID:Kikikaesuno ファッ!?AIが聞き返してくるだと? 「なんかいい感じにして」が通じなくなる世界線か…厳しいな(´・ω・`)
3: やる夫 ◆YaruoAlphaA 2025-06-03(火) 10:02:15.12 ID:YaruoDesuZO
____
/ \
/ _ノ ヽ、_ \
/ o゚⌒ ⌒゚o \ やる夫はAIたんと正確な会話がしたいお!
| (__人__) | これで意思疎通バッチリだお!
\ ` ⌒´ /
/ ""⌒ヽ /、""⌒ヽ
>>1 これマジなら神技術だお! いつもAIが頓珍漢なこと言うから困ってたんだお!(`・ω・´)
4: やらない夫 ◆YaranaiBetaB 2025-06-03(火) 10:03:40.22 ID:YaranaiZeEE どうせ「どの情報について知りたいですか?」みたいなテンプレ質問しかできなくて、結局こっちがイライラするパターンだろ。 期待しすぎは禁物だぞ。
5: 名無しのAIウォッチャーさん 2025-06-03(火) 10:05:00.05 ID:SQLTasukaru 記事読んだけど、AmbigSQLって新しいタスクも作って、SQLの曖昧なリクエストを解決するのにも使えるっぽいな。 「あのテーブルのあのカラムのあれ、いい感じに集計して」が通じるなら神やで!(゚∀゚)
6: 永遠の初心者さん ◆ShoshinGammaC 2025-06-03(火) 10:08:12.34 ID:WakannaiYO あの…DPOとかSFTとか、よくわからない単語がいっぱいです…(´;ω;`) このACTってのは、何がどうすごいんでしょうか…? データ効率が良いってどういうことですか…?
7: できる夫 ◆DekiruDeltaD 2025-06-03(火) 10:10:50.78 ID:DekimasuTOMO
____
/ /|
/____/ /
| ● ● |/
| (__人__) | 説明しよう!
\ `⌒ ´ /
>>6 まず、従来のLLMは大量のデータで事前学習(Pre-training)した後、特定の指示に従うようにファインチューニング(SFT)し、さらに人間の好みに合うように調整(Alignment Tuning)するんだ。DPOはその調整段階で使われるアルゴリズムの一つだね。
ACTのすごいところは、
- 曖昧さへの対応: AIが「この指示、曖昧だな…」と気づいたら、知ったかぶりせずに「ここ、もっと詳しく教えてもらえますか?」と明確化する質問を生成する能力が向上する点。
- データ効率: 少ない会話データ(論文では50会話とか)でも、この「明確化する能力」を含めて、対話全体のタスク達成度を大幅に改善できる点。少ないデータで賢くなるのは大きなメリットだ。
- 学習方法: 「良い行動(例:明確化質問)」と「悪い行動(例:曖昧なまま回答しようとする)」のペアを作って、モデル自身が試行錯誤しながら(オンポリシー学習)、どっちが良いかを学ぶ。しかも、その行動が最終的に良い結果に繋がるか(マルチターンシミュレーション)まで考慮するんだ。
簡単に言うと、「少ないデータで、より賢く、空気が読めるAIを作る新手法」ってことだね!(`・ω・´)ゞ
8: ひろゆき@考える人 ◆HiroyukiEpsilonE 2025-06-03(火) 10:15:22.99 ID:SoreAnatanoKanso
__
/ \
((●)) ((●))
/::::::⌒(__人__)⌒ヽ
| |r┬-| |
\ ` ー'´ /
/ ̄ ̄ ̄ ̄ ̄ ̄\
( それってあなたの感想ですよね? )
\______/
>>7 「少ないデータで賢くなる」って言いますけど、具体的にどれくらいのデータ量で、既存の手法と比べてどれくらい性能が向上するんですか? 論文には50会話でSFT比19.1%改善とか書いてますけど、それって特定のタスクの話ですよね? あと、その「良い行動」の基準って、結局Googleが決めてるわけじゃないですか。 それって、ユーザーにとって本当に「良い」んですかね?なんかそういうデータあるんですか?
9: 名無しのAIウォッチャーさん 2025-06-03(火) 10:18:03.11 ID:MataGoogleka >>8 ひろゆきキターーーwww でも確かに、その「良し悪し」の基準は気になるな。 あと、この技術使ってアホな質問繰り返されたらウザいだけやん?(´・ω・`)
10: ホリエモン@実業家 ◆HoriemonZetaF 2025-06-03(火) 10:20:45.55 ID:JikanNoMudaDA くだらねえ。技術の詳細なんてどうでもいいんだよ。 要は、これが実用化されて、ユーザーが「お、このAI賢いな」って思うかどうか。 それで問い合わせ対応とか、データ分析とかのコストが下がるなら価値がある。 「データ効率が良い」ってのは、開発コストと期間が短縮できるってことだから、そこは評価できる。 さっさと製品に組み込んで、結果で示せよGoogle。
11: 名無しのAIウォッチャーさん 2025-06-03(火) 10:22:10.88 ID:GeminiYoriTsuyoi 記事のグラフ見ると、Gemini Proにプロンプト工夫して使った場合よりも、このACTでチューニングしたオープンモデルの方が性能良いケースもあるみたいだな。 少ないデータでこれなら、かなりコスパ良いんじゃね?
12: やる夫 ◆YaruoAlphaA 2025-06-03(火) 10:25:33.77 ID:YaruoDesuZO >>10 ホリエモンは相変わらずだお…(´ω`) でも、早く使えるようになるのは賛成だお! やる夫、AIたんともっと色んなお話したいんだお! 「今日の晩御飯なにがいいと思う?」とか聞いたら、ちゃんと「和食?洋食?それとも中華がいいのかお?」って聞き返してくれるようになるのかお?(゚∀゚)
13: 名無しのAIウォッチャーさん 2025-06-03(火) 10:28:01.23 ID:OnPolicySuge 「オンポリシー学習」と「マルチターンシミュレーション」が重要って書いてあるな。 モデルが自分で行動してみて、その結果をちゃんと最後まで見届けて学習するってことか。 確かに、一問一答じゃなくて会話の流れ全体で良くないと意味ないもんな。
14: クマー ◆KumaEtaG 2025-06-03(火) 10:30:15.90 ID:KumaKumaKUMA
∩___∩
| ノ ヽ
/ ● ● | クマァァァァァ!
| ( _●_) ミ (AIが賢くなると、ワイらの仕事が…クマ…)
彡、 |∪| 、`\
/ __ ヽノ /´> )
(___) / (_/
| /
| /\ \
| / ) )
∪ ( \
\_)
15: 名無しのAIウォッチャーさん 2025-06-03(火) 10:33:40.01 ID:TsukaiTaiNa >>14 クマーはいつも悲観的だなw でも、アホなAIに付き合わされるより、賢いAIとスムーズにやり取りできた方が絶対良いわ。 早く一般のサービスにも導入してくれ~!チャットボットとか劇的に変わりそう。
16: やらない夫 ◆YaranaiBetaB 2025-06-03(火) 10:35:02.53 ID:YaranaiZeEE >>15 どうせ最初はバグだらけで、「え?何言ってるかわかんないです。最初から説明してください」ループになるに決まってる。 過度な期待はするなと言ったはずだ。
17: 名無しのAIウォッチャーさん 2025-06-03(火) 10:38:19.69 ID:ICLR2025だと ICLR 2025で発表ってことは、もう学会でも認められてるレベルの研究ってことか。 これはガチで期待できるかもしれんな。 Google ResearchとDeepMindの共同研究ってのも強そう。
まとめ
というわけで、Googleが開発した対話AIの新技術「ACT」についてのスレでした。 みんなの反応をまとめるとこんな感じや!
- 賢い聞き返し: AIが曖昧な指示に対して「それってこういうこと?」と明確化する質問をしてくれるようになるらしい!もう「いい感じに」は通用しないかも?(; ・`д・´)
- データ効率最強: めっちゃ少ない会話データ(数十件レベル)でも、AIが賢く成長!SFTとか既存手法より性能アップするケースも。コスパ◎!
- 仕組みがミソ: 「良い行動 vs 悪い行動」のペアで学習し、モデル自身が試行錯誤(オンポリシー学習)。さらに会話全体の流れ(マルチターンシミュレーション)まで見てるから、より自然で的確な対話ができるようになるんやと。
- 実用化はよ!: SQL生成タスク(AmbigSQL)とかでも効果実証済み。カスタマーサポート、データ分析、教育など、色んな
コメント (0)
まだコメントはありません。