【悲報】ワイのAI旅行プランナー、成功率4%の無能だったwww →【朗報】MIT、ソルバー合体で90%超えの有能に魔改造成功www
1: 風吹けば名無し 2025/06/10(火) 10:00:00.00 ID:MitIbmLab 最近のLLMに「夏休みの旅行計画立ててw」とか頼んでるやつおるか?w あれ、実は成功率4%以下のポンコツだったらしいで (´;ω;`) すぐ嘘つくし、予算ガン無視するし、物理的に不可能な移動とか平気で提案してくるしな。
でもMITとIBMの天才集団が、ついに解決策を見つけたらしいわ。 その名も「LLM + SMTソルバー」合体技! これで成功率90%超えとかいうバケモンが生まれた模様。
ソース:Inroads to personalized AI trip planning
2: 風吹けば名無し 2025/06/10(火) 10:01:15.23 ID:PonkotsuAI 知ってた。前にGPT-4に頼んだら「朝に東京タワー、昼に大阪城、夜は札幌でジンギスカン」とかいうプラン出されて草も生えんかったわ。
3: やらない夫 2025/06/10(火) 10:02:40.55 ID:YaranaiZo どうせ大したことないだろ。 LLMの限界は明らかだ。制約が増えれば増えるほど破綻する。 やらない夫はそんなものに期待はしないぞ。
4: やる夫 2025/06/10(火) 10:03:50.11 ID:YaruoYaruo マジかお!?やる夫、このAIで無茶な旅行計画を立てさせてみたいお!(゚∀゚) 「予算1万円で世界一周、移動はヒッチハイクのみ、宿は野宿」とかでもいけるかお!?
5: 永遠の初心者さん 2025/06/10(火) 10:05:01.88 ID:Wakannaiyo >>1 あの…そ、そるばー?って何ですか?(´・ω・`) 新しいサーバーの種類か何かですか…?
6: できる夫 ◆Dekiru.3O 2025/06/10(火) 10:08:22.45 ID:GachiProMan >>5 説明しよう!これは非常にクレバーなアプローチなのだ。
,, -―-、
,' ヽ
' ● ● i
l ワ !'
`ー-=-―'
まず、LLMは複雑な計算や論理的な制約解決が苦手だ。これは周知の事実だね。 そこで、この新技術ではLLMの役割を限定した。 LLMはユーザーの「~したい」「予算は~円」「~には行きたくない」といった**自然言語の要望を、コンピュータが理解できる数式(制約条件)に翻訳する『翻訳家』**に徹するのだ。
そして、その翻訳された数式を、**制約充足問題を解く専門家である『SMTソルバー』**に渡す。 ソルバーは、その制約をすべて満たす解が存在するかどうかを数学的に厳密に検証し、存在するなら最適な解を叩き出す。 つまり、口達者な営業マン(LLM)が客の要望を聞き、それを設計図に起こして、腕利きの職人(ソルバー)が実際に作る、という分業体制なのだ!
7: 風吹けば名無し 2025/06/10(火) 10:10:33.12 ID:NaruHodoNe >>6 できる夫キターーー! なるほど、適材適所ってことか!賢い!
8: 風吹けば名無し 2025/06/10(火) 10:11:05.78 ID:Wakannaiyo >>6 できる夫さん、ありがとうございます! LLMは通訳さんだったんですね!すごく分かりやすいです!(≧▽≦)
9: ひろゆき@考える人 2025/06/10(火) 10:13:45.99 ID:HiroyukiDesu >>6 それって、すごいのはLLMじゃなくてソルバーの方ですよね? LLMは自然言語をPythonコードに変換してるだけじゃないですか。 あと、記事を読むと「計画が無理な場合はユーザーにフィードバックを求めて修正する」って書いてますけど、それって結局、人間が介入しないとダメってことですよね? それって「自動化」って言えるんですかね?あなたの感想ですよね?
10: 風吹けば名無し 2025/06/10(火) 10:15:20.31 ID:GachiProMan >>9 いや、その「自然言語をコードに変換する」部分がこれまで人間がやるしかなかったボトルネックなんだよ。 ユーザーがプログラミング知識ゼロで、対話的に高度なソルバーを使えるようにしたのが革新的なんだ。 「この制約とこの制約が矛盾してますよ」ってAIが教えてくれるだけでも、生産性は爆上がりだろ。
11: 風吹けば名無し 2025/06/10(火) 10:17:01.50 ID:PonkotsuAI >>9 論破王きたw でもワイはひろゆきに同意できんな。 全部自動で完璧な答えが出てくるより、どこがダメか教えてくれて「じゃあこうする?」って提案してくれる方がよっぽど使えるわ。
12: やる夫 2025/06/10(火) 10:18:33.77 ID:YaruoYaruo >>10 そうだお!対話できるのがいいんだお! やる夫の無茶な計画が無理でも、「予算が足りないお、あと100万円追加するか、月旅行を諦めるかだお」って言ってくれるなら神だお!(`・ω・´)
13: 風吹けば名無し 2025/06/10(火) 10:20:11.92 ID:KumaIsHere
/ ̄ ̄ ̄ ̄\
/ ─ ─ \
/ <●> <●> \. 「制約違反クマー!」
| (__人__) |
\ ` ⌒´ /
> <
予算オーバーの計画を投げ込むと、こいつが出てきて教えてくれるわけか。わかりやすいな。
14: 風吹けば名無し 2025/06/10(火) 10:22:54.28 ID:TravelAgent これ、旅行代理店のワイ、完全に職を失う未来しか見えなくて震えてるンゴ… 複雑な周遊プランとか乗り継ぎとか、こっちの専門領域だったのに…
15: 風吹けば名無し 2025/06/10(火) 10:25:00.01 ID:MitIbmLab >>14 乙 でも安心しろ、まだ研究段階や。 一般人が使えるようになるにはもうちょいかかるやろ。 …たぶん。
まとめ
今回のMITとIBMの研究について、スレでの議論をまとめるとこんな感じや。
- LLM単体はポンコツ: ChatGPTなどのLLMに複雑な旅行計画を頼んでも、制約を無視したり非現実的なプランを提案したりで、成功率はわずか4%以下だった。
- 「翻訳家LLM」+「職人ソルバー」: 新技術では、LLMを「ユーザーの言葉を数式に翻訳する」役に限定。実際の計画立案は、制約解決が得意な専門ツール「SMTソルバー」が担当する分業体制を構築。
- 成功率90%超えを達成: このハイブリッド方式により、これまで困難だった複雑な制約(予算、時間、好みなど)を満たす旅行計画の成功率が90%以上に劇的アップ。
- 対話的な計画修正が可能: プランが不可能な場合、「どの条件が矛盾しているか」を具体的に指摘し、ユーザーに対話形式で代替案を提案してくれる。これにより、ユーザーは専門知識なしで計画を修正できる。
- 応用範囲は無限大: このフレームワークは旅行計画だけでなく、工場のタスク割り当てや物流ルートの最適化など、様々な「組み合わせ最適化問題」に応用できる可能性を秘めている。
結論として、AIが苦手なことは専門ツールに任せるという「適材適所」の発想が、AIの実用性を飛躍的に高める鍵となりそうやな。
コメント (0)
まだコメントはありません。