【神AI】黒い森の研究所「Flux.1 Kontext」爆誕!画像生成だけじゃなく編集も自在とかマジかよwww【8倍速いらしい】
1: ワイのAIアンテナ ◆AntennaMAX 2025-05-29(木) 10:00:00.00 ID:ThreadStarter1 またヤバそうなAI出てきたンゴwwwwww Black Forest Labsとかいうところが「Flux.1 Kontext」なる画像生成AIを発表したらしい。 これ、ただ作るだけじゃなくて「編集」もできるってよ!マジかよ胸熱! ソース:Black Forest Labs’ Kontext AI models can edit pics as well as generate them お前ら、どう思う? (゚∀゚)
2: 名無しのAIウォッチャーさん 2025-05-29(木) 10:01:30.50 ID:HayaMimiManX 編集できるのはデカいな。 既存の画像にちょい足しとか、スタイル変更とかできたら神じゃん。 期待してええんか?(´ω`)
3: やる夫 ◆YaruoPower 2025-05-29(木) 10:02:15.12 ID:YaruoBFL001 うおおおおお! やる夫、これ使ってみたいお! (≧▽≦) 写真の中のキャラの服を変えたり、背景だけ差し替えたりできるのかお? 夢が広がりんぐだお!
∧_∧
( ・∀・) ワクワク
( )
| | |
(__)_)
4: やらない夫 ◆YaranaiCool 2025-05-29(木) 10:03:40.88 ID:YaranaiBFL002 >>3 どうせまた誇大広告だろ。「推論速度8倍!」とか言ってるけど、比較対象がショボいだけかもしれんぞ。 それに「Kontext [pro]」と「Kontext [max]」って何が違うんだ? 「テキストと画像を入力として理解」って、具体的にどんな感じなんだよ。 ┐(´ー`)┌
5: できる夫 ◆DekiruSensei 2025-05-29(木) 10:05:00.23 ID:DekiruBFL003 説明しよう! Black Forest Labsの「Flux.1 Kontext」ファミリーは、生成型フローマッチングモデルを採用している。 これは従来の拡散モデルとは異なるアプローチで、高品質な画像を高速に生成できる可能性がある。 特に「Flux.1 Kontext [pro]」は、キャラクターやスタイルを維持したまま複数ターンで画像を洗練できる点が特徴だ。 一方「Flux.1 Kontext [max]」は速度、一貫性、プロンプトへの忠実性を重視しているとのことだ。 XのGrokチャットボットの画像生成機能にも、かつて彼らのモデルが使われていたらしいな。
6: 名無しのAIウォッチャーさん 2025-05-29(木) 10:06:50.75 ID:KitaiDaiManY >>5 できる夫さんキター!解説あざっす! フローマッチング…また新しい技術か。ついていけんわw でもキャラ維持したまま編集できるのはマジで革命的。 これでワイの嫁(二次元)をもっと色んなシチュにできるんか…?(^q^)
7: ひろゆき@論破王 ◆Hiroyuki論破 2025-05-29(木) 10:08:10.11 ID:HiroyukiBFL004 >>5 「state-of-the-art」とか「competitive typography」とか言ってますけど、 具体的なベンチマークとか、他の主要モデル(Imagen 4とかOpenAIの最新モデルとか)との比較データって出てるんですか? 「最大8倍速い」ってのも、どのモデルと比較して、どんなタスクでの話なんですかね? ソースがTechCrunchの記事だけだと、ちょっと情報足りないっすよね。え、まさかそれだけじゃないですよね?(´<_`)
8: 名無しのAIウォッチャーさん 2025-05-29(木) 10:09:33.44 ID:TsumiKasanZ >>7 ひろゆきさん、相変わらずっすねw でも確かにその通り。 Google I/OでImagen 4も発表されたし、OpenAIのはGhibli風でバズったし、競争激しいからな。 本当にすごいならデータ出してドヤ顔してほしいわ。
9: 名無しのAIウォッチャーさん 2025-05-29(木) 10:11:05.67 ID:OfflineKibou オフラインで使えないのは痛いなー。[dev]版もプライベートベータかよ。 いつになったら庶民にも手が届くんですかねぇ…(´・ω・`) プレイグラウンドで200クレジット(約12枚生成)はありがたいけど、すぐなくなりそう。
10: やる夫 ◆YaruoPower 2025-05-29(木) 10:12:45.99 ID:YaruoBFL001 >>9 12枚もあれば、色々試せるお! やる夫はポジティブだお!(`・ω・´) まずは触ってみて、そのすごさを体験するんだお! ダメだったらその時考えるお!
11: 名無しのAIウォッチャーさん 2025-05-29(木) 10:14:20.30 ID:StabilityHa ここの創業者たちってStability AI出身なんだっけ? なんか因縁を感じるな。あっちはオープンソース路線だったけど、こっちはAPIとかエンタープライズ向けでガッツリ儲ける気か? Andreessen HorowitzとかY CombinatorのGarry Tanとか、バックについてる投資家も大物揃いだしな。
12: やらない夫 ◆YaranaiCool 2025-05-29(木) 10:15:55.55 ID:YaranaiBFL002 >>11 結局はビジネスよ。 「オープン」なKontextモデル[dev]も、結局は一部の研究者や安全テストのためって名目だろ。 我々一般ユーザーが自由に使えるようになるのはいつになることやら。
___
/ \
/(( ´TIMESTAMP`))\ ← どうせこうなる
/::::::⌒ ⌒:::::::\
| (●) (●) |
\ (__人__) ,""..,/
/  ̄ \
13: 名無しのAIウォッチャーさん 2025-05-29(木) 10:17:10.10 ID:PlayGroundIku 誰かもうプレイグラウンド試した猛者おらんかー? 本当に「プロンプトに強い追従性」があるのか、それともまた「宇宙猫.jpg」連発するのか気になるわ。 あと「競争力のあるタイポグラフィ」ってのも、日本語いけるんかな?
14: できる夫 ◆DekiruSensei 2025-05-29(木) 10:18:45.67 ID:DekiruBFL003 >>13 タイポグラフィに関しては、英語圏発のモデルなので、まずは高品質な英語テキストのレンダリングを期待するのが妥当だろう。 日本語対応は、学習データセットにどれだけ日本語テキストと画像のペアが含まれているかに依存する。 「in-context generation and editing」という部分が肝で、参照画像内のスタイルや要素をテキスト指示で変更できるなら、 例えば「この看板の文字を "Welcome" に変えて」といった指示が通る可能性がある。これは非常に強力だ。
15: 名無しのAIウォッチャーさん 2025-05-29(木) 10:20:00.00 ID:NihongoHope >>14 なるほど、日本語はまだ未知数か… でも、画像内の文字を自然に変えられるだけでもすごい進化やで! 今の画像生成AIって、文字出そうとするとグニャグニャになるもんなw あれが解消されるなら革命や。
16: ひろゆき@論破王 ◆Hiroyuki論破 2025-05-29(木) 10:21:30.30 ID:HiroyukiBFL004 >>15 「革命」とか安易に言いますけど、それって実際に使ってみて、 既存のワークフローが劇的に改善されるとか、そういう具体的なメリットがあって初めて言えることですよね? あと、編集機能が悪用されてフェイク画像がさらに巧妙化するリスクとかって、ちゃんと考えてるんですかね、このBlack Forest Labsって会社は。 その辺の倫理規定とか、どうなってるんでしょうか? ちょっとググっただけじゃ出てこないんですけど。
17: やる夫 ◆YaruoPower 2025-05-29(木) 10:23:00.00 ID:YaruoBFL001 >>16 ぐぬぬ…ひろゆきはいつも細かいお…(´;ω;`) でも、やる夫は信じるお! きっと素晴らしい未来が待ってるお! 悪用するやつは、どんな技術でも出てくるんだから、使う側のモラルが大事だお! (`ハ´)
18: 名無しのAIウォッチャーさん 2025-05-29(木) 10:25:12.34 ID:GrokNoKioku >>1 Grokの画像生成機能って、結局どうだったんだっけ? あんまりパッとしなかった記憶があるけど、あれがベースになってるなら期待薄か…? それとも全くの別物に進化したんかな。
19: 名無しのAIウォッチャーさん 2025-05-29(木) 10:27:45.67 ID:KakakuCheck 気になるのはお値段よ。APIとか提供するってことは、それなりのお値段なんでしょ? 個人で気軽に使えるレベルなのか、企業向けオンリーなのか。 そこんとこハッキリしてほしいわね。
20: 永遠の初心者さん ◆ShoshinshaKun 2025-05-29(木) 10:30:00.00 ID:ShoshinBFL005 あの…すみません、フローマッチングって何ですか…?(´・ω・`) 拡散モデルよりすごいんですか…? あと、「プロンプト」って、あの呪文みたいなやつですよね…? 編集も呪文でやるんですか…? 誰か教えてください…!
21: できる夫 ◆DekiruSensei 2025-05-29(木) 10:32:10.20 ID:DekiruBFL003 >>20 永遠の初心者さん、良い質問だ。 拡散モデルはノイズから徐々に画像を生成するのに対し、フローマッチングはデータ分布そのものを直接学習しようとするアプローチの一つだ。 理論上はより少ないステップで高品質な画像を生成できる可能性があるとされている。 プロンプトは指示文のことで、編集も基本的には「この部分をこうして」という自然言語に近い指示と、場合によっては編集箇所を指定するマスク画像などを組み合わせて行うことになるだろう。 最初は難しく感じるかもしれないが、プレイグラウンドなどで実際に触れてみるのが一番理解が早いぞ。
22: 名無しのAIウォッチャーさん 2025-05-29(木) 10:35:00.00 ID:MatomeTanomu とりあえず触ってみてからだな。 期待半分、不安半分ってとこか。 編集機能が本物なら、絵師さんとかデザイナーさんの仕事が捗りまくる未来もあるかもな。
まとめ
というわけで、Black Forest Labsの新型AI「Flux.1 Kontext」についてのスレ民の反応でした。 ポイントをまとめるとこんな感じか?
- 画像生成+編集の二刀流: テキストプロンプトと、オプションで参照画像を使って新しい画像を生成したり、既存画像を編集したりできるらしい。これが一番の注目ポイント。
- モデルは2種類: キャラクターやスタイルを維持しつつ複数回調整できる「Flux.1 Kontext [pro]」と、速度・一貫性・プロンプト忠実性重視の「Flux.1 Kontext [max]」がある。
- 爆速推論?: 「現行の主要モデルより最大8倍速い」と豪語。ただし、具体的な比較対象や条件はまだ不明。
- お試し可能: サインアップ不要のモデルプレイグラウンドで新規ユーザーは200クレジット(約12画像分)試せる。ただし、モデルのダウンロードやオフライン利用は現時点では不可(研究用のdev版は除く)。
- 期待と疑問の声: 編集機能やタイポグラフィ性能への期待が高い一方で、具体的な性能比較データや日本語対応、悪用対策については情報が少なく、懐疑的な意見や更なる情報を求める声も。創業メンバーがStability AI出身という点も話題に。
今後の詳細情報や、実際に試したユーザーからのレビューが待たれるところだな! 続報に期待しようぜ! (`・ω・´)ゞ
コメント (0)
まだコメントはありません。