タグ

画像生成

46件 · 16週間分

2026年 7月20日（月）〜 7月26日（日） 3件

7/23（木）

TechCrunch AI HOT 70

Runway、ジェネレーティブメディア向けAIモデルルーターをローンチ

Runwayは、ジェネレーティブメディアが混み合う市場において、AIモデルルーターをローンチしました。このツールは、開発者が品質、速度、コストの優先順位に基づいて、要求に最適な画像、動画、オーディオ生成モデルを自動的に選択します。

画像生成マルチモーダルツール

取得日：7/24

7/21（火）

YouTube HOT 80

YouTubeがAI量産動画で稼げない時代へ？収益停止の警告と中国AI「Kimi K3」の登場

YouTubeがAIによる大量生成動画に対する収益停止措置を強化しており、AIのみで制作された低品質なコンテンツでの収益化が困難になる時代が到来しています。一方で、中国からは高性能なオープンウェイトモデル「Kimi K3」が登場し、AI技術競争の新たな局面を迎えています。

LLM画像生成著作権

取得日：7/22

7/17（金）

YouTube HOT 83

生成AIを活用した3D制作の変革とText-to-3Dの最新動向

生成AI技術が3D制作の分野で大きな変革をもたらしており、特にText-to-3D技術の進化が注目されています。AIがBlenderのような3Dソフトウェアを自律的に操作し、テキスト指示から3Dモデルやシーンを生成することで、これまで専門知識が必要だった3D制作のハードルを一気に下げています。これは、映画製作のプリビズからゲーム開発、VR/ARコンテンツ作成まで、幅広い産業に影響を与える可能性を秘めています。

画像生成マルチモーダル研究

取得日：7/20

2026年 7月13日（月）〜 7月19日（日） 5件

7/19（日）

Hugging Face Blog TOP 88

NVIDIA NeMo AutomodelとHugging Face Diffusersによる大規模画像・動画モデルのファインチューニング

NVIDIA NeMo AutomodelとHugging Face Diffusersが統合され、大規模な画像および動画モデルのファインチューニングが効率的に行えるようになりました。この連携により、研究者や開発者は、よりアクセスしやすく、スケーラブルな方法で最先端の生成AIモデルをカスタマイズできます。

画像生成研究開発効率化

取得日：7/19

7/19（日）

ArXiv ML HOT 78

Black-Box Vision-Languageモデル向けZero-Shotプロンプトリウェイト「CARPRT」

ブラックボックスのVision-Languageモデル（VLM）を用いたZero-Shot画像分類において、クラス固有のプロンプト重み付けを行う「CARPRT（Class-Aware Zero-Shot Prompt Reweighting）」が提案されました。これにより、従来のクラス共通の重み付けでは見落とされていた、プロンプトとクラス間の条件付き依存性を考慮し、分類精度を向上させます。

LLM画像生成研究

取得日：7/19

7/17（金）

dev.to AI

オープンソースAIモーション・アニメーションツールキット「RokMotion」発表

AI駆動のアニメーションをよりスムーズかつ実験的に制作するためのオープンソースツールキット「RokMotion」が発表されました。これは、クリエイター、開発者、AI愛好家向けに設計され、GitHubで公開されています。

AI画像生成オープンソース

取得日：7/18

7/16（木）

YouTube TOP 85

Google VidsとRobloxがAI動画・ゲーム生成機能を強化：AIによるパーソナライズされたクリエイティブ体験の深化

Googleは「Google Vids」にパーソナライズされたAIアバター機能を追加し、ユーザーが自分自身をデジタル版で動画に登場させられるようになりました。一方、Robloxはモバイルアプリ内でAIを活用したゲーム生成機能「Build」を提供開始し、テキストプロンプト一つでゲームを簡単に作成できる道を開きました。

Google画像生成マルチモーダル

取得日：7/17

7/8（水）

YouTube

Meta、日本語も得意な無料画像生成AI「Muse Image」を発表：世界2位の実力

Metaが新体制のAI部門から初めての画像生成AIモデル「Muse Image」をリリースしました。このモデルは日本語の指示に強く、世界2位と評価される高い生成能力を持ち、無料で利用できるため、幅広いクリエイターやユーザーに影響を与える可能性があります。

画像生成Metaオープンソース

取得日：7/13

2026年 7月6日（月）〜 7月12日（日） 3件

7/7（火）

The Verge TOP 85

Meta、Instagramなどに統合される「Muse Image」AI画像生成モデルを発表

Metaは、Superintelligence Labs開発のAI画像生成モデル「Muse Image」を発表し、Meta AIアプリ、Instagram、WhatsAppに統合を開始しました。このモデルは「agentic」で、Muse Spark LLMと連携し、プロンプトの推論、Web検索、計画を経て画像を生成します。

画像生成マルチモーダルMeta

取得日：7/8

7/4（土）

TechCrunch AI HOT 75

Midjourney、ハリウッドスタジオにAI使用状況の開示を要求：著作権とAIの法廷闘争

画像生成AI「Midjourney」が、進行中の訴訟において、3つのハリウッドスタジオに対し、彼らが自社でどのようにAIを使用しているかの詳細を開示するよう求めています。これは、AI生成コンテンツの著作権、公正利用、そして企業におけるAI導入の透明性を巡る、業界全体の重要な法的争点となる可能性があります。

画像生成AI著作権

取得日：7/6

7/6（月）

ASCII.jp

無料の画像生成AI「Krea 2」が話題に：実写もアニメも高品質に対応

無料の画像生成AI「Krea 2」が、実写からアニメまで高品質な画像を生成できる新モデルとして注目を集めています。ローカルPCで動作し、プロンプト解釈力や多様なスタイル表現に優れているため、クリエイターにとって新たな選択肢となる可能性を秘めています。

画像生成AIオープンソース

取得日：7/6

2026年 6月29日（月）〜 7月5日（日） 2件

6/30（火）

Google DeepMind Blog TOP 85

Google DeepMind、軽量モデル「Nano Banana 2 Lite」と高速モデル「Gemini Omni Flash」を発表

Google DeepMindは、新しい画像生成モデル「Nano Banana 2 Lite」と、高速なフラッグシップ級LLM「Gemini Omni Flash」を公開しました。Nano Banana 2 Liteはより高速かつ低コストで画像生成を可能にし、Gemini Omni Flashは高度な知能を迅速に提供することで、開発者の生産性向上とAI活用の幅を広げます。

LLM画像生成Google

取得日：7/1

6/29（月）

TechCrunch AI HOT 80

Google GeminiのパーソナライズされたAI画像生成機能が米国ユーザーに無料開放

Googleは、GeminiのパーソナライズされたAI画像生成機能を米国の対象ユーザーに無料で提供開始しました。この機能は、ユーザーの興味やGoogleアプリのデータに基づいて画像を生成し、より個別化されたクリエイティブ体験を提供します。

GoogleLLM画像生成

取得日：6/30

2026年 6月22日（月）〜 6月28日（日） 4件

6/26（金）

Zenn AI HOT 78

LoRA AIとAudjust AIがクリエイターの次世代AIコンテンツ制作環境を構築

LoRA技術を活用した画像・動画生成プラットフォーム「LoRA AI」と、インテリジェント音声編集・音楽生成ツール「Audjust AI」が連携し、クリエイター向けに一貫性のあるビジュアルと自然な音声コンテンツをワンストップで生成する環境を提供します。YouTuberやインディー開発者にとって強力なツールとなり得ます。

画像生成音声マルチモーダル

取得日：6/27

6/23（火）

CNET Japan TOP 85

中国ByteDance、新AI動画生成モデル「Seedance 2.5」発表、30秒・4K動画を生成

中国ByteDanceが新しいAI動画生成モデル「Seedance 2.5」を発表しました。このモデルは、単一のプロンプトから最長30秒の4K動画を生成でき、最大50点の参照素材で詳細な制御が可能です。

画像生成マルチモーダル研究

取得日：6/24

6/18（木）

YouTube HOT 80

AnthropicがAIデザインツール「Claude Design」を発表、Claude Code連携でデザイン生成を強化

Anthropicは、テキスト指示からスライド資料やウェブサイト、アニメ動画などを生成できるAIデザインツール「Claude Design」を発表しました。特にClaude Codeとの連携により、デザイン生成と実装の橋渡しを強化します。

AnthropicLLM画像生成

取得日：6/24

6/21（日）

Zenn AI

AIで生成した3Dモデルを「底模」として使う際のチェックポイント

AIで生成された3Dモデルをそのまま本番用途に使うのは難しいとされ、手作業での修正を前提とした「底模」として活用する際のチェックポイントがZennで解説されています。下流工程への円滑な連携のために重要な視点が提示されました。

画像生成実践開発効率化

取得日：6/22

2026年 6月15日（月）〜 6月21日（日） 1件

6/16（火）

dev.to ML TOP 88

オーディオファイルからスタイライズされたミュージックビデオを生成するAI「aMuseMe」

「aMuseMe」は、オーディオファイルを入力するだけで、歌詞のタイミング調整や映像編集、素材探しが不要な、スタイライズされたミュージックビデオを生成するAIシステムです。35億パラメータの小規模モデル群を統合し、視覚的なシンフォニーを創出します。

画像生成マルチモーダル事例

取得日：6/16

2026年 6月8日（月）〜 6月14日（日） 1件

6/10（水）

Google DeepMind Blog TOP 88

Google DeepMind、統一エンコーダフリーのマルチモーダルモデル「Gemma 4 12B」を発表

Google DeepMindは、統一されたエンコーダフリーのマルチモーダルモデル「Gemma 4 12B」を発表しました。これは、テキストと画像を単一のモデルで効率的に処理できる、新たなオープンソースモデルとして注目されます。

LLM画像生成マルチモーダル

取得日：6/10

2026年 6月1日（月）〜 6月7日（日） 2件

6/3（水）

ロボスタ TOP 93

NVIDIAがフィジカルAI向け世界基盤モデル「Cosmos 3」発表

NVIDIAはフィジカルAI向けにオープンな世界基盤モデル「Cosmos 3」を発表しました。これにより、トレーニング期間を数カ月から数日に短縮し、製造業などでの画像・動画生成を強化します。

LLM画像生成ロボティクス

取得日：6/4

6/3（水）

TechCrunch AI

GoogleのDreambeans、あなたの人生をアニメに変える最も奇妙なAIツール

Googleの「Dreambeans」は、Googleアカウントの個人データから収集されたAIイラストによる「ストーリー」を生成し、ユーザーの生活をアニメーション化します。これは、プライベートな体験を視覚的に表現するユニークなAIツールです。

マルチモーダル画像生成Google

取得日：6/4

2026年 5月25日（月）〜 5月31日（日） 1件

5/29（金）

ITmedia AI+ HOT 83

Googleが動画からの画像生成をサポートする「Nano Banana 2」をリリース

Googleが「Nano Banana 2」（Gemini 3.1 Flash Image）と「Nano Banana Pro」（Gemini 3 Pro Image）の一般提供を開始しました。特にNano Banana 2では、動画入力から画像を生成する新機能がプレビュー公開され、マルチモーダルAIの新たな活用法が提示されています。

画像生成マルチモーダルGoogle

取得日：5/31

2026年 5月11日（月）〜 5月17日（日） 4件

5/15（金）

YouTube HOT 72

Runwayが日本市場に本格進出、60億円超の投資で動画生成AIを拡大

動画生成AIで知られる米Runwayが、日本市場への本格進出を発表し、60億円を超える大規模投資を行います。日本が持つ洗練されたクリエイティブ産業との連携を重視し、動画制作の民主化と新たな表現手法の創出を目指します。

画像生成動画生成事例

取得日：5/17

5/15（金）

YouTube

AIを活用した画像・動画コンテンツ生成の最新動向：Canva AI、Lumeflow AI、CapCut AIで創造性が加速

画像生成AI「Canva AI」の機能強化や、画像生成モデル「GPT Image 2」を活用する「Lumeflow AI」の登場、さらには「CapCut AI」による動画編集の効率化など、AIがクリエイティブなコンテンツ制作を大きく変革しています。

画像生成マルチモーダル事例

取得日：5/15

5/8（金）

ArXiv AI HOT 72

Auto-Rubric as Reward (ARR): マルチモーダル生成モデルの評価を明示的基準で改善

マルチモーダル生成モデルの人間選好アラインメントにおいて、従来の単一スカラー報酬の限界を克服するため、Auto-Rubric as Reward (ARR) フレームワークが提案された。これは、明示的な多次元評価基準（ルーブリック）を自動生成し、報酬モデルをより信頼性と拡張性のあるものにする。

研究マルチモーダルLLM

取得日：5/14

5/11（月）

Zenn AI, Qiita ChatGPT, YouTube, Google News JP / 生成AI

AIが技術記事の質を変える：GPT-Image-2での画像生成とAI生成記事の見分け方

GPT-Image-2を活用したキャラクター設定資料の一括生成プロンプト設計が公開され、AIによるクリエイティブな画像生成が効率化されています。一方で、ChatGPTなどのAIが書いた技術記事には「手癖」があり、一目でAI生成と判別できる特徴があることが指摘されており、AI生成コンテンツの品質と信頼性への議論が深まっています。これは、AIがコンテンツ制作に与える影響と、人間によるコンテンツの価値を再認識させるものです。

LLM画像生成プロンプト

取得日：5/12

2026年 5月4日（月）〜 5月10日（日） 5件

5/8（金）

ITmedia AI+ HOT 72

COLOPL Contents Protector (CCP)：クリエイター作品を生成AIの無断学習から保護

AI活用を推進するコロプラが、クリエイター作品を生成AIの無断学習から保護するための無料アプリ「COLOPL Contents Protector（CCP）」をリリースしました。AIの進化とクリエイター保護のバランスを取る試みとして注目されます。

画像生成事例ITmedia

取得日：5/9

5/8（金）

Qiita ChatGPT

ChatGPT Image 2 ガイド：AI生成画像から自動化されたコンテンツワークフローまで

「ChatGPT Image 2 ガイド」は、AI生成画像を単なる静止画ではなく、自動化されたコンテンツワークフローの一部として活用する方法を解説します。画像生成から編集、配信までの一連のプロセスをAIで効率化し、クリエイティブなコンテンツ制作を加速させるための実践的なアプローチが示されています。

ChatGPT画像生成マルチモーダル

取得日：5/8

5/4（月）

Zenn ChatGPT TOP 93

ChatGPT Images 2.0が劇的進化、実務レベルの画像生成が可能に

ChatGPT Images 2.0は、テキスト描画能力と複雑な構図生成において大幅な進化を遂げました。日本語を含む文字の自然な描画や、インフォグラフィック、UIモックアップなど実務での活用が可能なレベルに達しています。

画像生成OpenAI実践

取得日：5/5

5/3（日）

TechCrunch AI HOT 78

「This is fine」の作者がAIスタートアップによる著作権侵害を訴える

人気ミーム「This is fine」の作者が、AIスタートアップ「Artisan」が自身の作品を盗用したと訴えています。Artisanは「人間を雇うのをやめよう」と煽る看板広告で注目を集めた企業であり、今回の件はAIが生成するコンテンツにおける著作権とクリエイターの権利保護という、AI時代の最も重要な課題の一つを浮き彫りにしています。

画像生成倫理著作権

取得日：5/4

5/2（土）

Google News JP / AI HOT 75

2027年のアカデミー賞、AI生成コンテンツの利用規制を強化

2027年のアカデミー賞が、AIによって生成された俳優や脚本の資格を厳格化することを発表しました。これは、映画業界がAI技術の急速な進化に直面し、人間の創造性とAIの役割のバランスを模索する中で、芸術の真正性を守ろうとする動きを反映しています。映画制作者は、AIをクリエイティブなツールとして活用しつつも、主要な要素は人間の手によるものであることを証明する必要があります。

AI画像生成倫理

取得日：5/4

2026年 4月27日（月）〜 5月3日（日） 2件

4/30（木）

TechCrunch AI

ChatGPT Images 2.0、インドで人気爆発も、他地域ではまだ「大ヒット」には至らず

OpenAIがリリースした画像生成AI「ChatGPT Images 2.0」は、インドのユーザーの間でアバターや映画のようなポートレート作成に広く受け入れられ成功を収めていますが、他の地域ではまだ大きなヒットとはなっていません。

画像生成OpenAI事例

取得日：5/2

4/27（月）

YouTube TOP 95

OpenAI、最新モデル「GPT-5.5」と画像生成AI「GPT Image 2.0」を発表：AI開発競争が激化

OpenAIが「GPT-5.5」と次世代画像生成AI「GPT Image 2.0」を正式リリースしました。GPT-5.5はコーディング性能でClaude Opus 4.7を凌駕し、GPT Image 2.0は商品画像と説明文の一体生成を可能にするなど、AIが娯楽から実務へと変化する大きな一歩となります。これにより、各産業でのAI活用が加速し、開発者や企業は新たなビジネスチャンスと効率化の波に直面します。

LLM画像生成OpenAI

取得日：4/27

2026年 4月20日（月）〜 4月26日（日） 6件

4/23（木）

YouTube TOP 95

OpenAIが「GPT-5.5」を発表：性能と応用事例を徹底解説

OpenAIが最新のAIモデル「GPT-5.5」を発表しました。このモデルは、コーディング能力でClaude Opus 4.7を凌駕し、自律走行AIや画像生成AI「GPT Image 2.0」との連携により、開発やコンテンツ制作の効率を飛躍的に向上させることが期待されます。

LLMエージェント画像生成

取得日：4/26

4/25（土）

Zenn AI HOT 78

Masked Autoencoders (MAE) 論文解説：高マスク率と非対称設計の理由

Vision Transformer時代の自己教師あり学習において不可欠なMasked Autoencoders（MAE）は、その高マスク率と非対称設計が、画像版BERTという表面的な理解を超えた本質的な強みを持つことを解説します。このアプローチは、画像特徴学習に革新をもたらしました。

LLM研究画像生成

取得日：4/26

4/23（木）

OpenAI Blog TOP 85

ChatGPT Images 2.0発表：日本語タイポグラフィとUIモックアップ生成が大幅向上、記憶レイヤーの必要性も浮き彫りに

OpenAIから「ChatGPT Images 2.0」が発表され、日本語タイポグラフィの正確性向上やUIモックアップの高品質な一発生成が可能になりました。この進化は画像生成能力のマイルストーンである一方で、マルチモーダルAIが直面する「記憶レイヤー」の不足という新たなボトルネックを浮き彫りにしています。

画像生成マルチモーダルOpenAI

取得日：4/24

4/21（火）

The Verge TOP 95

OpenAI、Web検索と推論を統合した画像生成AI「ChatGPT Images 2.0」を発表

OpenAIは、Web検索結果と推論能力を組み合わせて画像を生成する「ChatGPT Images 2.0」をリリースしました。この新機能「思考モード」により、複雑な指示への対応力、詳細の保持、多言語テキストの正確な描画能力が大幅に向上し、より洗練された画像を生成できます。

画像生成マルチモーダルOpenAI

取得日：4/22

4/17（金）

YouTube TOP 85

AnthropicがAIデザインツール「Claude Design」発表：Opus 4.7搭載でプロ級デザインを自動生成

Anthropicが、最新モデル「Opus 4.7」を搭載したAIデザインツール「Claude Design」を発表しました。これにより、簡単な対話を通じて、プロフェッショナルレベルのWebサイトやスライド、LPデザインなどを数秒で自動生成することが可能になります。

LLM画像生成Anthropic

取得日：4/21

4/18（土）

YouTube

【動画】Claude Designがデザインワークフローを革新：Webサイトやスライドを15分で作成

Anthropicの最新AIツール「Claude Design」が、プロ級のWebサイトやスライドのデザインと構成をわずか15分で生成できるとして注目を集めています。日本語で簡単な指示を出すだけで、制作ワークフローを劇的に効率化する"神ツール"として、Figmaなどのデザインツールの株価に影響を与えるほどのインパクトを与えています。

LLM画像生成マルチモーダル

取得日：4/20

2026年 4月13日（月）〜 4月19日（日） 2件

4/19（日）

Hugging Face Blog