AI画像・デザイン

Midjourney副業の始め方|用途別プロンプト・料金

更新: 田中 美咲

会社員が週5〜10時間の副業で、まずは月1〜5万円を現実的に狙うなら、Midjourneyは「なんとなく絵を作る道具」ではなく、YouTubeサムネやSNS素材など売れる成果物に絞って使うのが近道です。
2026年3月時点、Basicプランが約月10ドルと案内されるケースが多く見られます。
無料トライアルの有無も報道・解説で表現が分かれるため、公式ページの最新情報を確認してから回収設計を立てることをおすすめします。

筆者の実務感覚でも、平日夜の1時間でYouTubeサムネ案を3本試作して翌日に修正する流れは十分回せます。
V7のDraft Modeはラフ出しの打席を大きく増やしてくれるため、試作→選別→仕上げのサイクルを短く回せます。
この記事では用途選定からプロンプト設計、制作フロー、案件化、商用利用と著作権の注意、会社員の税務までを一貫して整理し、最後に7日間の行動プランまで提示します。

Midjourney副業は何で稼げる?向いている人と現実的な収入ライン

稼げる用途の代表例

Midjourneyで副業収入を作りやすいのは、「1枚の完成度」ではなく、見た瞬間の印象が強く、用途に即した画像が求められる領域です。
DALL·E 3 は指示文への忠実性が高くバリエーション生成が得意ですが、Midjourney は美的統一感の高さからブランドトーンや世界観を揃えたい案件に向きます。
Stable Diffusion は細かなカスタマイズが可能で学習コストは高めですが、長期的なROIを狙える選択肢です。

副業用途で代表的なのは、YouTubeやブログのサムネイル制作です。
YouTubeのサムネは16:9で1280×720が基本なので、Midjourneyで背景やメインビジュアルを作り、文字組みはCanvaやPhotoshopで仕上げる流れが実務的です。
特に「ビジネス系なのに少し未来感がある」「美容系で高級感を出したい」といった抽象的な雰囲気指定は、Midjourneyのほうがまとまりやすいと感じます。
逆に、テキスト指示どおりの構図違いを何案もそろえたいならDALL·E 3のほうが扱いやすい場面があります。

EC商品画像や広告イメージも、相性のいい領域です。
実物写真の代替というより、訴求用のキービジュアル、背景演出、季節感のあるイメージ作成で使うイメージです。
たとえばコスメ、雑貨、アパレルの訴求では、Midjourneyの質感表現と色のまとまりが効きます。
広告クリエイティブで「洗練された世界観」を出したいときは、Stable Diffusionより短時間で見栄えに到達しやすいのが利点です。
一方で、商品形状を厳密に守る必要があるカットは、Midjourneyだけで完結させるより実写や別ツール併用のほうが向いています。

SNS投稿素材も売りやすい領域です。
Instagramのフィード用ビジュアルやリールのカバー、キャンペーン告知画像などは統一感が価値になりやすく、Midjourneyの得意分野と相性が良いです。
筆者の実務感覚では、SNS素材は1セット9枚で5,000円程度の小口から再現性が出やすく、月2社ほど継続で回ると収益が安定しやすいのが利点です。

ブログ用アイキャッチも初心者向けです。
記事内容をそのまま説明する図解より、「テーマの空気感を伝える1枚」が求められるメディアではMidjourneyが強いです。
金融、キャリア、AI、ライフスタイル系のアイキャッチは、写真素材だけだと埋もれやすいので、少し印象を足せる絵が喜ばれます。
反対に、図解要素が多いメディアや、文字情報を厳密に整理したい案件ではDALL·E 3や通常のデザイン制作のほうがスムーズです。

V7では品質と速度の両方が上がっていて、Draft Mode の位置づけは「通常生成より速い(公式表記:10倍速)」です。
複数のユーザーレポートでは、4枚グリッドが概ね10秒台で返ると報告されることが多いですが、これは公式の秒数表記ではなく実測値の集約です。
公式説明(10x faster)とユーザー実測(10秒台等)を区別して伝えるようにしてください。

どんな人に向いているか

Midjourney副業に向いているのは、絵が描ける人だけではありません。
むしろ、世界観を言語化して、試作と修正を地道に回せる人です。
プロンプトは具体性が高いほど精度が上がりやすく、目的、構図、質感、色味、用途を少しずつ詰めていく必要があります。
ここ、すごく大事で、最初から1回で当てる人より、10回の試作から使える1案を拾える人のほうが副業では強いです。

向いているのは、まずルール順守ができる人です。
商用案件では、著名人そっくり、既存キャラクターの模倣、ブランドに寄せすぎた表現のような近道が、あとで一番困るポイントになります。
筆者はこの手の“早く見栄えを出せる抜け道”を選ばない人のほうが、継続案件に乗りやすいと感じています。
クライアントが欲しいのは、派手な一発ではなく、毎回安心して出せる素材だからです。

あとは、デザインの基礎を少しでも理解している人に向きます。
たとえばYouTubeサムネなら、画像生成そのものよりも、視線誘導、余白、文字の可読性、16:9での見え方のほうが成果に直結します。
Instagram素材でも同じで、1:1や4:5で中央に情報を寄せる感覚があるだけで納品物の安定感が変わります。
Midjourneyは「いい素材を出す」道具であって、「そのまま売れる完成品を自動で作る」道具ではありません。
この認識がある人ほど伸びます。

逆に向きにくいのは、細部を固定したい人です。
商品の正確な形状再現、レイアウトのミリ単位調整、独自LoRAや学習モデルで作り込みたい運用なら、Stable Diffusionのほうがハマります。
指示どおりのバリエーションを大量に出して比較したいならDALL·E 3がやりやすい場面もあります。
Midjourneyを選ぶべきなのは、サムネ、広告、SNS素材、コンセプト画像のように、完成度の高い雰囲気づくりがそのまま価値になる用途です。

Web版が使いやすくなったのも、向いている人の幅を広げています。
以前よりDiscord操作に引っ張られにくく、ブラウザ中心で始められるので、デザイン副業の入口として現実的です。
正直に言うと、初学者が最初からStable Diffusionで環境構築や拡張機能まで追うより、Midjourneyで案件化しやすい絵を先に掴むほうが収益化は早いです。

収入レンジと算出根拠

収入の見方は、派手な成功談よりも単価 × 件数 − 手数料・ツール費で考えるのが堅実です。
初心者が最初に狙うラインは、月10,000〜50,000円くらいが現実的です。
これは弱気な数字ではなく、工数、スキル習得、修正対応、そしてツール費の回収まで含めるとちょうど無理が出にくい帯だからです。
月数十万円をいきなり狙う設計だと、制作より営業や差別化の壁が先に来ます。

わかりやすい例がYouTubeサムネです。
公開案件の観察では、第三者の集計ベースで概ね500〜2,000円/枚が目安とされる一方で、品質要件や継続発注を条件に1,500〜3,000円程度の案件も見つかります(注:このレンジは公開案件観察に基づく目安で、公式統計ではありません)。
参考計算(筆者が実務で狙いやすいレンジを併記):

  • 公開観察レンジ:500〜2,000円 × 10〜20枚 = 月5,000〜40,000円(保守的想定)
  • 実務狙い目レンジ:1,500〜3,000円 × 10〜20枚 = 月15,000〜60,000円(筆者の狙い目)

所要時間は1枚あたり30〜60分を見込むと現実的です。背景生成だけでなく、文字組み、書き出し、微修正まで含めた時間として計算してください。

SNS素材の定期納品も収益化しやすいのが利点です。たとえば1セット9枚で5,000円なら、

5,000円 × 月2社 = 月10,000円

です。
ここにスポットのサムネ案件やブログ用アイキャッチを足すと、月2万〜4万円台に乗せやすくなります。
筆者の感覚でも、SNS素材は単価の大きさより、毎月同じトーンで回してほしい需要のほうが強いです。
1回きりの大口より、継続で小さく積むほうが副業との相性がいいです。

ツール費の回収も計算しやすいのが利点です。必要に応じて追加GPU分を加味する形で採算を検討してください。

となり、その月のBasic料金はここで回収しやすい計算です。
以降は追加GPUを使わない範囲なら利益が残りやすく、Draft Modeでラフ出しを増やせるV7はこの回収効率とも相性がいいです。

💡 Tip

収益の初速は「高単価案件を当てること」より、「30〜60分で納品できる型を1つ作ること」で決まります。サムネ、SNS素材、ブログアイキャッチのどれか1つで作業手順が固まると、月1〜5万円の再現性が上がります。

クラウドソーシングやスキル販売サービスを使う場合は、受け取り額も少し下がります。
たとえばココナラの販売手数料は税込22%なので、10,000円で売れたサービスの手取りは約7,800円です。
CrowdWorksは契約金額10万円以下の部分が20%、Lancersは16.5%です。
つまり、表示価格だけでなく、実際の手残りまで見て単価を決めないと、思ったより薄利になります。
だからこそ、初心者の目標が月10,000〜50,000円というのは妥当です。
小さく黒字化しやすく、作業の型と実績が育つレンジでもあります。

MidjourneyでGPU時間を無料でもらう方法(Fast HourボーナスをGET!) blogcake.net

始める前の準備|料金プラン・Web版/Discord版・必要スキル

料金プラン

最小コストの目安としては、Help Centerで案内される Basic Plan が約月10ドルという記載があるケースが多く、まずはこの金額を「学習費兼、試作費」として見ておくと判断しやすいのが利点です。

V7ではDraft Modeが使えるので、この初期費用の考え方と相性がいいです。
Draftでまず大量に方向性を見て、当たりだけを仕上げるほうがGPUの消耗を抑えやすいのが利点です。
公式は Draft Mode を「通常生成より10倍速い」と案内しており、複数の実測レビューでは4枚グリッドが概ね10秒台で返ると報告されています。
ここでも公式表記と実測の出典を分けて記述すると読者の誤解を避けられます。

Web版とDiscord版の違い

Midjourneyは今はWeb版でも利用可能で、以前のようにDiscord前提で考えなくてよくなっています。
初心者が最初に触るなら、筆者ははっきりWeb版を推します。
画面上で生成履歴や選択中の画像を追いやすく、誤操作が少ないからです。
実際、初学者向けの案件ではWeb版UIのほうがレビュー返しも早く、どの案を採用するかの確認もスムーズでした。

一方で、Discord版には今でも使い道があります。
コマンドやショートカットに慣れると、連続生成や細かい操作のテンポが出しやすく、量産向きです。
筆者も、枚数を多く回すときや細かな試行を一気に進めたいときはDiscordを併用します。
つまり、入口はWeb版、慣れてきたらDiscordも使うという順番がいちばん無理がありません。

違いをざっくり整理すると、Web版は直感的で操作負荷が低く、Discord版はやや学習コストがある代わりに一部機能や操作の自由度で有利です。
ここでいう「一部機能差」は、日常的な副業用途で致命的というより、使い込むほど差が見えてくるタイプです。
最初のうちは、その差を気にするよりも、迷わず回せる環境を選ぶほうが成果につながります。

V7まわりでは、もうひとつ気にしておきたい点があります。
パーソナライズ関連の新機能について、複数の解説記事やコミュニティ報告では「初回に約200枚の画像評価が必要」とする実測報告が見られますが、公式ドキュメントで明確に「200枚」と記載されているかは確認できていません。
導入時は公式の案内(Personalization に関するヘルプや更新履歴)を参照しつつ、実務では初回に30〜60分の余白を確保しておく運用が安全です。

ℹ️ Note

初回はWeb版で生成、選別、保存まで一通り流し、量を回したくなった段階でDiscordを足すと、操作の迷いが減って覚えやすいのが利点です。

準備するスキルと環境

必要スキルは、デザイン職レベルの専門知識というより、目的から逆算して指示を組み立てる力です。
Midjourneyのプロンプトは日本語でも動きますが、再現性を重視するなら英語指示のほうが安定しやすいのが利点です。
とはいえ、最初から難しい英作文は不要で、被写体、構図、光、色、雰囲気を短く切って整理するだけでも十分変わります。
目的の明確化と具体化、反復調整がプロンプト設計の基本であり、これはMidjourneyでもそのまま通用します。

副業で使うなら、プロンプト力と同じくらい、カラーベーシックと視認性の基礎が欠かせません。
たとえばYouTubeサムネなら、背景がどれだけきれいでも文字が埋もれると仕事としては弱いですし、Instagram用なら余白の取り方や中央寄せの感覚で納品物の完成度が変わります。
Midjourneyは素材を強くしてくれますが、見せ方の判断までは自動化してくれません。

環境面では、特別な高性能PCがなくても、ブラウザ中心で進められるのは強みです。
案件化を前提にするなら、生成後に仕上げるための画像編集ツールは併用したほうが運用しやすいのが利点です。
たとえばPhotoshopやCanvaのように、文字入れやトリミング、圧縮を書き出せる道具があると納品品質が安定します。
ここで必要になるのが、PNG、JPEG、WebPの違いや、長辺ピクセルの考え方です。
YouTubeサムネなら1280×720の16:9、Instagramなら1:1や4:5を前提に、用途ごとにサイズを切り替えられるだけで実務では強いです。

筆者が見ていて伸びやすい人は、生成枚数を増やす人より、先に納品条件を言語化できる人です。
「クリックされやすいサムネにしたい」「女性向けでやわらかい配色にしたい」「EC画像で文字を置く余白を残したい」といった目的がはっきりしていると、プロンプトも絵の選定も早くなります。
英語優位ではあるものの、日本語で使い方を整理した情報も増えているので、最初の壁は以前より低いです。
副業として小さく始めるなら、ツールの深掘りよりも、速く試作して、使える案だけを整えるという発想のほうが結果に直結します。

プロンプト戦略の概要  |  Generative AI on Vertex AI  |  Google Cloud Documentation docs.cloud.google.com

プロンプトで差をつける基本設計|副業向け5要素テンプレート

5要素テンプレの解説

副業でMidjourneyを使うとき、プロンプトの差はそのまま納品物の差になります。
ここで効くのが、主題・用途・スタイル・構図・比率/パラメータの5要素で分けて考える方法です。
感覚で一文を書くより、この5つをスロット化したほうが、修正にも強くなります。

筆者は現場で、先に「何を描くか」よりもどこで使うか、どの媒体に載るか、どのサイズで見られるかを固めることが多いです。
この順番にすると、リテイク率が下がります。
特に効くのがテキスト配置の余白です。
ビジュアル単体ではきれいでも、タイトルを乗せた瞬間に崩れる画像は副業案件では使いにくいからです。

5要素を分解すると、考え方はこうです。

まず主題は、誰を描くのか、何を描くのかです。
たとえば「女性」だけでは弱く、「20代のビジネスパーソン」「無地パッケージの化粧品ボトル」「都市の夜景を背景にしたノートPC」まで落とし込むと、生成の軸がぶれにくくなります。
副業案件では、主題が曖昧だとクライアントのイメージとズレやすいので、人物なら年齢感、職業感、表情、商品なら素材感や形状まで言葉にしたほうが安定します。

次に用途です。
ここが差別化の核で、単に「きれいな画像」を作るのではなく、どこで使う画像なのかを先に決めます。
YouTubeサムネなら視認性と余白が優先ですし、EC商品画像なら整然とした正面構図や無地背景が合います。
Instagram投稿なら単体の完成度だけでなく、シリーズとして並んだときの一貫性まで見ておく必要があります。
目的を先に明確にする考え方はプロンプト設計の基本であり、画像生成でもそのまま有効です。

スタイルは、質感や世界観の指定です。
「おしゃれ」「高級感」だけでは人によって解釈が違いすぎます。
matte finish、editorial photography、minimalist branding、high contrast、soft natural lightのように、見た目の手触りが想像できる言葉に置き換えると精度が上がります。
副業では、スタイル指定が弱いと「なんとなくAIっぽい絵」で止まりやすいのが利点です。
逆に、ここが具体的だと、同じ主題でも一気に案件向けの見た目になります。

構図では、視点、距離、被写体の配置を決めます。
正面なのか俯瞰なのか、バストアップなのか全身なのか、中央配置なのか左右どちらかに寄せるのか。
この指定がないと、よくも悪くもMidjourney任せになります。
たとえばサムネ用なら「subject on left, empty space on right for text」のように余白を明示しておくと、後工程が楽です。
ECなら「front view, centered composition, plain background」で迷いが減ります。

比率/パラメータは、実務で軽く見られがちですが、欠かせません。
アスペクト比は用途に直結します。
YouTubeサムネなら16:9が基本で、YouTube Helpでも16:9、1280×されています。
Instagramならフィードで1:1や4:5、ストーリーズやリール系のカバーなら9:16が前提です。
ここに加えて、品質やバージョン、Seedのような再現性に関わる指定も入れておくと、シリーズ制作や修正対応で強くなります。

実務では、次のような雛形にしておくと回しやすいのが利点です。

テンプレ雛形 「主題」+「用途」+「スタイル」+「構図」+「比率/パラメータ」+「留意点」

たとえば、「20代女性のビジネスパーソン、YouTubeサムネ用、bold typographyが合うhigh contrastなeditorial style、上半身で左配置、右側に文字用余白、16:9」という形です。
留意点には「文字を置く前提」「背景は単純化」「ブランドロゴは入れない」など、案件特有の条件を入れます。
こうしておくと、あとで用途だけ差し替えて別媒体へ横展開しやすくなります。

曖昧語の置換リストとNegative設計

プロンプトでありがちな失敗は、曖昧語をそのまま使うことです。
「かっこいい」「おしゃれ」「かわいい」「高級感」は便利そうに見えて、実際にはブレの原因になりやすいのが利点です。
作る側の頭の中には絵があっても、モデルにはその解像度が伝わっていません。

たとえば「おしゃれなバナー」と書くより、「minimal layout, matte texture, muted beige and charcoal, refined editorial look」と置き換えたほうが、見た目の方向性が揃います。
「かっこいい」なら、bold typography、cinematic lighting、sharp shadows、high contrastあたりに分解できますし、「かわいい」なら、pastel tones、soft lighting、rounded shapes、playful compositionのように分けられます。
ここ、すごく大事で、感情語を視覚語に変換するだけで再現性が一段上がります。

用途から逆算すると、使うべき具体語も変わります。
YouTubeサムネなら、小さく表示されても目に入ることが大事なので、high contrast、bold subject separation、clean background、space for headlineのような言葉が効きます。
EC商品画像なら、front-facing、symmetrical composition、plain white background、clean shadows、product-focusedが相性いいです。
SNS投稿では、シリーズで並んだときの統一感が価値になるので、consistent palette、signature accent color、repeatable compositionのような指定が使いやすいのが利点です。

不要要素の除外も、品質と権利の両面で欠かせません。
Midjourneyは強い絵を出してくれる一方で、余計な文字、謎のロゴ、不要な装飾が混ざることがあります。
そこで使うのがnegative promptの設計です。
入れ方はシンプルで、「入れたいもの」を盛るだけでなく、「入れたくないもの」を明示します。

副業用途でよく使う除外指定は、次の発想で整理すると扱いやすいのが利点です。

  1. 品質ノイズを外す

extra fingers、distorted hands、blurry details、messy background、low readabilityのように、崩れやすい要素を先に切ります。

  1. 実務ノイズを外す

text、watermark、logo、frame、borderなど、納品物に不要な要素を除外します。
文字入れは後からデザインツールで行うほうが安定しやすいのが利点です。

  1. 権利リスクを外す

famous character style、specific brand logo、celebrity likenessのように、連想されやすい方向を避けます。
正直に言うと、副業ではここを曖昧にしたまま進めると、後で使いづらい素材になりやすいのが利点です。

negativeは長ければいいわけではなく、案件で困るものを先に切るのがコツです。
サムネなら「文字化け」「背景の情報過多」、ECなら「反射の暴れ」「複数商品化」、SNSなら「シリーズで色味が揃わない原因」を潰していくイメージです。

💡 Tip

プロンプトは「足す言葉」と「引く言葉」をセットで考えると、見た目の完成度が安定します。主題を強くするだけでなく、不要な装飾やノイズを抑えることで、案件向けの画像になりやすいのが利点です。

ChatGPT併用ワーク

プロンプト設計で手が止まりやすい人ほど、ChatGPTを言語化の補助役として使うと進みやすいのが利点です。
画像そのものを作るのはMidjourneyでも、要件を整理して英語寄りの指示文にするところはChatGPTが得意です。

使い方は難しくありません。
まず日本語で、案件の条件をそのまま書き出します。
たとえば「YouTubeサムネ用。
20代女性の在宅ワーカー。
右にタイトルを置く余白が必要。
明るいが子どもっぽすぎない。
青系ベース。
清潔感重視」のように、目的と制約を日本語で置きます。
そこからChatGPTに、Midjourney向けに短く分解してもらうと、主題、用途、スタイル、構図、negative候補が整理されます。

この工程の良さは、自分の頭の中にある曖昧な好みを、実務で使える言葉に翻訳できることです。
筆者も、「なんとなく上品」「女性向けだけど甘すぎない」のような依頼文を受けたときは、そのままMidjourneyに入れるより、いったんChatGPTで言い換え候補を出します。
すると、soft neutral palette、clean editorial composition、subtle luxury、natural skin tonesのように、視覚として扱える単語に変換しやすくなります。

もうひとつ便利なのが、用語辞書化です。
案件を回していると、自分がよく使う表現が見えてきます。
たとえば「清潔感」はclean light、minimal background、soft shadowに置換する、「高級感」はmatte texture、deep contrast、premium packaging lookに置換する、というふうに自分用の辞書を作っておくと、毎回ゼロから考えずに済みます。
副業は制作時間そのものより、考える時間の削減が利益率に効きます。

パラメータ選定の半自動化にも相性がいいです。
ChatGPTに「YouTubeサムネ、Instagramフィード、EC商品画像の3用途で、それぞれ合うアスペクト比、構図、negativeの考え方を整理して」と頼めば、用途ごとのテンプレ草案をすぐ作れます。
そこに自分の案件でよく使うスタイル語を足していけば、実務向きのひな型になります。

この工程の良さは、公式が Draft Mode を通常より10倍速いと説明している点と合致しています。
ユーザーレポートでは4枚グリッドが10秒台で返るとの実測報告が複数ありますが、秒数は環境や利用状況で変わるため「目安」として扱ってください。
最初から完璧な英語プロンプトを作るより、短い案を複数回して当たりだけ精密化するほうが作業効率は向上します。

このあと用途別サンプルに入る前提として、テンプレは次の形で持っておくと展開しやすいのが利点です。
「用途:○○、主題:○○、スタイル:○○、構図:○○、比率/パラメータ:○○、negative:○○、留意点:○○」 この形なら、サムネ、EC、SNSで必要な情報の抜け漏れが起きにくく、ChatGPTにもそのまま渡せます。

売れる成果物を作る手順|Step 1〜5

Step 1 需要の確認

最初にやることは、作ることではなく売れている依頼の形を観察することです。
ここ、すごく大事で、需要を見ないまま作り始めると、見た目は良くても「案件としては使いにくい画像」になりがちです。
副業で回しやすい入口は、クラウドワークス、ココナラ、SNSの募集投稿で、直近の「サムネ」「商品画像」「SNS素材」の案件を10件ほど見るやり方です。
時間の目安は30分で十分です。

見るポイントは、単価、納期、用途、修正回数、禁止事項です。
単価は公開価格だけでなく、継続前提か単発かで見え方が変わりますし、納期は「翌日」「3日以内」のような表現に案件の温度感が出ます。
禁止事項には、そのまま制作ルールが表れます。
たとえば有名キャラクター風、ブランドロゴの使用、既存広告の強い模倣、テキスト入れ込み前提の画像で余白不足といった条件は、案件文の中で頻繁に見つかります。

この段階では、平均単価を厳密に出そうとしなくて大丈夫です。
公開案件ベースの市場観察では、サムネイルは500〜2,000円程度の帯が目立ちやすい一方で、継続案件や品質要件の高い仕事はもっと上に伸びます。
大切なのは「今どんな依頼が、どんな条件で、どんな困りごとを含んでいるか」をつかむということです。
筆者はこの観察で、クライアントが欲しいのは派手な一枚ではなく、納期内に使えて差し替えしやすい実用品だと毎回感じます。

記録はシンプルで構いません。
「用途」「希望サイズ・比率」「納期」「NG」「求める雰囲気」の5列くらいでメモすると、次の工程でそのまま使えます。
YouTubeなら16:9のサムネ運用が基本で、推奨解像度は1280×720ですし、Instagramなら1:1、4:5、1.91:1あたりが前提になります。
こうした仕様を先に頭に入れておくと、あとで良い絵が出ても比率違いで作り直す無駄が減ります。

つまずきやすいのは、募集文のキーワードだけを追ってしまうということです。
「おしゃれ」「高級感」「インパクト強め」といった言葉は便利ですが、そのままだと抽象的すぎます。
案件文の本質は、誰向けで、どこに載り、何を伝え、何を避けたいかにあります。
需要確認は営業のためだけでなく、プロンプト設計の土台づくりでもあります。

Step 2 参考収集

需要が見えたら、次は参考の集め方で精度を上げます。
ここでの目的は、真似することではなく、見た目のルールを言語化することです。
時間は30分ほどで、競合アカウント、既存ブランド、同カテゴリの広告や投稿から5〜10件集めれば十分です。

見るべきなのは、色、余白、文字の可読性、背景処理です。
たとえばYouTubeサムネなら、強い主題に対して背景を整理しているものが多いですし、ECの商品画像なら被写体の輪郭が読みやすいように反射や影の処理が整っています。
SNS素材は逆に、1枚単体の強さより、並んだときの統一感が効きます。
筆者は参考を見ながら「この画像は何が効いているのか」を必ず分解します。
青系で爽やかに見えるのか、余白が広くて高級感が出ているのか、背景がぼかされて主題が立っているのか、そこまで言葉にすると再現しやすくなります。

このとき注意したいのが、参照イメージに引っ張られすぎるということです。
参考収集がうまくいかない人ほど、気に入った1枚を強く追いかけてしまい、構図も配色も似た方向に寄っていきます。
回避策は、1枚を正解にしないということです。
たとえば5〜10件を並べて、「共通点」と「差分」に分けて見ると、模倣ではなく要件抽出になります。
共通点は案件の勝ち筋、差分は提案の余地です。

文字の可読性も、この段階で見ておくと後が楽です。
Midjourneyで文字まで完結させようとすると、見栄えが良くても実務では崩れやすいので、画像側はテキストを置けるスペースを確保する前提で考えたほうが安定します。
特にサムネやバナーは、背景に情報を詰め込みすぎると、あとで文字を載せた瞬間に弱くなります。
参考収集では「どこが空いているか」まで観察すると、ただの雰囲気集めで終わりません。

Step 3〜5 生成→変種→納品調整

初稿生成では、いきなり完成を狙わず、V7のDraft Modeで荒く速く回すのが効率的です。
公式は Draft Mode を「通常生成より10倍速い」としていますし、複数のユーザー実測では4枚グリッドが概ね10秒台で返るとされています(実測は環境依存なので目安扱い)。
30〜60分の枠で20〜40案ほど出し、良いものだけ保存しましょう。

筆者はこの工程を「試作はDraftで荒く速く、仕上げだけ丁寧」と切り分けるようになってから、1案件あたりの時給が上がる手応えが強くなりました。
最初から細部まで詰めると、外れ案に時間を使ってしまいます。
逆にDraftで数を見て、使える方向だけ残すと、仕上げに使う集中力を節約できます。

次にやるのが、Seedを固定したバリエーション作成です。
ここでは色替えとレイアウト替えを中心に、3パターンほど用意すると実務で扱いやすいのが利点です。
考え方としては「用途にぴったり合う本命1案」と「差し替えしやすい予備2案」です。
クライアントはゼロから選びたいというより、軸がある中で選びたいことが多いので、主題がブレた3案より、方向性の揃った3案のほうが納品として強いです。

この段階で起きやすい失敗は、可読性を犠牲にして見た目だけ派手にしてしまうということです。
特にサムネやSNS告知画像では、背景の情報量が増えるほど文字が負けます。
回避策は単純で、文字を置く場所の明度差を確保すること、主題の背後を少し整理すること、色替えをするときもコントラストを先に見るということです。
きれいな画像と、使える画像は少し違います。

仕上げではEnhanceやアップスケールを使いますが、使いどころは絞ったほうが破綻しにくい設計です。
筆者は、粗密の最終調整、ノイズ低減、肌や金属、ファブリックの質感統一のような“表面の整え”に限定して使うことが多いです。
構図そのものをここで直そうとすると、別物になってしまいやすいからです。
良い初稿ができている前提で、質感を揃えるために使うと安定します。

納品形式の調整では、解像度、比率、余白、テキスト配置用スペースを見直します。
YouTubeサムネなら1280×720の16:9が基本ですし、ファイルサイズ上限は2MBです。
Instagram向けなら1:1、4:5、ストーリーズなら9:16を前提に、重要要素が中央寄りに収まる形にしておくと使い回しがしやすくなります。
形式は、写真調で容量を抑えたいならJPEG、透過やくっきりした要素を残したいならPNG、Web掲載中心で軽さを優先するならWebPという使い分けが実務向きです。

権利面でのつまずきも、この終盤で見落としやすい判断材料になります。
生成途中では気づきにくくても、有名ブランドを連想させるロゴ風ディテールや、既視感の強いモチーフが紛れ込むことがあります。
回避策は、納品前に主題の周辺ディテールを目視で確認し、ロゴ、記号、特徴的な意匠が混ざっていないかを見るということです。
副業では、生成できたことより、安心して使える状態に整っていることのほうが価値になります。

ℹ️ Note

再現しやすい流れは、需要確認で条件を拾い、参考収集で見た目のルールを言語化し、Draft Modeで一気に試作し、Seed固定で変種を作り、Enhanceは仕上げにだけ使う形です。速い工程と丁寧な工程を分けると、品質も時給も両立しやすくなります。

副業用途別の実践例|サムネ・商品画像・SNS運用素材

用途別にプロンプトを切り替えるときは、「何をきれいに見せたいか」ではなく「どこで使われる画像か」から逆算するとブレにくい設計です。
YouTubeサムネなら一瞬で意味が伝わること、EC商品画像なら商品そのものが主役であること、Instagramのシリーズ投稿なら並んだときの統一感が価値になります。
ここ、すごく大事で、同じMidjourneyでも用途ごとに重視する要素が変わります。

サムネは視線誘導の明暗差を先に作ると反応が変わりやすいのが利点です。
逆にEC用途は、雰囲気よりも製品の輪郭と影を丁寧に指定したほうが修正が減ります。
見た目の派手さより、「使う側が後工程で困らない画像」に寄せると、副業案件では強いです。

YouTube/ブログサムネのプロンプト

YouTubeやブログのサムネで最優先になるのは、視認性とコントラストです。
小さく表示された瞬間に主題が読めるか、文字を置く余白があるか、人物やモチーフがどこに配置されているかで印象が決まります。
比率は16:9を前提にして、被写体は中央か、三分割の強点に置くと安定します。
文字入れは画像生成後に行う前提で、背景側に広めの余白を確保しておくのが実務向きです。

サムネでありがちな失敗は、背景が凝りすぎて主役が埋もれるということです。
特にクリックを取りにいく画像は、色数を増やすより、暗部と明部の差をはっきり作ったほうが強く見えます。
筆者は人物の顔や商品を明るく、その背後を少し落として指定することが多いです。
こうすると、あとで太めの文字を載せても負けにくくなります。

重視したい要素は、強い明暗差、主題の即時認識、文字用の余白、16:9の画面設計、一枚で伝わる感情です。
ブログのアイキャッチでも考え方はほぼ同じですが、YouTubeより煽りを弱めて、内容との整合性を優先すると使いやすくなります。

使いやすいプロンプト例は次のような形です。

dramatic YouTube thumbnail, Japanese businesswoman surprised expression, strong contrast lighting, dark blue background, clear negative space on the right for headline text, subject placed on left third, cinematic composition, bold visual hierarchy, 16:9 --ar 16:9 --stylize 150 --v 7 --no extra people, cluttered background, unreadable text, watermark, logo

blog eyecatch image, minimalist laptop workspace, bright subject and darker background for eye guidance, clean composition, center-right empty space for title, high readability, modern editorial style, white and navy palette, 16:9 --ar 16:9 --v 7 --no messy desk, too many objects, text, icons, low contrast

YouTube thumbnail for finance topic, confident Japanese man in suit, sharp rim light, red and black high contrast background, subject centered, space above and right for large Japanese text, attention-grabbing, polished, realistic --ar 16:9 --stylize 200 --v 7 --no distorted hands, duplicate face, crowded scene, small objects, watermark

この用途では、「誰をどこに置くか」と「文字をどこに置くか」をセットで書くと、出力の当たり率が上がります。
視認性を取りたいときは、high readability strong contrast negative space for headline text あたりの語が効きやすいのが利点です。

💡 Tip

サムネ用プロンプトでは、見栄えの指定よりも「left third」「space on the right」「bright subject, darker background」のような配置と明暗の指定が効きます。クリックされる画像は、

EC商品・広告イメージのプロンプト

EC商品画像や広告イメージは、サムネと違って「主役が明確で、仕様が伝わり、差し替えしやすい」ことが欠かせません。
比率は1:1か4:5が使いやすく、背景は無地や単色寄りにして、商品そのものの輪郭をきれいに見せる構図が安定します。
余白は広めに取ったほうが、販売サイトや広告運用側でコピーを載せやすくなります。

ここでは世界観よりも、製品の形、素材感、影の処理が優先です。
筆者はEC案件で、輪郭の曖昧さや接地影の不自然さがあると修正依頼が増えやすいと感じています。
逆に「clean silhouette」「soft shadow on surface」「accurate product edges」のように書いておくと、商品単体としての完成度が上がりやすいのが利点です。
広告寄りの見せ方をするとしても、まずは商品がちゃんと立って見えることが前提になります。

重視要素は、被写体主役、単色または無地背景、自然な接地影、広めの余白、比率1:1または4:5、色ブレの少なさです。
広告バナーの素材として使うなら、商品を中央に置きすぎず、上下左右のいずれかにコピー余白を残す指定も入れると後工程が楽になります。

プロンプト例はこうです。

premium skincare bottle product shot, centered hero product, clean white seamless background, accurate bottle silhouette, soft natural shadow on surface, minimal luxury lighting, generous negative space, ecommerce ready, square composition --ar 1:1 --v 7 --stylize 80 --no text, label distortion, extra products, busy background, watermark

wireless earbuds advertising image, matte black case, single-color light gray background, crisp product edges, realistic reflection, soft drop shadow, subject dominant, space at top for copy, modern commercial photography, 4:5 --ar 4:5 --v 7 --no hand model, extra accessories, clutter, typography, logo

organic coffee package hero image, product as main subject, warm beige solid background, visible front-facing packaging, clean contour, subtle shadow, premium ad visual, large empty area on upper left for campaign text, polished studio look --ar 4:5 --stylize 100 --v 7 --no messy props, duplicate package, unreadable package details, watermark

ECでは、背景を凝らしすぎると商品ページ一覧で埋もれやすくなります。
広告イメージでも、世界観カットと単体カットは分けて考えたほうが実務向きです。
まずは商品単体で使えるカットを押さえ、その後に演出カットを作る流れのほうが、案件として納めやすいのが利点です。

Instagram素材のプロンプト

Instagram投稿素材は、単発の一枚よりシリーズで並んだときの一貫性が価値になります。
フィード用なら1:1か4:5が基本で、ブランドカラー、余白、枠線、光の方向、質感のトーンを固定しておくと、複数枚を並べても世界観が崩れません。
ここでは一枚のインパクトより、9枚並べたときの統一感のほうが欠かせません。

特に運用案件では、毎回ゼロから作るより「このアカウントはこの色、この余白、この雰囲気」というルールを先に決めたほうが早いです。
たとえば、ベージュと深緑の2色だけを使う、被写体は中央寄せ、上下に同じ余白を取る、フレームを細く入れる、といったルールです。
Midjourneyは単発の美しさが出やすい一方で、放っておくと毎回少しずつ違う絵になりやすいので、シリーズ運用では固定条件を多めに入れるのがコツです。

重視要素は、カラーパレット固定、スタイル統一、枠や余白ルールの明記、ブランド世界観、1:1または4:5の再現性です。
投稿テンプレート寄りに作るなら、中央に主題、上下に余白、背景は淡色で情報量を抑える構成が扱いやすいのが利点です。

プロンプト例を挙げます。

Instagram post series for wellness brand, consistent beige and sage green color palette, minimalist editorial style, centered subject, soft natural light, clean margins, subtle thin border frame, calm premium mood, square feed design --ar 1:1 --v 7 --stylize 120 --no random colors, busy background, text, watermark, inconsistent lighting

Instagram carousel cover, lifestyle beauty theme, warm neutral palette, elegant composition, large top and bottom whitespace for future typography, unified visual language, soft shadows, premium social media asset, 4:5 --ar 4:5 --v 7 --no neon colors, clutter, extra props, logo, chaotic layout

Instagram content series for café brand, fixed terracotta and cream palette, handcrafted cozy mood, consistent camera angle, centered hero item, clean frame, repeatable template feeling, polished branding visual, 4:5 --ar 4:5 --stylize 90 --v 7 --no mixed styles, dark moody lighting, crowded scene, text artifacts

Instagram運用で見落としやすいのは、単体では良いのに、並べた瞬間に統一感が消えるということです。
そこを防ぐには、プロンプトの中に毎回同じ核を入れる必要があります。
consistent color palette unified visual language repeatable template feeling のような言い回しは、シリーズ感を出したいときに便利です。
世界観を守りたい副業案件では、この「毎回少し似ている」を意図的に作れるかどうかが、そのまま継続率に関わってきます。

Midjourney vs DALL·E 3 vs Stable Diffusion|副業での選び方

3ツール比較表

副業で使う画像生成AIは、単純な優劣というより「どこで時間を削れるか」「どこで見た目の単価を上げられるか」で選ぶと失敗しにくい設計です。
Midjourney、DALL·E 3、Stable Diffusionはそれぞれ強みの出方が違います。
Midjourneyは一枚の完成度で勝ちやすく、DALL·E 3は指示を詰める工程が速く、Stable Diffusionは案件に合わせて作り込むほど強くなります。

項目MidjourneyDALL·E 3Stable Diffusion
強み高品質・美的統一感が強いプロンプト忠実性が高く、同テーマのバリエーション出しがしやすい自由度・カスタマイズ性が高い
副業向き用途YouTubeサムネ、広告クリエイティブ、SNSビジュアル、コンセプト画像指示通りの構図違い、文言差分前提のたたき台、シーンの微修正独自モデル運用、LoRA活用、ControlNet前提の細かな調整案件
導入しやすさWeb版で始めやすいChatGPT経由で使いやすい学習コストが高め
コスト感公式Help Center参照の料金体系ではBasicが月10ドル有料寄り無料運用の余地あり
差別化ポイントスタイルの完成度と雰囲気の揃い方指示の通りやすさとバリエーション生成深い制御、拡張性、独自性の作り込み

Midjourneyの強さは、やはり見た瞬間の「ちゃんとして見える」確率の高さです。
特にサムネ、広告、SNS用のビジュアルでは、光の回り方、素材の質感、全体のトーンがまとまりやすく、提案段階でも通りやすい印象があります。
V7ではDraft Modeが入り、試作を高速で回しやすくなったのも副業向きです。
筆者もラフを何本か出して方向性を決めるときは、10秒台で4枚返ってくる感覚が助かっています。

DALL·E 3は、クライアントの言語指示をそのまま絵に落としたい場面で扱いやすいのが利点です。
たとえば「机の左側を空けたい」「人物を少し右に寄せたい」「同じテーマで3案ほしい」といった細かな調整を詰める工程で時短になります。
副業では、最初の打ち合わせ段階で認識ズレを減らせるのが大きいです。
筆者はバナーの文言差分を詰めるとき、まずDALL·E 3で構図や余白感を固めて、その後に光と質感だけMidjourneyで整える流れにすると、安定して見栄えがまとまります。

Stable Diffusionは、初心者が最初の一枚を早く売るためのツールというより、案件の癖に合わせて武器を育てていくタイプです。
LoRAやControlNetを使えるようになると、特定の絵柄、ポーズ、構図、商品見せのルールを深く制御できます。
学習コストは高いのですが、ニッチ案件や再現性重視の継続案件では長期的なROIが出やすいのが利点です。
特に「他の人と似た絵になりたくない」という悩みが強くなってきた段階で、Stable Diffusionの価値が一気に上がります。

用途別のおすすめ

副業でどれを選ぶかは、作りたい絵ではなく、受けたい仕事から逆算したほうが実務では強いです。
ここ、すごく大事で、同じ「画像生成AIを使う副業」でも、サムネを量産したいのか、広告用の一枚を磨きたいのか、独自スタイルで継続受注したいのかで最適解が変わります。

YouTubeサムネやSNSビジュアル、広告クリエイティブのように、一目で良く見えることが最優先ならMidjourneyが有力です。
見出し文字を後乗せする前提でも、背景の空気感や被写体の存在感が出しやすく、世界観の統一もしやすいからです。
特に継続案件では、毎回ゼロから考えるより「このブランドっぽい見た目」を再現できることが価値になります。
Midjourneyはその美的統一感が強く、提案の通過率を上げやすいのが利点です。

指示通りの絵を速く揃えたい案件にはDALL·E 3が向いています。
バナーのサイズ違い、同テーマの色違い、背景違い、余白の取り方違いといった差分制作では、忠実性の高さがそのまま時短になります。
副業では、凝った一枚を作る時間より、認識合わせの往復を短くするほうが利益に直結することも多いです。
そういう意味でDALL·E 3は、クライアントワークの前半工程に噛み合います。

独自モデルや細かな制御が必要な案件ならStable Diffusionです。
たとえば、特定テイストの量産、ポーズ固定、構図固定、ラフを元にした精密調整などは、MidjourneyやDALL·E 3だけだと詰め切れない場面があります。
Stable Diffusionは使いこなすまでが重い反面、競合との差がそのまま技術資産になります。
案件単価を少しずつ上げていくフェーズでは、この差が効いてきます。

感覚的に整理すると、早く売り物にしやすいのはMidjourney、早く意図を合わせやすいのはDALL·E 3、深く作り分けやすいのはStable Diffusionです。
副業初心者が最初の一本を作るならMidjourneyが入りやすいですが、修正対応が多い仕事ではDALL·E 3のほうが疲れにくいこともあります。
Stable Diffusionは、すぐ元を取るというより、継続案件やニッチ市場で優位を作るための選択肢として見ると納得しやすいのが利点です。

ℹ️ Note

サムネやSNS素材で「まず見た目の説得力が必要」ならMidjourney、構図や余白の認識合わせを短くしたいならDALL·E 3、他の制作者と差がつく再現性を持ちたいならStable Diffusion、という切り分けが実務では扱いやすいのが利点です。

併用でROIを最大化するコツ

実務では、1ツールに全部やらせるより、工程ごとに役割を分けたほうがROIが上がりやすいのが利点です。
特に副業は作業時間が限られるので、「どの工程で悩むか」を減らす設計が効きます。

筆者が安定しやすいと感じているのは、構図確定はDALL·E 3、最終の美観はMidjourney、ニッチ案件や厳密調整はStable Diffusionという分担です。
DALL·E 3でレイアウトの方向性や余白バランスを固めると、クライアントとの認識合わせが早いです。
その後、Midjourneyで光、素材感、空気感を乗せると、一気に「仕事の絵」っぽくなります。
さらに、特定の絵柄や形状ルールを崩したくない案件ではStable Diffusionを使うと、修正の戻りが減ります。

この順番が効く理由は、各ツールの得意不得意がきれいに分かれているからです。
Midjourneyは美しいのですが、最初から細かい条件を全部飲ませようとすると、方向修正に時間がかかることがあります。
DALL·E 3はその前段で「何をどう置くか」を決めるのに向いています。
Stable Diffusionは、そのさらに先で「この案件だけの再現性」を作り込む役割です。

副業では、ツール単体の性能より修正回数を減らせるかが利益に直結します。
1回で完璧に出す発想より、DALL·E 3でズレを減らし、Midjourneyで単価の上がる見た目に寄せ、必要な案件だけStable Diffusionで精密化するほうが、結果として短時間で納品物の質が上がります。
特に広告系やSNS運用素材では、たたき台の速さと仕上げの美しさが分かれているだけで、作業のストレスが減ります。

Midjourneyを選ぶべき場面を一言で言うなら、見た目の説得力が受注率や継続率に直結する仕事です。
サムネ、広告、SNSビジュアルのように、第一印象で評価される成果物では、Midjourneyの高品質さと美的統一感がそのまま武器になります。
そこにDALL·E 3とStable Diffusionを必要な分だけ足していくと、単なる「AIで作れる人」ではなく、「短時間で売れる見た目まで持っていける人」に近づきます。

案件の探し方・出品先と価格設定

プラットフォーム比較の要点

案件の取り方は、大きく分けると CrowdWorks・Lancersのような受託型ココナラのような定額出品型SNS経由の直依頼 の3つです。
どれが一番いいかではなく、どの段階の人に合うかで選ぶのが実務的です。

CrowdWorksは公式のワーカー向け手数料ページで、契約金額の10万円以下の部分が20%、10万円超〜20万円以下の部分が10%、20万円超の部分が5%です。
Lancersは公式FAQで受注者のシステム手数料が16.5%です。
ここだけ見るとLancersのほうが手数料は軽めですが、受託型の本質は手数料差よりも「案件説明に対して提案で勝つ」ことにあります。
用途、納品形式、修正範囲を先に読んで合わせにいける人は、受託型で実績を作りやすいのが利点です。
特にYouTubeサムネやSNS用画像は、依頼文の時点で困りごとが見えやすいので、初心者でも勝ち筋を作れます。

一方、ココナラはサービスを先に並べて待つ形です。
ココナラ公式ヘルプでは通常サービスの販売手数料が税込22%なので、表示価格のまま考えると手残りが薄くなります。
ただ、その代わりに「YouTubeサムネ専門」「Instagram投稿画像9枚セット」「女性向けやわらかトーン専用」のように、商品として見せやすいのが強みです。
受託型が営業寄りなら、定額出品型は商品設計寄りです。
実績がまだ少ない時期でも、見せ方が揃っていればココナラは入口になりやすいのが利点です。

SNS経由の直依頼は、手数料がないぶん利益率は高いですが、信用の作り方が少し違います。
いきなり売るより、制作事例を見せながら「この人は納品まで想像できる」と思ってもらう必要があります。
InstagramやXで、同じ媒体向けの作例をまとめて見せると反応が変わりやすいのが利点です。
特にサムネ、アイキャッチ、SNSバナーは、1枚の完成度より「このテイストで継続して揃えられるか」が見られます。

プロフィールとポートフォリオは、媒体別に3作ずつくらいに絞ると伝わりやすいのが利点です。
YouTube向けなら16:9のサムネ、ブログ向けならアイキャッチ、Instagram向けなら1:1や4:5の投稿素材というように、用途ごとに分けます。
作品数を増やすより、一貫性があること、納品形式が明記されていることのほうが効きます。
たとえばYouTubeなら1280×720の16:9、Instagramなら1080px基準で作るなど、媒体仕様に沿っていると実務感が出ます。
そこに「AI利用・権利確認済」と一言入れておくと、依頼側の不安が減ります。
ここ、すごく大事で、AI画像そのものよりも「安心して使える状態に整理されているか」が受注率に響きます。

Midjourneyを使った試作の速さも、営業面では武器になります。
V7のDraft Modeは公式に通常生成より10倍速いとされていて、筆者の体感でも4枚グリッドのたたき台が短時間で返ってくるので、提案前の方向出しに向いています。
受託型ではラフの初速、定額出品ではサンプルの量産、SNSでは世界観の連投と、使いどころがはっきりしています。

価格表

成果物初期の価格帯目安含める内容値上げの目安
YouTubeサムネイル公開観察: 500〜2,000円 / 実務狙い: 1,500〜3,000円3案提示、1案納品、修正1回実績3件後に20〜30%
ブログ・メディア用アイキャッチ800〜2,000円方向性3案、1案仕上げ、修正1回実績3件後に20〜30%
SNS素材セット(9枚)5,000〜8,000円トーン統一、サイズ調整、修正1回実績3件後に20〜30%

※「公開観察」はクラウドソーシング等の公開案件を元にした目安レンジです。
筆者の実務上の狙い目は右側の「実務狙い」帯域で、品質要件と継続発注を見込める案件に適用しやすいのが利点です。
この価格帯にしている理由は、相場観だけでなく作業の切り分けがしやすいからです。
筆者は「3案提示して、採用された1案を納品、修正は1回込み」という形にしてから、満足度が安定しました。
依頼側は比較できる安心感があり、制作者側はどこまでが基本料金かを守りやすいのが利点です。
しかも、採用されなかった追加案を別用途でも使いたいと言われることがあり、そのときに追加料金を設定しやすいので、単価の底上げにもつながります。

価格を上げるタイミングも、感覚ではなく基準を持っておくとぶれません。
おすすめは3件の実績がついた時点です。
同じ媒体で3件こなすと、構図、文字を置く余白、納品形式の詰まりやすい点が見えてきます。
その段階で20〜30%上げると、受注率を落としすぎずに利益率を改善しやすいのが利点です。
たとえばサムネ2,000円なら2,400〜2,600円、SNS素材セット6,000円なら7,200〜7,800円という考え方です。

手取りまで含めた見方も必要です。
たとえばココナラは販売手数料が税込22%なので、10,000円のサービスでも受取は7,800円です。
価格表を作るときは「表示価格」ではなく「受け取った後に何時間分の作業になるか」で見たほうがブレません。

ツール費の回収感も数字で見るとわかりやすいのが利点です。
公開情報や解説記事の観察では Basic が約月10ドルとされることが多く、『Fast GPU Time』の追加購入が二次情報で1時間あたり約4ドルと報告される場合があります。
ただしこれらは二次情報の「目安」であり、利用にあたっては必ず公式Help Centerで当該時点の表記を確認してください。
たとえば月20枚を1枚2,000円で受けると、売上は40,000円です。
そこからツール費や手数料を差し引いた上で採算を見立てると良いでしょう。

💡 Tip

料金や速度に関する表記は更新されやすいため、実際に課金を始める前に公式Help Centerの「料金」「Subscription/Manage」ページを確認して、執筆時点の表記と差がないかをチェックしてください。 [!NOTE] 価格表に「納期」「修正回数」「納品形式」を一緒に書くと、安さではなく条件の明確さで選ばれやすくなります。

提案文テンプレと成約率のコツ

提案文は長文より、1スクロールで要点が入っているほうが強いです。
特にCrowdWorksやLancersでは、依頼側が複数の提案を短時間で見比べるので、読む負担を減らしたほうが通りやすいのが利点です。
構成は 用途理解 → 制作手順 → 納期 → 修正回数 → 禁止領域順守 → 簡易ラフ提示 の順が使いやすいのが利点です。

実際には、こんな流れだとまとまりやすいのが利点です。

「YouTubeのビジネス系動画向けサムネとして拝見しました。
CTRを意識して、人物の視線誘導と文字を載せやすい余白を先に設計します。
制作は方向性の異なる3案をご提示し、採用1案を仕上げて納品します。
初稿は◯日、修正は1回まで基本料金内で対応します。
既存キャラクター模倣や権利上問題のある表現は避け、AI利用素材として権利確認済の範囲で制作します。
参考として、近いトーンの簡易ラフイメージも添付します。

この型の強いところは、うまさを語る前に「依頼を理解している」ことが伝わる点です。
Google CloudのVertex AIドキュメントでも、プロンプト設計は目的を明確にして、具体化し、例を添えて反復するのが基本になっていますが、提案文もほぼ同じです。
何を作るかが先で、どうすごいかは後です。

成約率を上げるコツは、抽象的な表現を減らすということです。
「高品質に対応します」より、「YouTubeなら1280×720前提で文字置き余白を確保します」のほうが伝わります。
「SNS素材作れます」より、「Instagramの1:1と4:5でトンマナを揃えます」のほうが仕事の姿が見えます。
媒体仕様を会話に入れられるだけで、ただAI画像を出す人ではなく、使う前提で作る人に見えます。

筆者がよくやるのは、提案の段階で簡易ラフを1枚だけ添えるやり方です。
完成品を無料で配るのではなく、方向性の確認用として粗めのラフを出します。
MidjourneyのDraft Modeを使うと、この初速が作りやすいのが利点です。
数秒単位でたたき台が返ってくる感覚なので、提案用の見せ絵を作る負担が軽いです。
ラフがあると依頼側の返信が具体的になりやすく、認識のズレも減ります。

逆に、成約しにくい提案は「何でもできます」「安くやります」で終わるものです。
安さだけで取った案件は、修正が増えた瞬間に利益が消えやすいのが利点です。
用途理解、手順、ルールの順に短く整理されている提案のほうが、継続前提の依頼につながりやすいのが利点です。
特にAI画像案件は、禁止領域を先に明記しているだけで信頼感が上がります。
著作権グレーを避ける姿勢は、派手ではないですが、継続率に効きます。
特にAI画像案件では、受注時に禁止領域(著名キャラクターの模倣・著名人の肖像・既存ブランドへの過度な寄せなど)を先に明記しておくと、依頼側からの信頼が上がり、継続発注につながりやすくなります。
著作権グレーの回避姿勢は派手ではないですが、長期的な継続率に明確に効きます。

よくある失敗と回避策

権利・法務まわり

AI画像の副業でいちばん危ない失敗は、見た目の完成度ではなく、権利まわりで止まるということです。
特に起きやすいのが、有名キャラクターや著名人に寄せた表現をそのまま通そうとしてしまうケースです。
依頼文に「○○風で」「△△っぽく」と書かれていると、つい近づけたくなりますが、ここを安易に受けると納品後に使えない画像になりやすいのが利点です。
実務では、固有名詞そのものだけでなく、髪型、衣装、配色、決めポーズまで揃うと危うく見えます。

回避策として効くのは、プロンプトの段階で禁止領域を先に固定するということです。
筆者は著名人名や作品名を入れないのはもちろん、「そっくり」「in the style of」的な依拠表現も避け、Negative側に固有名詞や連想の強い特徴を入れることがあります。
そのうえで、構図はオリジナルにして、モチーフは抽象化します。
たとえば「人気アニメの主人公のような強い表情」ではなく、「逆光、低い視点、鋭い目線、暖色のエネルギー表現」のように要素へ分解すると、雰囲気の方向性は保ちつつリスクを下げやすいのが利点です。
ここ、すごく大事で、似せる仕事ではなく使える仕事に変換する感覚です。

もうひとつ見落とされやすいのが、納品後の利用条件が曖昧なまま進むということです。
プラットフォーム側もAI生成物の細かな統一基準を強く打ち出していないケースがあり、案件ごとの取り決めが実質のルールになります。
だからこそ、受注時点で「何に使う画像か」「どこで公開されるか」「人物や既存IPへの近似を求めていないか」を制作条件として言語化しておくと、後工程の揉めごとが減ります。
法務は難しい話に見えますが、現場では「最初に危ない似せ方をしない」がいちばん効きます。

品質・可読性

生成画像がきれいでも、文字が読めなければ商品としては弱いです。
YouTubeサムネや広告クリエイティブでありがちなのが、背景を作り込みすぎて、あとから文字を載せる場所がなくなる失敗です。
Midjourneyは絵としての密度が高く出やすいので、余白を指定しないと、主役も背景も全部強い画面になりがちです。
その結果、デザイナー側で文字を置くと視線が散ってしまい、クリック率以前に情報が入らないサムネになります。

これを防ぐには、画像生成の前に文字スペースを設計しておくのが近道です。
筆者は「右上に2〜3行の見出しが入る余白」「左側3分の1はシンプルな背景」のように、寸法感と文字量を先にプロンプトへ入れます。
媒体仕様に沿って、YouTubeなら16:9の1280×720前提で考え、重要要素を端に寄せすぎないように作ると、あとでレイアウトが安定します。
背景も、情報量の多い小物を増やすより、色面と光で整理したほうが文字は圧倒的に乗せやすいのが利点です。

曖昧語の多用も品質を落とす原因です。
「いい感じ」「おしゃれ」「高級感」だけでは、生成結果の振れ幅が大きくなります。
Google CloudのVertex AIドキュメントでも、プロンプトは目的を明確にし、具体化し、反復で詰めるのが基本とされていますが、画像生成でも同じです。
筆者は参照語彙をある程度固定していて、「高級感」なら素材感、光の向き、色温度、背景処理に分解します。
ここでChatGPTを補助に使って、抽象語を具体語へ言い換えると、出力の再現性が上がります。

実務で効いたのは、納品前の縮小確認をルール化したということです。
筆者は「縮小確認で読めない文字はNG」と決めてから、リテイクが3割ほど減りました。
等倍で見ると整って見える画像でも、一覧表示やスマホ表示のサイズに落とすと一気に弱くなることがあります。
縮小した状態で見出しが瞬時に読めるか、主役が埋もれていないかを見るだけで、完成度の判断が現実的になります。

💡 Tip

文字を後乗せする案件では、「絵を作る」より先に「文字が置ける面を作る」と考えたほうが、納品物としての完成度が安定します。

コスト・時間管理

副業で利益を削りやすい失敗は、1枚を完璧にしようとしてGPU時間と作業時間を使いすぎるということです。
公開情報ベースでは追加のFast GPU Timeが二次情報として1時間あたり約4ドルと報告されていますが、実際の課金体系は公式の最新表記を確認してください。
無計画に回すほど利益が薄くなるため、Draft→仕上げの流れでGPU消費を管理しましょう。

Seedを固定せずに毎回ゼロから振るのも、地味にコストを増やします。
良い構図が出たら、そこを起点に調整したほうが、似た条件の比較がしやすくなります。
副業では「どれだけ偶然の神絵を引くか」より、「同じ方向性をどれだけ再現できるか」のほうが欠かせません。
Seed固定は派手ではないですが、修正依頼への対応速度に直結します。

納品形式の不一致も、時間を食う典型例です。
画像そのものは良くても、比率、解像度、拡張子、色空間の認識がずれていると、書き出し直しや作り直しになります。
YouTubeなら16:9の1280×720、ファイルサイズは2MB以内という前提がありますし、Instagramは1:1、4:5、9:16で見え方が変わります。
受注時に媒体と仕様を聞き取り、形式を先に固定しておくと、終盤の手戻りが減ります。
正直に言うと、制作よりこの詰めの甘さで時間を失う場面は多いです。

時間管理の面では、案件ごとに「試作」「採用案の磨き込み」「書き出し」の工程を分けて見積もると安定します。
前のセクションで触れたように、3案提示して1案を仕上げる形は、コスト管理とも相性がいいです。
Draftで複数案を短時間に出し、反応のいい案だけへGPU時間と集中力を投下する。
この流れにしておくと、作業の天井が見えやすく、安値受注で消耗しにくくなります。

商用利用・著作権・会社員の税務で失敗しないための注意点

商用利用の前提と限界

Midjourneyは有料プランの利用中であれば商用利用が可能とされる扱いですが、ここは「使っていい」と「法的に安泰」は別だと捉えるのが実務的です。
サービス規約上の利用許諾と、生成画像そのものに著作権が成立するか、第三者の権利侵害にならないかは同じ話ではありません。
特に日本を含め、AI生成物の権利関係はまだ解釈が揺れやすく、案件でお金を受け取るなら、規約だけ見て安心しきるのは危ないです。

副業で扱いやすいのは、抽象背景、オリジナルのコンセプトビジュアル、商品や人物を直接特定しないイメージ素材のように、既存の強い権利物から距離を取れる領域です。
逆に避けたいのは、著名キャラクターそのもの、特定ブランドの世界観を強くなぞった広告風クリエイティブ、実在の著名人に酷似したビジュアルです。
こうした依頼は見た目のインパクトが出やすい一方で、納品後に差し替えや取り下げが発生しやすく、単価以上に手間と信用を削ります。
ここ、すごく大事で、クライアントが「○○っぽく」と軽く言ってきた案件ほど、受ける側が先に線を引かないと事故になりやすいのが利点です。

筆者は受注時のオーダーシートに、AI生成であること、禁止領域、再利用可否を最初から明記しています。
たとえば「著名キャラクター・著名人・既存ブランドの模倣は行わない」「納品物の再利用範囲は案件単位で定める」といった書き方です。
これを入れるようになってから、あとで「思っていたテイストと違う」「別案件でも同じ系統を独占したい」といった揉め方が減りました。
商用利用の可否そのものより、どこまでを作る仕事なのかを先に言語化するほうが、現場では効きます。

著作権・依拠性のリスク管理

生成画像で特に揉めやすいのが、著作権そのものより依拠性が疑われる状態です。
つまり、ゼロから作ったつもりでも、既存作品を土台にしたと見える近さがあると、説明が苦しくなります。
著名キャラクターの衣装、固有の配色、特徴的な構図、ロゴに近い意匠が重なると、「偶然です」では通りにくくなります。
トレースしていなくても、既存画像を見本として寄せすぎた時点で、実務では危険信号です。

生成画像の法的位置づけには、まだ不確実な部分があります。
どこまでオリジナリティが認められるのか、どの程度の人間の創作的関与が必要か、似ている画像が出たときに依拠をどう判断するかは、案件の内容によって争点が変わります。
だからこそ、クライアントワークでは「納品後にどこまで再利用できるか」「万一の差し替え時にどこまで対応するか」を、最初に合意しておくのが現実的です。
筆者は利用範囲の条文を堅くしすぎるより、再利用の可否、独占の有無、差し替え時の扱いをシンプルに書くほうが運用しやすいと感じています。

他人の画像やプロンプトの扱いにも注意が必要です。
公開されている作例を参考にすることと、そのまま無断転用することは別です。
SNSやコミュニティで見つけた画像をアップロードして寄せる、販売中の素材のプロンプトをほぼそのまま使う、他人のポートフォリオ画像をベースに量産する、といった行為は危ないです。
AIだから加工されるので大丈夫、という理屈は通りません。
とくにクライアント案件では、元ネタの存在が発覚すると、成果物の価値より信用失墜のほうが大きくなります。

⚠️ Warning

安全寄りに運用したいなら、「固有名詞で寄せる」のではなく、「要素に分解して再設計する」が基本です。たとえば有名作品名を入れる代わりに、色、光、材質、構図、感情トーンへ分解すると、似せすぎを避けながら方向性を作れます。

会社員の税務・就業規則チェック

会社員が副業でAI画像を扱うときは、著作権と同じくらい就業規則が欠かせません。
副業そのものが許可制なのか、申請制なのか、業務内容に制限があるのかで、動き方が変わります。
見落とされがちなのが成果物の権利帰属で、勤務先の職務発明や業務成果に近い扱いが広く定義されている会社だと、会社業務と連続して見える制作物は揉めやすいのが利点です。
デザイン職や広報職、制作部門の人は特に境界が曖昧になりやすいので、会社の業務と副業のテーマ、制作時間、使用機材を切り分ける意識が欠かせません。

勤務先のPC、会社契約のAdobe製品、社内で入手した素材、取引先から知り得た情報を副業に流用するのは避けるべきです。
これは単なるマナーではなく、守秘義務や資産の私的利用の問題に直結します。
会社の休憩時間に会社PCでMidjourneyを触る、といった軽い感覚の運用でも、後から説明しづらくなります。
副業の制作環境は、アカウント、端末、素材保管先まで分けておくほうが安全です。

税務では、会社員の副業所得が年間20万円を超えると確定申告が必要という整理が一般的です。
ここで見るのは売上ではなく所得なので、受け取った金額そのままではありません。
ツール代や必要経費を差し引いたあとにどうなるかで判断することになります。
AI画像副業は1件ごとの金額が小さくても、積み上がると想像より早く届きます。
単発のサムネ案件やSNS素材の納品が続くと、年後半で慌てやすい領域です。

住民税の扱いも見逃せません。
会社に副業を知られたくないと考える人は多いですが、その文脈でよく話題になるのが住民税の納付方法です。
一般には、確定申告時に住民税を普通徴収にできるかが論点になります。
ただし、実際の運用は自治体側の取り扱いも絡むので、少なくとも「申告の有無」だけでなく「住民税がどう処理されるか」まで見ておかないと、会社員の副業では意図しない形で気づかれることがあります。
税務は後回しにすると修正が面倒なので、案件管理とあわせて、売上と経費を分けて記録しておくほうが実務では楽です。

最初の1週間アクションプラン

1週間の到達ゴール

この1週間で目指すのは、Midjourneyを触って終わりではなく、1つの用途に絞って、見せられる作例を作り、実際に売る行動まで進むことです。
おすすめは、最初に「サムネ」「商品画像」「SNS素材」のどれか1つだけ選ぶやり方です。
用途を固定すると、プロンプトの改善点も見えやすくなりますし、ポートフォリオや提案文も一気に作りやすくなります。

Day 1は、MidjourneyのBasicで登録して、公式Help Centerの料金ページで最新プランを確認しつつ、まず狙う用途を1つ決めます。
いきなり全部やろうとすると、作例の方向性が散りやすいのが利点です。
最初の1週間は「何でも作れる人」より「この用途なら任せられそうな人」に見えるほうが強いです。

Day 2〜3では、その用途専用のテンプレプロンプトを3本作ります。
ここは英語が得意でなくても問題なくて、日本語で要件を書き出してからChatGPTで英語化し、さらに具体語へ寄せる流れが使いやすいのが利点です。
たとえば被写体、構図、光、色、文字載せ前提の余白といった要素に分解すると、出力の再現性が上がります。
同時に参照画像も5件集めて、雰囲気を言語化しておくと、あとで修正が速くなります。

Day 4は、V7のDraft Modeで20案を一気に試作します。
Draft Modeは試行錯誤向きで、4枚グリッドが10秒台で返ってくる感覚なので、ここで時間をかけすぎないのがコツです。
20案全部を磨く必要はなく、上位3案だけ仕上げに回せば十分です。
用途に合わせた納品比率で書き出すところまで進めてください。
サムネなら16:9、Instagramフィード素材なら中央配置を意識した縦長寄り、という具合に最初から出口を合わせると、実務っぽさが出ます。

Day 5は、ベスト1枚をポートフォリオ化します。
用途別に3枚並べられるなら、その見せ方でも大丈夫です。
ただ、画像だけを置くより、「どういう意図で作ったか」「どんなプロンプト設計だったか」「禁止領域を避けて制作したこと」を短く添えたほうが信頼につながります。
ここは見栄え以上に、依頼者が安心して頼めるかが欠かせません。

Day 6は、CrowdWorksかココナラで需要を見て、最低でも1案件に応募するか、1サービスを出品します。
価格は強気に始めるより、下限レンジから反応を見るほうが進めやすいのが利点です。
実際、最初は単価よりも「何に反応が集まるか」のほうが欠かせません。
案件文を読むと、依頼者が欲しいのはアート作品ではなく、使い道が明確な画像だとはっきりわかります。

Day 7は、応募や出品で得た反応をもとに、提案文テンプレを更新します。
反応が薄かったら画像の問題とは限らず、用途の書き方、納品イメージ、修正対応の見せ方で変わることが多いです。
筆者は週1回の振り返りでテンプレを1項目だけ改善する形にしてから、提案の通りやすさが上がった実感があります。
大きく作り直すより、1か所ずつ直すほうが続きます。

💡 Tip

1週間のゴールは「完璧な作家になること」ではなく、「同じ用途で来週も回せる型を1本持つこと」です。

次の2週間でやること

次の2週間では、1週目で作った型を横展開せず、同じ用途で磨くのが効率的です。
サムネを選んだならサムネのまま、商品画像を選んだなら商品画像のまま進めてください。
ここで別用途に広げると、改善点がぼやけます。
副業初期は、幅より再現性のほうが価値になります。

まずやることは、1週目に作ったテンプレプロンプト3本のうち、反応がよかった1本を軸に改良版を作るということです。
語順、構図指定、色指定、余白の取り方などを少しずつ詰めると、出力のブレが減っていきます。
目的を明確にして、具体化し、反復テストで改善する流れが基本とされていますが、Midjourney副業でもこの考え方はそのまま使えます。

営業面では、翌週は同じ用途で3案件に応募するか、SNSで告知投稿を出して反応を見る動きが現実的です。
応募文も毎回ゼロから書かず、「何を作れるか」「どう納品するか」「どこまで対応するか」をテンプレ化して、案件ごとに少し調整するだけにします。
制作と営業を両方続けるには、文章の省力化がです。

出品型を選ぶなら、ココナラで用途を絞ったサービス名にして、サンプル画像と制作フローを見せる形が相性いいです。
応募型で進めるなら、CrowdWorksで募集文のキーワードを見ながら、相手が急いでいるのか、継続発注したいのか、修正前提なのかを読み取って提案文を変えます。
どちらでも、実績ゼロの時期は「作れること」より「やり取りしやすそう」に見せるほうが通りやすいのが利点です。

この2週間で欲しいのは、大きな売上よりも、テンプレ、作例、提案文の3点セットを固めるということです。
ここができると、週5〜10時間の中でも回しやすくなりますし、案件ごとの迷いが減ります。
副業は勢いより、毎週少しずつ改善できる仕組みのほうが、結果的に強いです。

この記事をシェア

田中 美咲

フリーランスのグラフィックデザイナー兼動画クリエイター。Midjourney・Stable Diffusionを活用したAI画像生成副業とYouTubeショート動画のAI制作に精通。

関連記事

AI画像・デザイン

Canvaは、デザイン未経験からでも副業の形にしやすいツールです。SNS投稿、バナー、チラシ、資料、簡易動画まで作れるうえ、AIと豊富なテンプレートを使えば、週5〜10時間の作業で月1〜5万円を狙える感触はあります(以下の収入目安は筆者の経験と想定時給に基づく試算であり、案件内容や地域・手数料で変動します)。

AI画像・デザイン

画像生成AIを副業で使うなら、「きれいに作れるか」だけでなく、料金・商用利用の考え方・回収しやすさまで一緒に見ないと、ツール選びでかなり遠回りします。この記事では2026年3月時点のMidjourney、DALL·E系(ChatGPT画像生成)、Stable Diffusionを、

AI画像・デザイン

平日夜と週末だけでサムネイル制作を副業にしたい人向けに、CanvaやAdobe Expressを使って最初の受注まで進む流れをまとめました。筆者の体感では、短期集中でサンプルを複数作り、1週間前後で提案を出すことは狙える目安です(個人差があります)。

AI画像・デザイン

AI画像を使ったグッズ販売は、在庫を持たずに始めやすい副業ですが、実際に動き出すと「SUZURIとBASEのどちらから始めるべきか」で手が止まりがちです。この記事では、MidjourneyやStable Diffusionで作った画像をどう商品化し、どこで売ると無理なく続けやすいのかを、