生成 AI で度々紛糾するが

  • 1二次元好きの匿名さん24/11/15(金) 16:33:28

    仕組みはほぼ誰も理解してないのである!!

    ……自分も大まかにしか知らんのできちんと理論と実装に踏み込みたいがいかんせん要素技術が多すぎる
    せめて拡散モデルの実装くらいは手を動かしてやってみないとなという思い

  • 2二次元好きの匿名さん24/11/15(金) 16:36:36

    意外と難しくないよ
    Python知ってるならpytorch動かしながら勉強すれば
    ふんわりとはわかるようになる

  • 3二次元好きの匿名さん24/11/15(金) 16:37:17

    問題になってるのは技術の中身じゃなくて運用の仕方なんで

  • 4124/11/15(金) 16:39:29

    >>2

    そんなもんか

    pytorch こねこねしてやってみるか

    ニューラルネットワーク自体はわかるんだけど深層学習以降手を付けてない口でね

    MNIST の手書き数字認識が精一杯

  • 5124/11/15(金) 16:40:31

    >>3

    技術をブラックボックスにして議論するとよく誤謬を持ってしまうのでそういうのは避けたい

  • 6二次元好きの匿名さん24/11/15(金) 16:41:40

    >>4

    mnistをもうやってるなら勉強すればすぐ理解できるようになるよ

    がんばれ

  • 7124/11/15(金) 16:43:49

    最終的には Stable Diffusion の論文と Glaze の論文読んで Glaze はあんま意味ないですよというのを論理立てて言えるようになりたい
    感覚的に効果はなさそうというのはわかるんだが

  • 8124/11/15(金) 16:48:40

    とりあえずゼロから作るディープラーニングはやっておくか
    以前他の言語でやろうとしたら詰まってできなかったので大人しく Python でやる

  • 9二次元好きの匿名さん24/11/15(金) 16:54:41

    データセットの中身が不明瞭だからなんとなく説明しにくいんだよな。

  • 10二次元好きの匿名さん24/11/15(金) 16:55:56

    >>7

    意味ないというか積み重ねることで生成ΑΙ学習した際にノイズ効果を出すチリツモ方式なんじゃないだろうか


    「変なの入りですよ」とか「非公式LoRA使用してますよ」みたいなアピールさせるのが精一杯ではないだろうか

  • 11124/11/15(金) 16:57:34

    >>10

    多分画風が認識できない程度のノイズいれるくらいしかできないんじゃないかな……という予想

    これも解像度あげちゃえば突破できちゃうしね

  • 12二次元好きの匿名さん24/11/15(金) 16:59:17

    >>11

    理論ではなく実証の記事で見たけど

    多少崩れるぐらいで効果は薄いようです

  • 13二次元好きの匿名さん24/11/15(金) 16:59:43
  • 14124/11/15(金) 17:02:32

    >>13

    見た見た

    でも「見た目で変わんないでしょ」って言っても納得あんま得られない気もしている

    まあ結局見た目の話なのだが

  • 15二次元好きの匿名さん24/11/15(金) 17:22:55

    このレスは削除されています

  • 16二次元好きの匿名さん24/11/15(金) 17:23:18

    学習なしのカラAIをタダで配布してるサイトねーかな~…とは思っている
    パブリックドメイン系の画像数枚放り込めば仕組みがぼんやり分かるだろうし

    個人的に一番引っかかってるのが「最初の学習に使ったデータは丸ごとコピーに当たるのではないか?」という点だし
    一度画像を覚えさせてノイズから彫刻方式で作り出してるというなおさらぼんやりした理解だからなあ…

  • 17124/11/15(金) 17:32:30

    >>16

    ブラウザ上で実行できるおもちゃみたいな奴あってもいいかもね

  • 18二次元好きの匿名さん24/11/15(金) 18:00:25

    >>11

    ノイズを消して絵を作るシステム対策にノイズ入れるの火を消すために火をつけるみたいな感覚になるんだよな

  • 19二次元好きの匿名さん24/11/15(金) 18:03:30

    >>18

    ノイズというよりは2つの画像を重ねているように見せかけているというイメージな気がする

  • 20124/11/15(金) 19:11:34

    >>19

    なるほどなあ

    画像って縮小したりブロックに分けて学習したりするから効きそうではある

  • 21二次元好きの匿名さん24/11/15(金) 19:31:20

    AIって人間からはわからないブラックボックスが生まれるものじゃないの?

  • 22二次元好きの匿名さん24/11/15(金) 19:34:59
  • 23124/11/15(金) 19:35:00

    >>21

    そんなことはない

    仕組みわからないんだったらそもそも実装はできないよ

  • 24二次元好きの匿名さん24/11/15(金) 19:36:12

    AIの判定条件が全て分かるなら
    それはAIなのか?

  • 25二次元好きの匿名さん24/11/15(金) 19:36:46

    (このスレ画ホントに毎日見かけるな…)

  • 26二次元好きの匿名さん24/11/15(金) 19:37:16

    自分の絵を素材にAI生成はやってみたいが数足りないか

  • 27124/11/15(金) 19:37:21

    >>24

    ミクロの動きはわかるけどそれを組み合わせていってできるカオスは解析できないって感じかな

  • 28124/11/15(金) 19:38:13

    >>26

    Lora の追加学習だったら 30 枚くらいで行けると聞いた

  • 29二次元好きの匿名さん24/11/15(金) 19:48:29

    >>23

    もちろん学習させるのは人間だし、学習の設定をするのも人間だから、そこまではわかるだろうけど、学習結果のアウトプットの根拠ははっきりしないんじゃなかったっけ

    冪等性も担保しにくいとか聞く

    あんまり詳しくないけど

  • 30124/11/15(金) 19:50:05

    >>29

    それはそうね

    そんでもって >>27 な感じだと思う

    量子力学と古典物理学はわかるんだけどその間が解決してないのとにてるのかな

  • 31二次元好きの匿名さん24/11/15(金) 19:52:47

    法整備しろとはよく言われているが、どういう法やねんってよくわかってない

  • 32二次元好きの匿名さん24/11/15(金) 20:01:05

    学習前のニューラルネットワークってのは何十何百のランダムな数値の行列みたいなもので、
    学習データを何かしらの方法でベクトルにして、ベクトルに行列を全部掛けて正解のベクトルと同じになるように行列の各要素を調節する、っていう作業がよく言われる学習
    根拠がわからないっていうのは行列の要素の調節が一通りではないから。
    もし一つの行列でベクトルを変換するなら解は1通りだけど何十何百という数の行列なら解はとてつもない自由度を持っていて、その自由度の中で上手くいっている、ということしか人間にはわからない

  • 33二次元好きの匿名さん24/11/15(金) 20:04:22

    単一行列で変換しても解は一通りじゃないか
    ごめんぼんやりとしたイメージだったわ

  • 34二次元好きの匿名さん24/11/15(金) 20:15:18

    >>29

    冪等性を担保しにくいというか、学習過程でランダマイズするから同じ条件でも毎回結果は変わる

    学習データをシャッフルしたりステップによって重み変えたり

  • 35二次元好きの匿名さん24/11/15(金) 20:17:17

    ウォーターマークは効果薄いよ!って流れみたいだけど例えば今の文字が中心のウォーターマークに意味がないとしても、ゲイビとかデカいtntnみたいなAI画像生成者が嫌がりそうな画像を透かしにしたら生成画像に影響って出るのかな?

  • 36124/11/15(金) 20:19:14

    >>35

    感覚だけど厳しいでしょ

    それをやるためにはみんなおんなじ透かし入れないと意味ない気がするし、でもおんなじ透かしなら前処理で取り除けるし……

  • 37二次元好きの匿名さん24/11/15(金) 20:21:57

    実際AIがどんなものなのかもわかってない中で争うから混沌化してる所あるよなあ…

  • 38二次元好きの匿名さん24/11/15(金) 20:22:55

    そりゃあ使われる人は使ってる人より疎いだろうよ
    当然の話だ

  • 39124/11/15(金) 20:23:57

    >>37

    そうなのよね

    擁護側も反対派も仕組みはほとんどわかっとらんやんという感じで

    自分も画像にノイズ加えて逆過程を学習して〜くらいの曖昧な説明しかできないからしっかり学んでいこうという感じ

  • 40二次元好きの匿名さん24/11/15(金) 20:29:53

    ≻≻35
    皆がやれば効果あるかも?ってことは大雑把に美少女の画像を生成してる人たちには効果薄いけど特定の絵師に粘着してその絵師の絵柄を生成するために学習モデルに大量に読み込ませるような輩には効果あるってこと?
    同じ画像使ったら簡単に取り除かれるっていうけどそれが登校前に撮った投稿者のtntn(画像米に角度は変えてる)とかだったら簡単に取り除けないとかできそうじゃね

  • 41124/11/15(金) 20:31:57

    >>40

    角度変えてたら結局透かしに現れない単なるノイズにしかならなさそうだからね

    単一の画像でないと多分意味がない

    そして単一の画像だったら前処理で弾けるという

  • 42二次元好きの匿名さん24/11/15(金) 20:40:07

    >>41

    なるほど。

    正直剥がし無効やノイズ以下まで効果を下げれるようなウォーターマークが出るとは思えないから文言を無断転載反対だのAI反対だのじゃなくて「学習lolとしての使用が確認された場合生成者に●万円請求いたします」って形にした方がいいのかな。

    ポーズやキャラ程度じゃ効果薄くても絵柄読み込みで嫌がらせする輩を法廷に出すくらいは効かないかな?

  • 43124/11/15(金) 20:42:06

    >>42

    それは確実に効かない

    というか生成 AI の学習って切り貼りでは無いのでどの画像を学習させたのかなんてわからんて

  • 44二次元好きの匿名さん24/11/15(金) 20:51:38

    >>43

    ノイズとして文言を生成画像に出現させたいって意味じゃなくて、例えば某月の社長絵とか某神主の絵を本物そっくりに生成したとして明らかな絵柄の類似性が認められた場合元の作者の絵にこの文が描かれてたら著作権法とかで訴えられないの?っていう。

    そりゃ大雑把にきれいな絵が欲しくて生成させた絵は学習元分からないだろうけど上に貼ってあったサイトみたいに特定の絵柄を出すために意図的に食わせたら当然ログは残るし更に>>42の文句書いてたらそれをもとに訴えれそうだけどできんのか?

  • 45124/11/15(金) 20:54:08

    >>44

    法律の専門家でないからそこは断言できないけどそもそもその文句自体が効果無いんじゃないかなって

    「セールスマンお断り」の家にセールスマン訪ねて訴えられるかって話……なんだろうか

    法律も学ばないとダメね

  • 46二次元好きの匿名さん24/11/15(金) 20:56:00

    訴えられるけどそれは別に手描きでやっても訴えられるから
    わざわざ学習元とかログとか見る必要すらないと思うんだけどね
    著作権法で見る場合は手描きかAIかなんてどうでもいい

  • 47124/11/15(金) 20:56:43

    >>44

    ちなみに絵柄は著作権法で訴えられないし学習禁止とあっても無効だと思う

  • 48二次元好きの匿名さん24/11/15(金) 20:57:00

    絵柄真似絵師は大昔からいたけど人力だから許されてた部分は大いにあっただろうし現に人力やMADは目を瞑ってくれたのに違法AI声優はブチギレられてるあたり絵も絵柄パクリしてる生成者は法整備された瞬間真っ先に裁かれるんじゃねえかな。
    というか声明すら出さんアニメ、ゲーム、漫画関連企業は絵柄パクAIを舐め過ぎてる

  • 49二次元好きの匿名さん24/11/15(金) 20:57:17

    請求というのは自分が権利を独占していて他人は使えないものを他人が使った場合の話で学習素材にされない権利なんてものは存在しないんだから請求に意味は無い
    街中歩いて俺のこと見たやつは100万円払えって言ってるのと同じ

  • 50124/11/15(金) 20:57:46

    まああとこのスレは法律云々ってよりは生成 AI の仕組みを紐解いてきたいねって感じなのでよろしく

  • 51二次元好きの匿名さん24/11/15(金) 20:58:08

    「明らかな絵の類似性」を現状証明する手段がない
    というか恐らく存在できない
    それこそAIで検出ごっこは出来るだろうけど、裁判に出せるほど確たる信頼性を担保することが不可能に近いんじゃない?悪魔の証明みたいなものだし
    実用性の面で「10人の真犯人を逃すとも、1人の無辜を罰するなかれ」という日本の法の理念に反するので、恐らく机上の空論の域を出ない

  • 52二次元好きの匿名さん24/11/15(金) 20:59:10

    殺人鬼を批判するのに殺人の手口を知る必要などないからな

  • 53二次元好きの匿名さん24/11/15(金) 21:03:53

    類似性の証明なんて並べてそっくりだねで終わりじゃん

  • 54二次元好きの匿名さん24/11/15(金) 21:04:07

    結局パクりとパクられ側で解決してくださいよって話なんだよな

    パクられ側がいい迷惑?それはそう


    法律の話はスレ違いになってるからこれくらいにして

    Illustrious系が導入したNAIのこの論文ってつまりはどういうことなの?

    Improvements to SDXL in NovelAI Diffusion V3arxiv.org
  • 55二次元好きの匿名さん24/11/15(金) 21:06:06

    生成AIの学習を阻害する方法を探ってたつもりが法律の話になってしまって申し訳ない。

    調べて見たところ絵柄に著作権は確かにないけどキャラクターには著作権があるからオリキャラを勝手にエロ画像にされたり自作発言された場合は「キャラクターの著作権」って方向性が使えるようになるからそっち方面で攻めるしかないのかな。

    これ以上法の話ははスレチになっちゃうので良かったら叡智ニキたちが考えうる範囲でできそうな阻害方法あったら教えてください

  • 56二次元好きの匿名さん24/11/15(金) 21:06:28

    GPTくんが要約するとこう
    論文「Improvements to SDXL in NovelAI Diffusion V3」では、Stable Diffusionの拡張版であるSDXLを基盤とし、アニメ画像生成モデル「NovelAI Diffusion V3」を開発する際に行った改良点を詳細に説明しています。主な改良点は以下の通りです:

    v-Predictionパラメータ化:従来のε予測からv予測への移行を行い、数値的な安定性の向上や高解像度での色ずれの解消、サンプル品質の迅速な収束を実現しました。

    ゼロターミナルSNR(ZTSNR):ノイズスケジュールの最終段階で無限大のノイズレベルに達するように調整し、モデルが純粋なノイズから画像を生成できるようにしました。これにより、生成画像の明るさや色の一貫性が向上しました。

    高ノイズタイムステップからのサンプリング:高解像度画像生成時の一貫性を確保するため、最大ノイズレベルσ_maxを引き上げ、低周波数成分の信号を効果的に破壊することで、生成画像の品質を向上させました。

    MinSNR損失重み付け:各タイムステップの学習を難易度に応じてバランスさせるため、MinSNR損失重み付け戦略を採用し、低ノイズタイムステップへの過度な学習集中を防ぎました。

    これらの改良により、NovelAI Diffusion V3は、より高品質で一貫性のあるアニメ画像の生成が可能となりました。

  • 57124/11/15(金) 21:06:30

    >>54

    はえー

    なんか面白そうなことは書かれてるけど既存手法の仕組みがわかってないからどれだけ有効なのかわからんね

  • 58二次元好きの匿名さん24/11/15(金) 21:06:53

    つまりはどゆこと?

    この論文の「すごさ」を簡潔に言うと、以下の点に集約されます:

    1. 画像生成品質の劇的な向上
    より明るく自然な画像: v-PredictionやゼロターミナルSNR(ZTSNR)といった技術で、色や明るさの一貫性を改善。
    高解像度でもブレない: 特に高ノイズタイムステップからのサンプリングにより、解像度を上げても細部がしっかりと描かれる。
    2. 効率的な学習と安定性
    従来の学習プロセスでは低ノイズ領域(簡単な領域)に偏りがちだった問題を、MinSNR損失重み付けで解決し、モデル全体のバランスを取る。
    高ノイズの場面からでも質の高い画像を生成するため、モデルの初期状態から最終状態まで安定して高品質を保つ。
    3. 幅広い応用可能性
    この改善はアニメ画像生成に限らず、他の画像生成分野(リアル画像や特殊用途)にも応用可能。
    特にv-PredictionやZTSNRの導入は、生成モデル全般で性能を底上げできる汎用的な技術。
    結論:
    従来のStable Diffusionモデルに比べて「高品質」「効率性」「安定性」の3つを大きく改善し、アニメ画像生成という特殊分野でも最高峰の結果を実現した点が、この研究の「すごさ」です。単なる改良ではなく、基盤技術に革新をもたらしています。

  • 59二次元好きの匿名さん24/11/15(金) 21:08:28

    >>53

    裁判って子供の口喧嘩ちゃうぞ

  • 60二次元好きの匿名さん24/11/15(金) 21:19:09

    生成AIにオイラー法やらへウン法やらが使われてるってのがいまいち理解できんのよな
    数学的・物理学的な領域で微分方程式の近似とかをこいつらでやってた(というか、むしろ何なら精度低い側の手法)けども
    そのグラフの線形近似に使うような代物が何をどうすりゃ画像生成に使えるのかって部分が全然出てこなくてもやっとする

  • 61124/11/15(金) 21:22:03

    >>60

    生成 AI ってよりはニューラルネットワークじゃない?

    誤差逆伝播法やるときの自動微分で数値計算する時に使うみたいな

  • 62二次元好きの匿名さん24/11/15(金) 21:26:00

    そのうち1024x1024の領域も解析しつくされて
    ありとあらゆる理想通りの画像が生み出せる時代が来るかもしれないね

スレッドは11/16 09:26頃に落ちます

オススメ

レス投稿

1.アンカーはレス番号をクリックで自動入力できます。
2.誹謗中傷・暴言・煽り・スレッドと無関係な投稿は削除・規制対象です。
 他サイト・特定個人への中傷・暴言は禁止です。
※規約違反は各レスの『報告』からお知らせください。削除依頼は『お問い合わせ』からお願いします。
3.二次創作画像は、作者本人でない場合は必ずURLで貼ってください。サムネとリンク先が表示されます。
4.巻き添え規制を受けている方や荒らしを反省した方はお問い合わせから連絡をください。