AI組合圖片之評論。

Posted on Sat, Oct 8, 2022 時政評論 科技趣聞 NovelAI

💡

該文章包含R18的裸露或血腥圖像,請斟酌之。

Novel AI

有排無係度冇寫文了……其實都冇乜嘢就純屬懶。

最近 novelai.net 搞咗個image generation,dataset係來自danbooru啲圖,因而紅咗。

其實首先我哋可以睇下佢點先:

首先呢啲普通嘅爛大街單人像幾穩定下,容易出事嘅大概會係手。如果你生成大波妹 in loli嘅話,因為有點矛盾所以你會有啲個波唔合比例地出界之類。

食餅餅或者示威現場呢啲圖當然唔算大問題,但你見可能因為dangooru都喺毒L圖多,你見警察打人呢啲唔咁毒撚嘅嘢嘅圖就開始有多啲奇怪嘅details。

如果你抽象一點風景畫會幾好。

另一個小細節係,你會見打直嘅話普遍會正常,但打橫嘅話,你見啲人物四肢好容易飛,我諗主要問題係dangooru啲圖好多係Pixiv入面偷回來,而而家啲人就喺好多鍾意畫簡單嘅直圖……

至於點解都喺單人?因為唔係單人嘅話會咁……

好易會有啲奇怪嘢出來 or 變返單人圖片。要估理由都好好理解,因為input data就喺少呢啲,多嗰啲,所以就咁。

BTW,我課咗金用差不多嘅keyword生成咗大概近百張嘅圖,大概係咁:

可以總結就喺手容易出事,勁易變異。如果仲要飲茶嘅話就……

揀咗啲比較好嘅裸體……可以睇到手腳易出事,大波波容易出界變形,人體結構偶爾會奇怪……但呢啲已經好好了,因為呢啲唔係熟手技工兼放大檢視嘅話係分別不到的。縫合獸嗰啲反而易見到跟住踢走……亦可以見到,着衫嘅話反而容易掩飾人體比例嘅失衡。

所以,AI究竟喺乜?

有唔少人睇電影、睇荷里活、睇動畫/漫畫睇得多,把一些科幻作品套咗落現實,以為AI發展之後會發生智能叛變啊、或者AI取代人類導致失業率飆升嘅可能。但首先啦,AI而家仍然未有任何意識可言,你點劃條線,都好難定義一個AI有自我意識。係呢個前提之下,大家要瞭解嘅係,AI本身係個比較中立嘅存在,你比啲乜input佢,按咩條件filtering,就會出返對應嘅結果(當然會有一定隨機性)。而你嘅條件越具體、越仔細,就會相對出搞少隨機嘅結果;反過來只要虛無空泛點,出來嘅結果變動就會越大。好似你講明出白蘿,咁佢就喺白蘿。你唔指定,佢可以係金蘿、紅毛御姐等等。但寬鬆有寬鬆好處,就喺AI會「參考」更多唔同嘅作品去拼貼,組織出來嘅作品可能因為多參考而顯得成品嘅問題會少一點點。

AI究竟喺乜?其本質其實就喺input something,經過處理,試加filter,就output。AI和傳統演算法嘅分別就喺加咗神經網絡後,佢可以有類似學習然後歸類嘅功能,可以透過A和B上面tag咗蘋果去推測C、D或者E喺咪蘋果。AI係工具,係中立嘅存在,有些人會批評某某演算法歧視黑人之類,但佢哋無意識到歧視黑人嘅唔係演算法,而係選擇feed咩資料嘅人。 而在繪畫呢個範疇裏面,AI作畫其實比較似係拼貼——好啦,或者直接啲講,學習繪畫本身就喺仿畫、拼貼、然後逐步學習得夠多最終可以拼貼得足夠複雜繼而得出個人特色。最後段對AI來講比較難,但經過學習後嘅仿畫和拼貼,正是AI所擅長嘅地方。正如頭先所講,AI可以從已經學習咗嘅內容入面推導未睇過畫作入面類似嘅內容,而AI受惠於強大嘅電腦性能可以把呢個循環做得更密集,更快,所以可以快速生成大量不同嘅類似但又微妙不同嘅結果。

而單以繪畫呢個範疇而言,如果你試過玩並且自己有認得不同畫師嘅畫作嘅話,某些關鍵字出來嘅特定畫作你可能會認出特定畫師嘅畫作所拼湊出來的。例如頭髮可能來自原本一個A畫師嘅頭髮,然後把顏色置換了,髮飾又置換了B畫師的髮飾,然後可能再把C畫師嘅馬尾拼貼上去。聽落好似好簡單,但呢個拼貼實際上可能可以更複雜,一幅畫可能拼貼了數以百計幅畫組合而成,然後有些再按使用者要求微調(AI唯一可以有創意嘅部分大概是顏色了XDD),這就是而家嘅AI嘅現況,亦係AI嘅極限:

分解歸類、組合拼接。

咁版權點?

因為NovelAI採用偷圖網站Dangooru嘅圖片作為data,所以有好多人會開始嘈版權問題。好,先講結論係,而家多數嘅國家嘅法律根本無法處理,因為拼貼太多、太散,要證明抄襲嘅%太分散,好難證明抄襲,法律上不可行。而如果直接禁止拼貼抄襲嘅話,坦白講反而會害死整個行業,因為創作甚至畫學習本身就喺學習唔同嘅嘢,拼貼啱用嘅部分,然後最終內化成自己嘅「知識」。

另外一種比較提及較多嘅觀點會話不如禁止AI繪畫,但實務上點禁止?唔通你去要求公開作品要保留psd文件或者流程圖?咁對AI來講嘅學習對象只係從成品,變成psd文件或者整個流程每一個step嘅圖紙,當然呢個嘢可以讓整件事更加複雜,要學習嘅資料更加多,增加咗AI得出「好的畫作」嘅難度,但這也是難度而已,只要繼續發展,算力同input data再加落去,一樣可以突破。

又或者話啊我唔理,總之有證據你用AI就用刑事法落去拉人封鋌。啦,呢啲法例可能可以係一個或者多個國家成立,但要明白互聯網信息時代了,總有國家唔會咁on9立呢啲法例,結果就會係,呢啲國家嘅創作業界會有更有效率嘅工具去進行創作,而禁AI繪畫嘅國家可能會有一些大師級人士創作出很有藝術嘅作品成名和賺錢,但你要明白係,對於動畫、漫畫或者好似日本嘅輕小説插畫呢啲密集繪圖嘅行業呢?禁止AI嘅話,呢啲低階行業明顯唔會迫使呢啲畫師upgrade反而使得呢啲行業嘅主流商品生產速度低下,純粹以市場角度而言會導致呢啲國家商業作品比較起來處於劣勢,而商業作品處於劣勢嘅話,就很難養起一些無個人風格嘅大眾畫家,最後就會導致行業小圈子化,得最大嘅大手先有能力賺錢養家。好多人會幻想着禁AI會讓大家重視版權而有良性發展,但事實上我哋處於資本主義嘅社會,有藝術性又賺錢嘅作品始終係少數,多數嘅作品都喺廁紙文學和免洗動畫,唔係嗰個人都喺大師,總有人一生平庸只想賺幾個臭錢過活。但當AI取代佢哋,你仲唔準呢啲揾食派揾食,咁仲點揾食?舉個例子,好似香港咁,直到今天仍然禁止電動滑板車、禁止crypto,請問結果係咩?呢啲產業走去合法嘅國家地區發展,最終係你止步不前而人地持續進步提升咗效率,如同逆水行舟,不進者,則退。

所以點?我覺得更妥善嘅方法會是,就有關嘅AI繪畫調整版權法,針對AI嘅data source部分調整法例,使得這些data source係來自獲得授權或者係這些AI公司自己請人生成出來的,並制定違反嘅罰則。同時可能亦規定這些工具嘅提供者要有披露義務,詳細説明獲取資料嘅流程,並確保過程透明公開,而人們可以根據自己喜好或者道德要求選擇AI定純人工,並對作出虛假聲明作出罰則。係,我認為法律嘅制定走向應該係「提供選項」嘅大前提下建立安全、穩定嘅制度,重點應該放在如何納入規管、調整法例,最終讓一些新事物能夠不至於出現最糟糕嘅結果,而又令人們多一個工具可以「選擇」——至於用定唔用,走得幾遠,讓市場和民意用$$決定。

咁AI最後會點改變行業?

AI改變好多行業,以前很多演算法和作計算、資料整合嘅重複勞動,好多都逐漸被AI取代。而事實上AI出現亦有助行業走向M化——或者話,被AI衝擊嘅行業最終會走向精英化,好似律師可以請更少人就可以整理好案情相關嘅案例和參考法例,設計行業可以用AI大量生成意念圖片便於同客户溝通訂立共識,而程式員可以AI predict常用嘅片段代碼跟住直接貼上,到咗一些駕駛和敏感內容嘅分類能更快速分類,跟住人手再double check即可。

——無錯,AI殺咗一堆職位,但會創造更多職位。很多人很擔心AI出現會導致一些行業走進裁員嘅狀況,但我會覺得這是過慮。尤記得當初蒸汽革命、工業革命時候,很多人都喺擔心大家工時少咗、工作少咗最終失業人口多咗,但結論是大家都過慮了。好似以機械化廠房來講,少咗一堆重重複復嘅生產線功能,但亦要請一堆工程師檢查、調整機器,要操作員睇住機器嘅正常運作,要中層管理員去更加精確計算出貨量,然後產量嘅提升亦導致廠房可以繼續提升最終開了比以前更多嘅廠房,引入更多符合業務要求嘅複雜機器,最終整個行業嘅職位和分工更加多和仔細,反而大家嘅工時和工作量更加多了。

有人會話,喂但係咁咪有班大眾繪師被kill了?係,科技嘅發展總是會把一些舊嘅職業無情粉碎,相機嘅出現粉碎了人像繪畫繼而令抽象/非實在畫風流行;汽車嘅出現使得大量嘅馬匹相關行業被淘汰;互聯網嘅出現和便攜攝影機嘅流行導致電視甚至傳統嘅報紙業界面對緊縮嘅現況;但反過來講,相機出現使得人們唔使高昂嘅費用都能記錄生活嘅美好,汽車嘅出現使得人們可以去更遠嘅地方提供更多嘅選擇,而互聯網流行和攝影器材嘅便捷化使得人人都可以創作自己嘅節目,讓大家有更平等嘅發言權。而對於繪畫業界而言,相信AI繪畫如果能完善法例之後,能使得一些以前空有創意卻苦於繪圖嘅人多咗個工具創作自己嘅作品,把自己嘅意念化為現實。而一些中高階嘅大師畫師勢必能以更短時間創作出更精細嘅作品。而創作業界嘅人士同客户溝通嘅時候可以直接和客户一齊用AI拼貼工具生成一些visual嘢,使得溝通和釐定作品嘅整個過程更加順利。而一些所謂的大眾繪師可以掉反轉,用AI生成作品、修正,最終以更短時間創作出更多作品,以量取勝都喺個方案。又或者一些以前嘅重複勞動尤其係動畫製作,可以一頭一尾,中間嘅frame讓AI補來節約時間。甚至乎我哋可以應用落把一些陳年作品提升解像度/修復損毀畫作。

雖然講咗咁多應用,但我認為當一樣嘢越大眾化、越流水線,越突顯專業知識嘅重要。對於程式員而言,對於唔同演算法嘅掌握和程式基礎理論更為重要,優秀嘅程式員和平庸嘅分別大概就喺能否準確debug以及和客户流暢溝通嘅能力會更明顯。而對於繪師而言,個體之間嘅繪畫能力會走向更平等和更分化,跟住如何更精確理解客户嘅要求、如果調整作畫嘅內容會更顯得重要,而當中溝通和繪畫嘅基礎:光影、人體結構、透視、背景繪畫之類嘅細節判斷會更能突出你和AI的不同,和其他同業嘅不同。所以我真的很想同嗰啲成日怕AI/機械化失業嘅人講,得閒抱怨,不如增值自己嘅知識啦。尤其係一些基礎知識十分重要的,工具點變,程式嘅基底仍然係電腦;繪畫技術點進步,光影透視呢啲基礎嘢唔會變的。

世界潮流,浩浩蕩蕩啊。活到最後的生物從來唔係強者,而係持續能適應環境但仍能生存嘅弱者。

封面圖片

封面圖片出處:https://github.com/denoland/deno/issues/25