[AICG]Bing影像建立者 V.S. BingChat

 前言:

炎炎夏日,最適合窩在家裡,上網學習新知,拜近年線上研習、學習平台蓬勃發展,有相當多樣的選擇,但我想還是有人偏好文字學習,所以隔了這麼久,開啟寫教學文。

一、 Bing Chat

圖一:Bing Chat使用介面

簡單介紹一下,必須用一般個人Email註冊微軟帳戶使用,教育帳戶目前是不開放的,至少寫這篇教學文時,影像建立者會擋掉,應該是年齡政策的問題,無法判別用戶是否符合年齡條件。

 

另外這邊有三種模式:詢問複雜的問題、取得更好的解答、取得富創意的靈感,接下來文章中的是用方式,我建議選前兩個,第三個會影響到文字的建議精確度。
基本上手機安裝Bing這個APP,也可以使用語音輸入對談,更直覺、更方便。

二、Bing影像建立者

圖二:影像建立者介面

這個操作也相當簡便,就像2023上半年其他熱門的AI圖像生成網站一樣,直接打出你想生成的畫面描述文句,接著送出即可,每天都有點數補充,讓你免費使用。

圖三:官方建議的文句結構

其實官方貼心地做了Q&A,覺得剛接觸的人可以閱讀一下,可以增長一些對於AI圖像生成與系統上的認識,這邊截圖關於文句敘述的建議給你參考一下,大致上就是這樣,但實際使用你就能明白為何,我只是說參考而已。

三、Bing Chat上直接使用Bing影像建立者

這個功能實裝一段時間了,不得不說大量的使用者湧入,讓這些網站開發到實裝的速度,快到一種小叮噹快出現了的感覺,現在就來演示一下怎麼完成。

等等,你是不是有點覺得浪費時間看廢文的感覺,為了把你留住,我(繼續打一下廢文)解釋一下,在學習玲瑯滿目的Ai生成網站介面時,我發現了幾個問題:
  1. 門檻高:英語能力、操作複雜、硬體條件
  2. 可控性:可控度越高複雜度也越高
  3. 推廣性:現階段還在免費推廣期都是資金比較雄厚的
為了達到我的目標:
  1. 一站式
  2. 微可控
  3. 零基礎輕鬆上手
  4. 能被日常應用
(一)一站式
我必須在Bing Chat上直接使用Bing影像建立者,一次搞定AIGC生成圖片時,為了達到目的,不斷修改敘述文句,使用對話的方式輕鬆完成,這樣不用切換多種工具增加複雜度,最好的部分是支援中文和手機載具語音模式。

(二)微可控
玩過AIGC或看過介紹影片的人都知道,基本上會出現什麼畫面都難以預測,Bing影像建立者有自己的敏感詞彙守門員(有時甚至太嚴格,但對教育學習卻是件好事。)另外,我發現其他AI軟體為了達到可控性,有一個很直覺的手段,就是"以圖生圖",你會馬上反駁我,Bing影像建立者簡約的介面功能裡沒有這個功能,這就是我想跟你說的部份,我現階段可以迂迴地達到類似效果,請看演示。

 

圖四:Bing Chat對話框可以上傳圖片

(三)零基礎輕鬆上手
就像用Line一樣對話,傳圖片,毫無違和感,就像一個Line助理一樣,只是現在協助你AI生圖,讓你更快、更直覺完成這件事,並得到更理想的結果。
圖五:請AI辨識這張圖片

相信尋找一張圖片,或是拍攝一張照片,對於你不會是件難事,但對於初接觸AI生圖的人來說,描述句子給AI懂,確實不容易(簡單地說你不明白為何老師生成的圖片總是比較好看且精確),這邊一定有人會問,為什麼我要用Bing影像建立者生成的圖丟回來分析,第一、這張圖有些瑕疵,雞蛋裝的不正常,顏色也不對,主角眼睛不太自然,第二、相同系統對於文句描述的效果會比較相近,我就是要實作給你看可控性,我希望大部分特徵都被留下。

(四)能被日常應用
其實達到上面三點,可被日常運用的機會就大增,大部分的人,現階段不會特別去專研AI影像生成,不可否認很多的人是相當熱衷這項新技術,但我想微軟Bing影像建立者方向是不同的,應該是針對一般有興趣大眾可以輕易使用,這樣的族群,但使用過後,很快就跟我一樣發現,現階段的難以達到的事,幸好這項功能與Bing Chat整合,我敢說,看完這篇教學,你一定也會覺得,這項決定真的是太正確了。
圖六:辨識分析/形成描述句/精修成Bing影像建立者習慣的描述句

繼續看演示,可以看出影像確實被重新分析,你可以加入你的意見,與AI共作,最後你不用自己去適應AI習慣的文句,由AI自己產出(畢竟是同公司的系統,考驗一下它整合能力。)如果用其他AI生圖網站,這部分不是要借其他網站完成,就是要靠你"工人智慧"經驗累積了。 

圖七:描述完成/生成圖片

在Bing Chat裡,可以直接生成圖片,產生圖片的同時,點選圖片,會直接發現,被導引到Bing影像建立者,可以下載,有完整敘述文句,可以導出分享連結。

 

 
圖八:Bing影像建立者要回Bing Chat點擊右上角X

你可以看到風格與原圖不同,但四張圖特徵的相似度很高,你可以回Chat繼續修改,你也許會納悶,這樣真的比自己直接在Bing影像建立者修改敘述句快嗎?我的經驗是要用AI就要好好運用它優勢,來加快你決策時間,去適應工具已經不符合AI發展的潮流了,我覺得是加快我發現問題的時間,並省去嘗試錯誤(還不熟悉AIGC流程的部分)。

 

圖九:增加畫風

圖九:畫風/特徵/視角逐漸穩定

我後續針對提袋子的方式,蛋的比例,進行修正,過程中你還是會發現,越多敘述,造成生成圖片的錯誤率會增高,但使用過都會知道,竟然可以用這麼長的敘述句,讓Bing影像建立者,精確的將每個要素"都"呈現,這就是這個流程的精髓之處。
圖十:無法生成的顯示1


圖十:無法生成的顯示2

以上這兩種無法顯示的狀態,後來我直接到Bing影像建立者查看(沒錯,你在chat做的生圖都會記錄過去,並且扣每日能量),發現是被ban掉,但不用擔心,畢竟是自己系統產生的,就是已經避開敏感字了,放心繼續生成吧!也許就是塞車而已。
圖十:最後成果圖
小技巧,你會發現,其他特徵都穩定產出,唯獨袋子裝蛋和蛋比例這件事有錯誤,代表一件事情,就是在這畫面資料學習的圖庫裡不算常見,或者文句與畫面連結度不夠,我解決的方式讓你做參考「雙手提著透明白色袋子,袋裡有多顆白色蛋」這句話前移,重要度會提高,不要試圖解決尺寸問題,你要朝合理化的方向思考,能雙手提的袋子,自然形式就被框限了,要看到袋中雞蛋,白色機會會比其他高,多顆白色蛋在袋子中,尺寸自然小,就像你畫圖,一定是先畫出大輪廓才畫細節,比例才不會跑掉一樣。

結論:
這篇教學沒有提供太多新鮮事,就是突顯出AI多面向整合的好處,一般你要達到這樣效果,你必須學習複雜一點的AI生圖網站或系統,再來你要自己整合其他系統:翻譯語文、分析圖片等,最後你還要適應生成圖片系統習慣的文句與指令,當然Bing影像建立者,是相對陽春的工具,但整合到Chat目前實測的契合度讓人驚豔,目前也保有免費額度推廣的制度,網頁和APP都已成熟,希望大家能趁著這熱潮,無痛免費地體驗看看,如果希望小弟繼續研究的項目,也歡迎推薦研習講座機會或廠商贊助,為即將搬去台東生活的筆者減輕一點生存壓力。

留言