計育韜:公眾號支持AI配圖了,但仍有幾個缺陷我建議優化
相信部分創作者已經注意到,目前公眾號圖文的封面圖/正文配圖已經支持以 prompts(提示詞)方式進行 AI 生成了。比如今天的頭條封面圖和次條封面圖均由公眾號原生的「AI配圖」功能實現。
實際上微信中原生的 AI 能力非常豐富,在《微信原生AI工具大全》中可以一覽最新的清單。而公眾號此次更新的「AI配圖」功能體驗上則十分「克制」,并沒有常見 AIGC 工具那樣豐富多元的控制模塊和調參入口,盡量以最簡步驟力圖讓普通的編輯人員完成快捷配圖工作。
譬如封面圖,進入「AI配圖」功能,系統默認提供了 2.35: 1 的標準封面尺寸。隨后我們輸入 prompts(提示詞),即可讓 AI(混元大模型)進行創作并產生 4 張圖片結果:
計育韜老師首先采用了比較口語化未經 AIGC 專業格式梳理的提示詞,盡量模擬一個非 AIGC 從業者的輸入情形——通過簡單的短語輸入,基本能得到預想的圖像結果!
但是,當我關閉該窗口重新進入后,會發現一個比較致命的問題——1)前幾輪的提示詞不會保留 2)只留下此前 3 輪的生成結果。
第二個問題或可商榷,畢竟配圖工作不同于我們專業 AIGC 工作流,未必要經歷太多次迭代。但是,我們也不能指望 AIGC 可以在單次操作下一蹴而就,使用者輸入的提示詞往往要經過調整、變化而逐步趨近預想的結果。我個人幾乎從未見過不保留 prompts 記錄的 AIGC 工具,因此我建議微信團隊盡快在生成記錄中保留既往提示詞。
接下來,我注意到了它的「換風格」功能入口——從 AIGC 專業領域講,就是基于如 ControlNet 實現完美像素條件下主體的風格遷移。而我以某個生成圖片進行風格轉化時實際生成結構如下:
可以說情況非常得糟糕了,既沒有保持主體一致性也沒有遵循提示詞內容……盡管「換風格」有很棒的應用初衷,但效果可控性較差的情況下并不建議作為重點功能功能呈現。
其實結合以上 UX,作為 AIGC 的資深從業者肯定已經想到其背后混元 2.0 的「邊改邊生」實時生圖能力.
界面布局的相似度不可謂不高!或許我們可以在此大膽預測,后期微信公眾號的「AI配圖」亦可能直接應用騰訊混元 2.0 的實時生圖,以更高效地交互方式引導編輯人員完成配圖工作。
對于已經生成并應用的圖片,微信公眾號圖庫會自動產生一個「AI配圖」文件夾進行存儲方便管理:
此后,計育韜老師還嘗試了以模版化提示詞輸入的測試:
視覺表現上隨著提示詞的深化而提升了不少,但經過我的多輪嘗試發現它對「文字」生成的能力很弱,幾乎無法完成「人工智能」四個字的涂鴉設計。此時我將相同的 prompts 給到即夢,讓字節的 Seedream 2.0 比一比,得到如下結果:
抱歉,那么我選即夢。
這其實暴露了公眾號「AI配圖」當前的另一個核心痛點——封面圖往往有文案展示需求,但混元大模型目前卻不能支持該功能正確生成重要的文字信息。
近期,計育韜老師正在各高校開展《AIGC融媒體創作與SVG可視化交互設計》專題巡講,現場為同學們分享了不少與企業品牌、政務媒體合作的 AIGC 項目經驗。我將在后續梳理答疑環節同學們的部分深刻提問與我的解答,歡迎保持關注。
轉載請在文章開頭和結尾顯眼處標注:作者、出處和鏈接。不按規范轉載侵權必究。
未經授權嚴禁轉載,授權事宜請聯系作者本人,侵權必究。
本文禁止轉載,侵權必究。
授權事宜請至數英微信公眾號(ID: digitaling) 后臺授權,侵權必究。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)