黄色大片aa,japanhdxxxxx69,免费看污污视频

国产亚洲精_丰满老熟好大的大bbb_男男激情做爰视频免费观看_欧美一区二区三区精品国产

AI動漫視頻工具1.0—探索全新內容創作設計理念與實現策略

2024-6-7 ui設計分享達人

一、項目背景

AI動漫視頻是AIGC的熱門賽道之一，目前市面上許多動漫領域核心玩家均布局或已啟動AIGC動漫內容生產。我們希望為有意向進行AIGC領域創作的PUGC創作者提供便捷的渠道及工具，通過孵化一批獨家的AIGC動漫原創作者，入局動漫創作行業核心圈，為平臺供給大量差異化原創內容。

1.行業洞察

通過對AI動漫視頻行業進行深入調研洞察，我們發現其具有以下特點：

隨著小說推文行業規模擴大，代理機構及推文KOC達人賬號迅速增長，AI動漫視頻訂單規模不斷擴張。

在小說推文用戶群中，18-23歲的年輕人和女性用戶居多，著眼于抖音小說推文指數，用戶逐漸增加，且有逐漸“破圈”的趨勢。

目前小說推文KOC達人的用戶畫像，集中在女性學生和寶媽群體，表明女性達人對于小說內容的理解更為透徹。

2.用戶痛點

同時我們發現，目前用戶使用AI動漫視頻產品時的痛點主要集中在以下幾個方面：

1）文本內容識別不準確

畫面識別和文字匹配度不高，導致適配內容畫面表現出現偏差，影響視頻效果。

2）圖像不受控制

不能保證同一人物在不同分鏡下的妝造一致，同個人物的服飾、發型等會發生變化，影響畫面內容的連貫性。

3）風格匹配度不高

AI動漫視頻會存在較強的“機器感”，人物和場景風格未必和漫畫風格匹配。

4）動態效果生硬

AI動漫視頻終端交付內容動態不連貫，轉場效果很像PPT。

3.設計理念

基于此，我們對產品落地進行細致規劃，將模型驅動AI動漫視頻能力落地「度加」創作工具，跑通從文章識別到視頻合成的完整流程，確保基礎功能落地。從文本轉化、畫面控制、動態能力等多方面調優，對標高質量視頻要求，持續打磨工作流，支撐生態向高質量內容轉型。

1）優質視頻內容促分發、提時長

我們持續打磨設計工作流，力求使自動生產質量達到動漫視頻基線。

2）高效工具建立內容創作優勢

設計創新提升工具控制范圍和能力，保證輔助生產質量追齊專業動漫視頻水平。

二、搭建視頻生成流程

通過不斷打磨優化，我們搭建了一套完整的視頻生成流程：設置基礎信息及視頻參數→上傳文本→角色/場景提煉（可重新生成至符合預期）→生成旁白及分鏡（可進行編輯或重新生成至符合預期）→生成視頻。

三、聚類定制化風格模型

1.七大類別模型選型

為了使生成效果更加適配漫畫內容，解決風格匹配度不高的問題，我們對市面上的熱門漫畫題材進行了分析，根據其內容進行了分類梳理。共梳理出七大類別：都市現代、武俠仙俠、奇幻魔幻、恐怖懸疑、科幻賽博、末日廢土、兒童繪本。通過對類別內容的判斷，選擇能表現其內容特色的風格模型。

為增加模型的可選擇性，每個類別下選擇2套模型進行適配，同時增加通用模型，保證內容品質及風格效果的全方面覆蓋。

2.模型選型標準

1）內容準確

目前使用的底模均為基于Stable Diffusion 1.5底模訓練出來的模型。通用模型和垂直模型的區別在于，通用模型需要具備比較廣泛的通用的內容識別能力，盡可能覆蓋熱門題材。例如DarkSushiMix這個模型，在熱門的都市和仙俠等題材中，均可以識別小說分鏡描述的內容，生成符合預期的畫面，可以作為通用模型使用。

2）風格契合

垂直模型更具有針對性，部分小說內容具有強烈的特色風格，在模型選擇中，除了對于文本內容的識別，需要具備符合小說特色的風格效果。這時除了篩選適合的底模以外，還可以使用底模+LoRA模型的方式，一方面保證畫面識別，另一方面滿足風格需要。

在進行了大量評測組合后，我們選擇出適合7大類別的模型搭配。例如在兒童繪本類別下，適配了童趣和國風兩種風格。通用的底模雖然可以將畫面內容呈現出來，但是風格上與兒童繪本差異較大，會導致觀感上與小說本身產生差異，模型適配準確后，就可以生成符合預期的畫面效果了。

3）畫面美觀

畫面美觀包含內容準確、風格契合、人物畫面無崩壞等多個方面。內容準確與風格契合在上面進行了總結，關于人物畫面的實現效果上，AI生圖在尺寸較小的情況下會出現部分Bug，主要受到影響的是面部清晰度。因此，我們選擇使用Adetailer插件進行面部修復，保證人物的清晰美觀。

四、多視角鏡頭控制畫面

在工具初建階段，重點采用Prompt控制鏡頭視角的多樣性。我們測試了大量鏡頭視角描述詞在不同模型及內容描述下的效果，總結出5個效果識別顯著的詞匯：Close-up（特寫）、From below（仰視）、Top view（俯視）、Front view（正視角）、From side（側視角）。鏡頭視角描述詞根據策略隨機適配，避免連續出現相近視角的畫面，確保畫面構圖的豐富度。

五、多尺寸及轉場增強畫面豐富度

1.規范制定

我們制定了比例和尺寸兩方面的規范。

比例設定：設定「16:9、9:16、4:3、3:4」4套生圖比例，選擇4個識別度高的字體匹配4套比例，滿足用戶對視頻橫板和豎版的不同要求。

生圖及視頻尺寸：為保證較快的生圖速度，生圖過程中，先使用較小的生圖尺寸，再通過超分擴大圖片保證畫質清晰度，同時對畫面在視頻中的范圍及尺寸進行規范。以16:9為例，在該比例下，生圖尺寸若與視頻尺寸一致，畫面過長，AI生圖會出現相對不可控的情況。經過多輪測試評估發現，將畫面尺寸控制在4:3的范圍內效果最佳，16:9的高清視頻尺寸為1920x1080，所以畫面的部分生圖使用了684x512（4:3）的尺寸，再通過超分擴展為1440x1080（4:3）。

2.運鏡轉場

為避免視頻有類似PPT切換圖片的感受，增加運鏡和轉場，運鏡主要為上移、下移、放大，轉場設計了下滑、右滑、位移、旋轉等8個效果。

六、多音頻選擇提升臨場感

1.基礎能力

我們使用度加TTS旁白與端內音樂進行合成，音色及背景音樂提供多個種類選擇，音量、語速均可調整，保證音頻與畫面的最佳契合度。

2. AI音視頻賦能內容生產

Meta正式開源了一款名為AudioCraft的AI音頻和音樂生成工具，該工具可以直接從文本描述和參考音樂生成高質量的音頻和音樂。AudioCraft包含MusicGen、AudioGen和EnCodec三個模型，分別實現音樂生成、音頻生成和自定義音頻模型構建。我們不斷探索音頻模型的內容供給，規劃AI音效庫建立模式，為素材供給擴展可能性。

下面是我們1.0階段產出的視頻效果：

Current Time 0:00

Duration Time 2:28

Loaded: 0%

Progress: 0.00%

下期預告

本篇內容主要為AI動漫視頻工具的基礎能力搭建，概述了我們在模型供給、畫面控制、規范制定、音頻合成等多個方面如何進行調優，以滿足產品功能。在未來的工具2.0迭代中，我們還將從文本轉化、畫面控制、動態生成能力等方面入手，全面提升視頻品質。此外，我們還會通過對多項AI能力的探索，衍生短劇、預告片生成能力，打造AI生視頻領域頭部產品。大家敬請期待吧~

作者：百度MEUX
鏈接：https://www.zcool.com.cn/article/ZMTYyMzY1Ng==.html
來源：站酷
著作權歸作者所有。商業轉載請聯系作者獲得授權，非商業轉載請注明出處。

藍藍設計(paul-jarrel.com )是一家專注而深入的界面設計公司，為期望卓越的國內外企業提供卓越的大數據可視化界面設計、B端界面設計、桌面端界面設計、APP界面設計、圖標定制、用戶體驗設計、交互設計、UI咨詢、高端網站設計、平面設計，以及相關的軟件開發服務，咨詢電話：01063334945。

關鍵詞：UI咨詢、UI設計服務公司、軟件界面設計公司、界面設計公司、UI設計公司、UI交互設計公司、數據可視化設計公司、用戶體驗公司、高端網站設計公司

銀行金融軟件UI界面設計、能源及監控軟件UI界面設計、氣象行業UI界面設計、軌道交通界面設計、地理信息系統GIS UI界面設計、航天軍工軟件UI界面設計、醫療行業軟件UI界面設計、教育行業軟件UI界面設計、企業信息化UI界面設計、軟件qt開發、軟件wpf開發、軟件vue開發

« 構建高效標簽體系：如何優化平臺權益感知，提升用戶體驗？ 2024 年十大UX/UI設計趨勢 »

国产亚洲精_丰满老熟好大的大bbb_男男激情做爰视频免费观看_欧美一区二区三区精品国产

AI動漫視頻工具1.0—探索全新內容創作設計理念與實現策略

分類

日歷

鏈接

個人資料

存檔