通義萬相

專用API

【更新時間: 2024.08.12】通義萬相-文本生成圖像是基于自研的Composer組合生成框架的AI繪畫創作大模型，能夠根據用戶輸入的文字內容，生成符合語義描述的多樣化風格的圖像。通過知識重組與可變維度擴散模型，加速收斂并提升最終生成圖片。

0元起去服務商官網采購>

瀏覽次數

209

采購人數

試用次數

SLA: N/A

響應: N/A

適用于個人&企業

試用

選擇書簽:

完成

取消

書簽名稱

確定

相似API

Winston-AI圖像探測器

Winston AI 是最先進的解決方案，用于檢測 AI 生成的圖像和使用 Midjourney、DALL-E、Stable Diffusion、Meta AI 等制作的深度偽造。

API詳情
定價
使用指南
常見 FAQ
關于我們
相關推薦

產品介紹

什么是通義萬相?

通義萬相-文本生成圖像是基于自研的Composer組合生成框架的AI繪畫創作大模型，能夠根據用戶輸入的文字內容，生成符合語義描述的多樣化風格的圖像。通過知識重組與可變維度擴散模型，加速收斂并提升最終生成圖片的效果，布局自然、細節豐富、畫面細膩、結果逼真。AI深度理解中英文文本語義，讓文字秒變精致AI畫作。

什么是通義萬相接口？

由服務使用方的應用程序發起，以Restful風格為主、通過公網HTTP協議調用通義萬相，從而實現程序的自動化交互，提高服務效率。

通義萬相有哪些核心功能？

文本生成圖像：用戶可以輸入文字描述，通義萬相會根據這些描述生成不同風格的創意圖像，如山水畫、古代游船等。用戶還可以對生成的圖像進行點贊、不滿意、生成相似圖、下載原圖和收藏等操作。
相似圖像生成：用戶上傳任意圖片后，通義萬相可以進行創意發散，生成內容、風格相似的AI畫作。
圖像風格遷移：用戶上傳原圖和風格圖后，通義萬相能夠自動將原圖處理為指定的風格圖。
應用廣場（虛擬模特）：在應用廣場中，用戶可以上傳圖片并替換模特及背景，創建個性化商品展示圖

通義萬相的核心優勢是什么？

卓越的性能與可靠性：通義萬相模型服務以其卓越的性能和穩定性著稱，能夠生成高質量的圖像，即使在高并發和大流量環境下也能保持不低于99%的可用性。
簡易的集成與使用體驗：通義萬相模型服務提供的API接口設計簡潔明了，極大地簡化了集成過程。即便是缺乏深度技術知識的用戶，也能夠迅速掌握如何利用通義萬相的能力。
多元化應用場景拓展：通義萬相模型服務的多功能性使其成為跨領域的理想選擇。從將抽象概念轉化為具體圖像，到個性化涂鴉、人像藝術化、乃至定制化的人物肖像生成，通義萬相為用戶解鎖了無限創意空間。
創新功能愿景：通義萬相展現了強大的創新能力，例如在文生視頻領域，它最出色的特點就是“最聽話”，基本能很好地理解給到的長文本、復雜提示詞，把想要的關鍵要素都完整地表達出來

在哪些場景會用到通義萬相？

1. 廣告與營銷物料生成：文生圖能夠即時響應廣告文案，生成符合品牌調性、產品特性和營銷策略的視覺內容，節省了傳統拍攝與后期制作的成本，廣告內容根據實時熱點迅速調整，實現高度定制化和敏捷營銷。

2. 教育與培訓資源制作：教育工作者和培訓師利用文生圖模型來創建生動、直觀的教學素材，有助于提升教學內容的吸引力和理解度，定制化的圖像資源還能用于制作互動課件、電子教科書，豐富教育資源庫。

3. 新聞與媒體內容生產：新聞機構和內容平臺采用文生圖技術來增強報道的視覺呈現，即時生成的視覺內容不僅能吸引讀者注意力，提高閱讀體驗，還能確保新聞報道的時效性和準確性。

4. 游戲與娛樂內容開發：游戲開發者借助文生圖大模型來快速生成游戲內的角色、道具、環境元素等美術資源，用于動態生成游戲NPC（非玩家角色）外觀或定制化的玩家角色，增加游戲世界的多樣性和沉浸感。

產品價格

模型服務	模型名稱	計費單價
通義萬相-文本生成圖像	wanx-v1	0.16元/張
通義萬相-人像風格重繪	wanx-style-repaint-v1	0.12元/張
通義萬相-圖像背景生成	wanx-background-generation-v2	0.08元/張
通義萬相-涂鴉作畫	wanx-sketch-to-image-lite	0.06元/張
通義萬相-Cosplay動漫人物生成	wanx-style-cosplay-v1	公測，免費額度300張
通義萬相-AnyText圖文融合	wanx-anytext-v1	公測，免費額度300張

使用指南

已開通服務并獲得API-KEY：API-KEY的獲取與配置。
已安裝最新版SDK：安裝DashScope SDK。

指南詳情鏈接：https://help.aliyun.com/zh/dashscope/developer-reference/quick-start-1?spm=a2c4g.11186623.0.0.7f9f32510RcmTH

產品問答

通義萬相的圖像生成質量如何？

通義萬相的圖像生成質量非常高，可以達到與真實圖像相媲美的水平。模型具有強大的語義理解能力，能夠根據用戶輸入的文本提示生成符合用戶意圖的圖像

使用通義萬相時遇到API調用報錯怎么辦？

確認API密鑰和訪問權限配置正確，檢查網絡連接是否穩定，并參考官方文檔和示例代碼，確保調用參數和方法正確。

資源部署失敗應如何解決？

確認云資源配置符合要求，如VPC、ECS和OSS等，查看部署日志和錯誤信息，定位問題原因并參考文檔解決。

通義萬相服務響應慢有什么解決方案？

檢查網絡連接和服務器負載情況，優化API調用參數，或聯系阿里云技術支持尋求幫助。

通義萬相有哪些技術優勢？

穩定性與高可用性：通義萬相保證了高并發下的穩定響應，可用性達到99%以上。 API友好接入：提供了標準化的HTTP API，使開發人員能夠輕松集成AI繪畫功能。知識重組&可變維擴散模型：基于自研的Composer組合生成框架的AI繪畫創作大模型，通過知識重組與可變維度擴散模型，生成符合語義描述的多樣化風格的圖像。

通義萬相是否支持視頻生成？

是的，通義萬相在2024年9月19日發布了全新視頻生成模型，支持文生視頻和圖生視頻，最長能夠生成5秒的視頻，每秒30幀，分辨率為720P

通義萬相的用戶體驗如何？

應用程序的用戶界面設計簡潔明了，易于上手。但是，生成后的作品缺少直接的對比和編輯功能，對于追求完美作品的用戶來說，這可能是個需要改進的地方

通義萬相在AI繪畫領域的表現如何？

通義萬相在AI繪畫領域展現了高度創新，多樣化的創作工具和靈活的輸出選項值得稱贊。

關于我們

阿里巴巴達摩院（杭州）科技有限公司

企業

通義千問是由阿里云自主研發的大語言模型，用于理解和分析用戶輸入的自然語言，在不同領域和任務為用戶提供服務和幫助。您可以通過提供盡可能清晰詳細的指令，來獲取符合您預期的結果。通義聽悟API服務，在語音識別、翻譯和發言人識別的基礎上，提煉全文摘要、章節速覽、發言總結、待辦事項、PPT、問答、關鍵詞等內容，對人與人交流的音視頻進行分析與精簡，幫助使用者快速了解音視頻主要內容。

聯系信息

服務時間： 00:00--24:00

電話號碼： 86 571 8502 2600

郵箱： tingwu_contact@service.alibaba.com

達摩院成立于2017年10月，致力于探索科技未知，以人類愿景為驅動力，面向未來開展基礎科學和創新性技術研究。希望打通應用基礎研究和產業應用，探索技術產品化、產品市場化的轉換路徑。

達摩院在數字技術領域取得了一系列技術突破并實現規模化應用，構建了全方位的人工智能基礎能力，推出了業界領先的通義系列大模型，孵化出平頭哥半導體公司等。接下來，達摩院將繼續聚焦中長期科學技術研究，重點布局人工智能、集成電路等前沿領域。

發展歷程

2023年2月，天眼查App顯示，阿里巴巴達摩院（杭州）科技有限公司發生工商變更，注冊資本由1000萬人民幣增至3億人民幣，增幅2900%。
2023年6月，阿里巴巴達摩院（杭州）科技有限公司的“達摩院開放域自然對話合成算法”備案通過，應用于對話生成場景，服務于智能對話類的企業端客戶，利用對話意圖理解、對話內容生成等技術，通過API提供對話生成功能，備案號為網信算備330110507206401230019號；“達摩院圖像合成算法”備案通過，應用于圖像生成場景，服務于圖像合成類的企業端客戶，通過API提供文字信息轉化為圖像信息的功能，備案號為網信算備330110507206401230027號；“達摩院交互式多能型合成算法”備案通過，應用于開放域多模態內容生成場景，服務于問答、咨詢類的企業端客戶，通過API提供根據用戶輸入生成多模態信息的功能，備案號為網信算備330110507206401230035號。
2023年7月，阿里巴巴達摩院（杭州）科技有限公司發生工商變更，周明卸任法定代表人、執行董事兼總經理，由張建鋒接任。
2023年8月，該公司達摩院語音合成算法、達摩院虛擬試衣合成算法、達摩院人臉融合合成算法備案通過。
2024年2月，阿里巴巴達摩院（杭州）科技有限公司的“達摩院服飾上身合成算法”備案通過，應用于圖像生成場景，服務于企業端客戶，根據用戶上傳的服飾參考圖和模特圖，將服飾圖里的服飾融合到模特身上，生成對應服飾商品的廣告圖，備案號為網信算備330110507206401240055號。
2024年4月，該公司達摩院單圖生成3D合成算法備案通過，主要應用于圖像生成場景，服務于企業端客戶，根據用戶輸入的需要被3D生成的單張單體物體的圖片，生成該物體的任意視角下的圖像，達到利用單張圖像生成3D模型的效果。備案號為網信算備330110507206401240063號。
2024年4月，該公司達摩院人物姿態編輯合成算法備案通過，主要應用于圖像生成場景，服務于企業端客戶，根據用戶輸入的骨架圖和人物圖，生成人物姿態編輯后的結果圖像。備案號為網信算備330110507206401240071號。
2024年6月，阿里巴巴達摩院（杭州）科技有限公司達摩院人物舞蹈視頻合成算法備案通過，主要功能是應用于視頻生成場景，服務于企業端客戶，根據用戶輸入的人物參考圖和所選的預設姿態序列，生成指定姿態序列下的人物舞蹈視頻。備案號為330110507206401240089號。

最可能同場景使用的其他API

明星圖像識別-天行數據專用API

【更新時間：2024.08.12】該服務名為“明星圖像識別”，其主要功能是進行明星人物圖像的識別與查詢。它能夠快速且準確地對輸入的明星圖像進行分析，幫助用戶便捷地獲取相關明星的具體信息，為用戶提供高效的明星圖像識別服務體驗。

智能識別 > 圖文識別

150

圖像風格轉換通用API

【更新時間：2024.08.12】提供多種藝術風格特效轉化服務，還可自定義風格圖像進行風格遷移。用于開展趣味活動，或集成到美圖應用中對圖像進行風格轉換。

開發者工具 > 圖像工具

146

圖像色彩增強通用API

【更新時間：2024.08.12】圖像色彩增強，能夠智能化地對圖片的色彩飽和度、亮度以及對比度進行調節。通過該處理，可讓圖片的內容細節得以更好呈現，色彩也會更加逼真生動，從而顯著提升圖片的整體質量和視覺效果。