利用Google Gemini AI自動化產品圖片優化流程

更新 發佈閱讀 4 分鐘
vocus|新世代的創作平台

## 1. 自動化的目標


這個自動化流程旨在利用Google Gemini AI模型來優化和生成新的產品圖片。具體來說,當用戶上傳產品圖片到指定的Google Drive資料夾時,系統會自動分析圖片內容,並根據分析結果為產品設計一個專業、具有高轉化率的背景,最終生成一張全新的優化產品圖片,並將其保存到另一個指定資料夾中。


## 2. 使用的工具

1. **Google Drive** - 用於監控資料夾、獲取圖片文件、上傳最終生成的圖片

2. **Gemini AI** - 用於上傳圖片分析、圖片內容描述、生成專業產品背景提示詞以及最終圖像生成

3. **HTTP** - 用於呼叫Gemini圖像生成API

4. **Utility tools** - 包括等待模組和計數器模組


## 3. 流程設置指南

### 步驟 1: 監控Google Drive資料夾

- 設定模組:Google Drive > Watch Files in a Folder

- 設定監控「圖片生成」資料夾中的新檔案

- 設定監視檔案動作為「By Created Time」(監控新建檔案)

- 設定對所有檔案類型進行監控


### 步驟 2: 獲取上傳的圖片文件

- 設定模組:Google Drive > Get a File

- 從上一步獲取的檔案ID抓取完整檔案

- 設定適當的檔案格式轉換選項:文檔為Word、表格為Excel、演示文稿為PowerPoint、繪圖為JPEG


### 步驟 3: 將圖片上傳到Gemini AI

- 設定模組:Gemini AI > Upload a File

- 傳遞來自步驟2的文件數據和檔名

- 這步驟使圖片可被Gemini AI存取與分析


### 步驟 4: 用Gemini AI描述圖片

- 設定模組:Gemini AI > Create a Completion (Gemini Pro)

- 選擇AI模型:gemini-2.0-flash-exp

- 指示AI用英文描述上傳的圖片,不超過20字,並且不使用引號

- 使用在步驟3中上傳的圖片作為輸入


### 步驟 5: 讓Gemini生成背景提示詞

- 設定模組:Gemini AI > Create a Completion (Gemini Pro)

- 設定AI以電子商務專員角色,為步驟4中描述的產品設計合適的背景

- 提示詞包含為產品配置專業且能提高轉化率的背景建議


### 步驟 6: 等待處理

- 設定模組:Function Sleep

- 設定等待時間為10秒,讓前面的處理完成


### 步驟 7: 呼叫Gemini圖像生成API

- 設定模組:HTTP > Send Data

- 目標URL為Gemini圖像生成API端點

- 使用POST方法發送JSON格式資料

- 包含原始圖片、圖片描述和背景提示詞

- 配置生成參數:temperature=1, topK=40, topP=0.95

- 要求回應包含圖片和文本


### 步驟 8: 計數生成的圖片

- 設定模組:Function Increment

- 每次執行時增加一個計數器值

- 設定計數器在方案間保留(reset="scenario")


### 步驟 9: 將生成的圖片保存回Google Drive

- 設定模組:Google Drive > Upload a File

- 從步驟7的HTTP回應中提取圖片數據(Base64編碼)

- 命名格式為當前日期加計數器值:如「26032025_2.jpg」

- 保存到「圖片生成/已生成」資料夾中


結果



## 4. 重要注意事項

1. **API金鑰安全**:這個藍圖中包含了Google API金鑰,在實際部署時應該保護好這個敏感信息,最好使用變數或密鑰管理系統。

2. **錯誤處理**:HTTP請求模組配置了錯誤處理,若圖像生成失敗,流程會忽略錯誤並繼續執行。

3. **資料夾結構**:需要確保Google Drive中有正確的資料夾結構:

   - 「圖片生成」資料夾用於上傳原始圖片

   - 「圖片生成/已生成」資料夾用於存儲生成的圖片

4. **計數器機制**:使用計數器確保生成的圖片有唯一的名稱,避免覆蓋先前生成的圖片。

5. **檔案類型兼容性**:此流程主要針對圖片檔案設計,其他類型檔案可能無法正確處理。

6. **AI生成控制**:藍圖中使用了特定的AI參數(temperature, topK, topP),這會影響生成圖片的創意性和一致性。

7. **執行延遲**:包含10秒等待時間,確保各步驟間有足夠處理時間,這在高負載情況下可能需要調整。

8. **圖片尺寸與質量**:Gemini生成的圖片會有固定的尺寸和格式,如需特定尺寸可能需要額外處理。


留言
avatar-img
馬可🐴 | #創業 #工作自動化
18會員
24內容數
介紹用AI及自動化工具,簡化工作流程
2025/04/15
本自動化流程整合Gemini AI、Google Slides及Instagram Business,完成語錄內容生成、簡報設計及IG發佈流程,實現內容產出全自動化,大幅提高效率,每週可節省10小時以上的人工作業時間。
Thumbnail
2025/04/15
本自動化流程整合Gemini AI、Google Slides及Instagram Business,完成語錄內容生成、簡報設計及IG發佈流程,實現內容產出全自動化,大幅提高效率,每週可節省10小時以上的人工作業時間。
Thumbnail
2025/04/13
使用 Make 自動化工具來簡化活動報名和 Check-in 流程。通過 Make,你可以自動生成QR Code,並將其與活動報名資料整合,實現無需手動操作的報名和簽到過程。影片還展示了如何使用 API 申請 QR Code,並將其更新到 Google Sheet 中,從而實現實時的簽到記錄和通知。
2025/04/13
使用 Make 自動化工具來簡化活動報名和 Check-in 流程。通過 Make,你可以自動生成QR Code,並將其與活動報名資料整合,實現無需手動操作的報名和簽到過程。影片還展示了如何使用 API 申請 QR Code,並將其更新到 Google Sheet 中,從而實現實時的簽到記錄和通知。
2025/04/07
這套自動化流程能大幅提升專案管理效率,自動化藍圖的整理、儲存、分析與追蹤,節省大量時間並降低錯誤率。透過整合Make、Google和OpenRouter AI工具,自動產生JSON與Google文件格式的藍圖,並利用AI生成易於理解的分析報告,讓團隊輕鬆管理與維護Make中的每個情境。
Thumbnail
2025/04/07
這套自動化流程能大幅提升專案管理效率,自動化藍圖的整理、儲存、分析與追蹤,節省大量時間並降低錯誤率。透過整合Make、Google和OpenRouter AI工具,自動產生JSON與Google文件格式的藍圖,並利用AI生成易於理解的分析報告,讓團隊輕鬆管理與維護Make中的每個情境。
Thumbnail
看更多
你可能也想看
Thumbnail
運用生成的AI圖像來激發視覺和創意,無論是生成素材、用在社交媒體上,這些圖像都能為你的的視覺帶來獨特的風格。
Thumbnail
運用生成的AI圖像來激發視覺和創意,無論是生成素材、用在社交媒體上,這些圖像都能為你的的視覺帶來獨特的風格。
Thumbnail
Freepik除了提供素材下載外,還可以線上生成AI圖片, 圖片生成工具名為「AI Image Generator」,只需要輸入文字就能快速生成圖片,每天能免費生成 20 張圖片,還可依照自己的喜好設定不同風格、燈光、畫面尺寸等參數。
Thumbnail
Freepik除了提供素材下載外,還可以線上生成AI圖片, 圖片生成工具名為「AI Image Generator」,只需要輸入文字就能快速生成圖片,每天能免費生成 20 張圖片,還可依照自己的喜好設定不同風格、燈光、畫面尺寸等參數。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
今日分享Gemini它是Bard 進階變升版,能力更強大了,不過我還是喜歡它的圖片辦示AI能力,尤其是在上課時常常會拍照老師上課的投影片或是看書覺得重要點會照片做筆記,之前需要回去之後再整理,但也是要花時間就偷懶,但是這次功能我一直很喜歡,讓我來示範。這次以【打造第二大腦】中有重點PARA運用,拍
Thumbnail
今日分享Gemini它是Bard 進階變升版,能力更強大了,不過我還是喜歡它的圖片辦示AI能力,尤其是在上課時常常會拍照老師上課的投影片或是看書覺得重要點會照片做筆記,之前需要回去之後再整理,但也是要花時間就偷懶,但是這次功能我一直很喜歡,讓我來示範。這次以【打造第二大腦】中有重點PARA運用,拍
Thumbnail
上圖是根據彩色故事腳本生成的照片與草圖。 運用圖生圖的原理,把AI視覺故事腳本的其中一個畫面。擷取出來。 輸入重新繪製這張圖片 AI 會自然根據草圖,重新繪製元素一樣的精細畫面。
Thumbnail
上圖是根據彩色故事腳本生成的照片與草圖。 運用圖生圖的原理,把AI視覺故事腳本的其中一個畫面。擷取出來。 輸入重新繪製這張圖片 AI 會自然根據草圖,重新繪製元素一樣的精細畫面。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
這篇要搭建一個同時生成寫實照片跟動漫風格圖片的工作流,還可以幫線稿上色。
Thumbnail
這篇要搭建一個同時生成寫實照片跟動漫風格圖片的工作流,還可以幫線稿上色。
Thumbnail
在學習描寫文的過程中,將思維視覺化是一個重要的教學策略。通過使用AI生成圖片功能,教師能夠幫助學生將抽象的描述轉化為具體的圖像。
Thumbnail
在學習描寫文的過程中,將思維視覺化是一個重要的教學策略。通過使用AI生成圖片功能,教師能夠幫助學生將抽象的描述轉化為具體的圖像。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News