難道得重新蓋圖書館?【2022/10~11】

更新 發佈閱讀 4 分鐘

連我這種對技術不熱衷的擦鞋童,都對 AI 能做什麼感到激昂,

就知道當時技術發展多火熱了。


尚且無須擔心股市崩盤或技術泡沫,那段時間更像是時代的浪潮、人的夢想,

延續二十世紀以來世代傳承的人工智慧發展意志,衝擊生成式 AI 根本難以實用的限制。


在我為跳脫 75 token 雀躍,嘗試加入各種外觀敘述來生成貼近特定角色形象的人物時,網友也在尋求約束隨機性的方法。既然 AI 已能生成逼真圖像,問題不在於「能不能做」而是「怎麼做到」,SD 好像認得霍格華茲的艾瑪華森,卻不曉得新月魔法學校的亞可,所以必須改變圖像生成的基底──也就是模型。


但訓練模型絕不是常人能做的事,Stable Diffusion 在亞馬遜雲端運算服務上用了 256 個 NVIDIA A100 GPU、花費 15 萬個 GPU 小時訓練,成本高達 60 萬美元。而且訓練出來幾 GB 的模型,就為了生成某個固定的東西或畫風?


vanitas vanitatum...et omnia vanitas.


為了去巷口小吃攤買宵夜,重新發明汽車是毫無意義的。在 2022 年 10 月陸續有新的方法被開發,讓人們越來越能引導 AI 生成需要的事物。


如果說模型的工作,是透過我們的提示,逐步將一張填滿隨機雜訊的圖像逐步替換為符合提示的圖像。好比人們求知若渴前往圖書館,知識是形而上的,我們無法一覽全貌,因此需要利用手上書單尋找書籍,借回所有書籍、拼湊這個主題的知識框架。即便我們造訪同一家圖書館、握有同一張書單,但知識是抽象的,同樣流程走下去,最後每個人對主題知識的理解仍然不同,就像 AI 生成圖像,太多變數影響最後出圖結果了。


尤其經過兩個月嘗試,人們發現 SD 這家圖書館的館藏有極限。


該怎麼辦呢?


  • 發起募款、蓋樓、徵才、購書,重新打造一座圖書館?

那是從頭訓練模型


  • 調整圖書館館藏書籍,甚至讓不同圖書館間館藏交流?

那是微調、合併模型,例如Dreambooth


  • 只需要這種概念,所以把這一本書加入館藏就好了吧?

那是嵌入/文本倒置(embedding/Textual Inversion)


  • 調整挑書過程,讓館藏清冊接近書單項目以精準找書?

那是超網絡(Hypernetwork)


這段時間老外瘋狂將新技術套用在自己身上,先訓練出能生成自己大頭照的微調模型,再搭配網路上分享的許多畫風微調,皮克斯 3D 角色設計似乎永不退流行,在 Bing 推出 DALL·E 3 的一年前,已經出現過把各種主題用皮克斯動畫風格呈現的熱潮了。


Stability AI 恰好在這個技術爆發的月份推出 Stable Diffusion v1.5 版本,該版本也乘上時代的浪潮,湧現大量以 1.5 版為基底練出來的各種圖像生成資源,導致未來即使功能更強大的 SD XL 推出,1.5 版依舊能在本機圖像生成上與其分庭抗禮,因為靠著網路上海量套件產出品質更高的圖片,總比花錢買更好的設備不心疼啊~


又沒有商業需求,我絕對不打算在 AI 圖像生成這種玩具上花錢 !

我碎碎唸著,繼續測試下一套提示詞。

留言
avatar-img
Bsh的沙龍
3會員
50內容數
記錄我在 2022 年 9 月之後使用 AI 生成圖像的嘗試。 這個主題總有一天會沒東西好寫,那就走一步算一步吧...…
Bsh的沙龍的其他內容
2025/05/06
雖然曾說過,筆電內圖檔、LoRA 要不要刪除,體現內心是否繼續嘗試 AI 創作的躊躇,但硬碟空間剩 2GB 叫我怎麼做事 ? 終歸要刪、終究不得已。
Thumbnail
2025/05/06
雖然曾說過,筆電內圖檔、LoRA 要不要刪除,體現內心是否繼續嘗試 AI 創作的躊躇,但硬碟空間剩 2GB 叫我怎麼做事 ? 終歸要刪、終究不得已。
Thumbnail
2025/04/29
既然 BiliBili 上分享的 LoRA 號稱可一鍵生成漫畫,我決定只寫 prompt 來引導 AI 生成漫畫頁,直到足以拼湊一段劇情為止,再來計算總共生成多少張、又從中採用多少張。
Thumbnail
2025/04/29
既然 BiliBili 上分享的 LoRA 號稱可一鍵生成漫畫,我決定只寫 prompt 來引導 AI 生成漫畫頁,直到足以拼湊一段劇情為止,再來計算總共生成多少張、又從中採用多少張。
Thumbnail
2025/04/22
或許舊作品消滅與 AI 生成風潮,只是證實內心對圖像價值的質疑。諷刺的是,我竟因為懶得開 SD 、漫無目的上網而看到新的可能性。
Thumbnail
2025/04/22
或許舊作品消滅與 AI 生成風潮,只是證實內心對圖像價值的質疑。諷刺的是,我竟因為懶得開 SD 、漫無目的上網而看到新的可能性。
Thumbnail
看更多
你可能也想看
Thumbnail
【圖解IT大全:掌握數位科技趨勢,透視未來商業模式的148個關鍵】 數位轉型、AI、IoT...是不是讓你聽得霧沙沙? 當你經常覺得… ●最近的科技浪潮令人興奮,想多了解一點 ●被一堆科技名詞搞得心煩意亂,想快速全面了解 ●覺得市面的科技科普書不是太深入就是太淺白 這本書值得一讀!
Thumbnail
【圖解IT大全:掌握數位科技趨勢,透視未來商業模式的148個關鍵】 數位轉型、AI、IoT...是不是讓你聽得霧沙沙? 當你經常覺得… ●最近的科技浪潮令人興奮,想多了解一點 ●被一堆科技名詞搞得心煩意亂,想快速全面了解 ●覺得市面的科技科普書不是太深入就是太淺白 這本書值得一讀!
Thumbnail
前言 在2024年,地球經歷著一場長久的疫情,但希望的曙光似乎終於降臨。 同時,全球科技界也在CES消費性電子產品展中展示著一場前所未有的盛宴,AI PC的新技術讓人類面對未來充滿無限的可能性。 本故事將融合疫情解封、CES展覽,以及夢幻的科技前景,為讀者帶來一場奇幻的冒險。 角色介紹
Thumbnail
前言 在2024年,地球經歷著一場長久的疫情,但希望的曙光似乎終於降臨。 同時,全球科技界也在CES消費性電子產品展中展示著一場前所未有的盛宴,AI PC的新技術讓人類面對未來充滿無限的可能性。 本故事將融合疫情解封、CES展覽,以及夢幻的科技前景,為讀者帶來一場奇幻的冒險。 角色介紹
Thumbnail
時間快轉至2030年,或許城市還無懸浮飛車,但AI先會像電力存在每一個角落。百工百業運用智慧算力,就像打開水龍頭一樣容易。這描述並非Cyberpunk科幻場景,正逐漸在世界各地悄然成形。
Thumbnail
時間快轉至2030年,或許城市還無懸浮飛車,但AI先會像電力存在每一個角落。百工百業運用智慧算力,就像打開水龍頭一樣容易。這描述並非Cyberpunk科幻場景,正逐漸在世界各地悄然成形。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
作者認為AI,它不特屬於哪一個產業,在一定時間成熟之後,它充斥你我生活之中,就是像水電一樣的自然。有很多人還搞不清楚它的未來發展到哪裡? 當這變化還很劇烈時,過早投入反而浪費時間與成本,所以作者的洞見是:什麼是你我最珍貴的價值?
Thumbnail
作者認為AI,它不特屬於哪一個產業,在一定時間成熟之後,它充斥你我生活之中,就是像水電一樣的自然。有很多人還搞不清楚它的未來發展到哪裡? 當這變化還很劇烈時,過早投入反而浪費時間與成本,所以作者的洞見是:什麼是你我最珍貴的價值?
Thumbnail
生成式AI時代第一波基本的入場券,就是要有足夠的算力。但就像2000年時網路泡沫一樣,基礎建設不是最終的解答,軟體和搭建在基礎設施上的服務才是最後能有效利用。AI鏟子伺服器相關產業鍊賣得很好,誰真的挖到礦了?
Thumbnail
生成式AI時代第一波基本的入場券,就是要有足夠的算力。但就像2000年時網路泡沫一樣,基礎建設不是最終的解答,軟體和搭建在基礎設施上的服務才是最後能有效利用。AI鏟子伺服器相關產業鍊賣得很好,誰真的挖到礦了?
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
隨著科技的飛躍進步,各行各業再次地站在新一波工業革命的門檻上:從人工智慧驅動的創意過程到區塊鏈技術重新定義的集資方式,再到虛擬實境和數位建模為視覺設計帶來的無限可能,影視製作也將徹底改頭換面。本次就來深入探索這些變革如何為觀眾帶來更加沈浸、互動和個性化的觀影體驗。
Thumbnail
隨著科技的飛躍進步,各行各業再次地站在新一波工業革命的門檻上:從人工智慧驅動的創意過程到區塊鏈技術重新定義的集資方式,再到虛擬實境和數位建模為視覺設計帶來的無限可能,影視製作也將徹底改頭換面。本次就來深入探索這些變革如何為觀眾帶來更加沈浸、互動和個性化的觀影體驗。
Thumbnail
在科技發展的浪潮中,生成式AI無疑是引領未來的關鍵力量。透過深度學習技術,AI系統能夠從大量資料中發掘規律,並創造出全新的內容,無論是文字、圖像、音頻還是視頻,都可以在AI的加持下重新定義。
Thumbnail
在科技發展的浪潮中,生成式AI無疑是引領未來的關鍵力量。透過深度學習技術,AI系統能夠從大量資料中發掘規律,並創造出全新的內容,無論是文字、圖像、音頻還是視頻,都可以在AI的加持下重新定義。
Thumbnail
人工智能的年代已經來臨。作為人類的我們應何去何從?與其與機械人比拼競爭,不如與它們合作共存。在市場學上推崇「藍海策略」(Blue Ocean Strategy),意指跨越現有競爭的邊界,拓展未存在的領域,創造新的價值與需求。
Thumbnail
人工智能的年代已經來臨。作為人類的我們應何去何從?與其與機械人比拼競爭,不如與它們合作共存。在市場學上推崇「藍海策略」(Blue Ocean Strategy),意指跨越現有競爭的邊界,拓展未存在的領域,創造新的價值與需求。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News