付費限定

AI 版的「diff 工具」：找出新模型到底哪裡怪怪的

美國女科學家Kiki

發佈於沙龍創始俱樂部

2026/04/07 更新2026/04/07 發佈閱讀 6 分鐘

每次有新的 AI 模型 release 的時候，開發者都會跑一大堆測試，去看它的表現好不好、安不安全。但老實說，這些測試其實不夠。

因為這些 benchmark 都是人寫的，所以只能測「我們已經想得到的風險」。那種還沒被發現、還沒被定義的問題（就是那種 unknown unknowns），基本上是抓不到的。

以行動支持創作者！付費即可解鎖

本篇內容共 2370 字、0 則留言，僅發佈於沙龍創始俱樂部你目前無法檢視以下內容，可能因為尚未登入，或沒有該房間的查看權限。

留言

Kiki的沙龍

9會員

115內容數

心繫正體中文的科學家，立志使用正體中文撰寫文章。此沙龍預計涵蓋各項資訊科技知識分享與學習心得

Kiki的沙龍的其他內容

2026/04/06

MCP 跟 Function Calling的差異與選擇

很多人會直覺覺得：「欸～MCP 出來了，那 Function Calling 是不是就過時了？」但其實完全不是這樣耶！這兩個東西不是競爭關係！！

2026/04/06

MCP 跟 Function Calling的差異與選擇

很多人會直覺覺得：「欸～MCP 出來了，那 Function Calling 是不是就過時了？」但其實完全不是這樣耶！這兩個東西不是競爭關係！！

2026/04/05

Claude Code省錢－教你節省75% Tokens

Claude Code 是有 token 限制的（5小時內） Pro：約 44,000 Max：再多一點本文教你節省75% Tokens

2026/04/05

Claude Code省錢－教你節省75% Tokens

Claude Code 是有 token 限制的（5小時內） Pro：約 44,000 Max：再多一點本文教你節省75% Tokens

2026/04/04

Claude Code 超完整指南

功能一次看懂＋超好用的 Claude Code 技巧解說如果你平常有在 terminal 裡面工作，然後又很常寫 code、修 bug、改專案，其實 Claude Code 真的會有一種「欸這工具也太懂我了吧」的感覺。本文讓你一次了解 Anthropic 官方推出的 Claude技巧

2026/04/04

Claude Code 超完整指南

看更多

你可能也想看

詹育杰的沙龍

《轉轉生 Re:INCARNATION》：Qudus Onikeku、約魯巴哲學與 Afrobeat 的去殖民身體政治

《轉轉生》（Re:INCARNATION）為奈及利亞編舞家庫德斯．奧尼奎庫與 Q 舞團創作的當代舞蹈作品，結合拉各斯街頭節奏、Afrobeat／Afrobeats、以及約魯巴宇宙觀的非線性時間，建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發，解析其去殖民的身體政治。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

詹育杰的沙龍

《轉轉生 Re:INCARNATION》：Qudus Onikeku、約魯巴哲學與 Afrobeat 的去殖民身體政治

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

Baozilla, Let's go!

🐳 寶寶吉拉科技日報 🐳 | 2025年12月19日

1. Gemini 應用程式新增 Nano Banana 手繪加註功能，支援 AI 生成影片辨識 📌 關鍵字： Gemini、Nano Banana、手繪加註、圖片編修、AI生成影片辨識、SynthID數位浮水印 📝 摘要： Google Gemini 應用程式推出全新的圖片編輯方式，使

#市場#創作自由#方格新手

2025/12/19

Baozilla, Let's go!

🐳 寶寶吉拉科技日報 🐳 | 2025年12月19日

#市場#創作自由#方格新手

2025/12/19

LAVI品質價值投資

中興保全科技(9917) : 保全巨人構畫智慧城市藍圖

AI如何應用，是每間公司需要去思考的一項大轉變，在未來的時代沒有使用AI的企業將會逐步被淘汰，而懂得利用AI的將成為新世代的贏家。AI的落地是我們應該關注的議題，舉凡像是機器人及網路上的應用等等，而在於政府大力推動的智慧城市部分，便是一項能使AI落地的使用方式。

#中保科#9917#新保

2026/02/10

LAVI品質價值投資

中興保全科技(9917) : 保全巨人構畫智慧城市藍圖

#中保科#9917#新保

2026/02/10

Baozilla, Let's go!

🐳 寶寶吉拉科技日報 🐳 | 2025年6月10日

🚗 Waymo、特斯拉來勢洶洶 Mobileye 遭砍評級股價跌關鍵字： Mobileye、Waymo、特斯拉、ADAS、自駕車、股價下跌摘要：隨著自動駕駛技術快速發展，Mobileye 面臨來自 Waymo 和特斯拉的激烈競爭。高盛分析師將其投資評級從「買進」下調至「持有」，導致股

#半導體產業#人工智慧#創作自由

2025/06/10

Baozilla, Let's go!

🐳 寶寶吉拉科技日報 🐳 | 2025年6月10日

#半導體產業#人工智慧#創作自由

2025/06/10

Baozilla, Let's go!

2025 科技未來預測：麥肯錫報告揭示 5 個反直覺的真相

前言：超越每日頭條每天，我們都被源源不絕的科技新聞所淹沒，尤其是關於人工智慧 (AI) 的消息，有時甚至讓人感到疲憊。從新的大型語言模型到無數的應用程式，要分辨哪些是真正的趨勢，哪些只是短暫的熱潮，變得越來越困難。本文的目的正是為了撥開迷霧，深入探討《麥肯錫 2025 年科技趨勢展望》報告中

#AWS#微軟#內耗

2025/11/26

Baozilla, Let's go!

2025 科技未來預測：麥肯錫報告揭示 5 個反直覺的真相

#AWS#微軟#內耗

2025/11/26

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11