2026 新年快樂!

不妙? AI這傢伙連簡單的"新聞報導"都有問題?!

A.H.

發佈於精選集等個房間

2026/01/11 更新2025/12/31 發佈閱讀 3 分鐘

繼小a實測生成式AI一些稍微複雜的問題錯誤百出還死鴨子嘴硬，但昨晚還信誓旦旦地和朋友說，AI在一些簡單的工作上表現還是亮眼的啦。今早，喝著美味香濃咖啡，一邊刷著新聞時，喵到了一個差點跌落椅子的資訊: 「同類型中最大規模的研究顯示，AI助理有45%的機率誤導新聞內容——無論語言或地區為何」[1]。其中和小a實測結果一樣，最胡來的仍是Gemini。。。哪會按呢？

Gemini在76%的回應中表現最差，且有重大問題，是其他助理的兩倍以上，主要原因是其搜尋表現不佳。

哪會按呢？Google不是搜尋引擎龍頭，怎會連簡單的AI搜尋新聞都如此哩哩啦啦?!!!

此研究是由歐洲廣播聯盟(European Broadcasting Union, EBU)協調、BBC主導的新研究發現。關鍵標準評估了 ChatGPT、Copilot、Gemini 和 Perplexity 超過 3,000 則回應，包括準確性、來源、意見與事實的區分，以及提供背景。涵蓋22家公共廣播機構、18個國家、14種語言。主要發現：

45%的AI回答至少有一個重大問題。
31%的回應顯示出嚴重的來源問題——缺少、誤導或錯誤的歸屬。
20%的項目包含重大準確性問題，包括虛構細節和過時資訊。
Gemini 在 76% 的回應中表現最差，且有重大問題，是其他助理的兩倍以上，主要原因是其搜尋表現不佳。

2025年生成式 AI大暴炸的一年，年末:

讓我們一起想一想: 我們生活在一個渴望確定性的時代。當我們向機器提問時，心中暗暗希望它能像古代神諭般給出無誤的答案。但這種渴望或許過於天真?

我們為什麼如此渴望AI的完美？錯誤是否其實是人類與機器共同的宿命？我們對AI的失望，反映出我們對人類自身的失望? 因為我們希望有某種存在能超越人類的局限，卻一次次發現，錯誤是文明的常態?

又或許，我們該學會與錯誤共存，把它視為理解世界的必經之路。AI的不完美提醒我們，真正的智慧並非在於避免錯誤，而是在於如何以優雅與耐心去修正它?

總之，#遲疑態度，#反覆查證，是 #基本AI素養!

2026 新年快樂!

[1] EBU. Largest study of its kind shows AI assistants misrepresent news content 45% of the time – regardless of language or territory. 22 October 2025

A.H.科普(pScience)精選集即時精選A.H.科普(pScience)資訊科學AI抱抱

留言

A.H.科普(pScience)

143會員

408內容數

用知識點燃你的神經通路！ A.H. 科普的每篇文章，刺激您大腦突觸的新舊連接，讓您對理解、思維、靈感和好奇，貪得無厭~

A.H.科普(pScience)的其他內容

2025/12/27

吃電吃水又吐碳的AI，來杯去糖少冰波霸奶茶: Part II

用餐後，讓我們到巷口的珍珠奶茶店散步一下，來杯奶茶解解膩。各位，歡迎來到「A.H.科普數位珍珠奶茶店」，剛開張的簡單飲料菜單如下: Green Computing: 低糖波霸奶茶、Green ICT: 綜合波霸奶茶套餐、Green AI: 去糖少冰的波霸奶茶（AI份量控制）的「綠色AI」）...

2025/12/27

吃電吃水又吐碳的AI，來杯去糖少冰波霸奶茶: Part II

2025/12/24

吃電吃水又吐碳的AI，淋上永續減碳醬: Part I

你是否已習慣「凡事問AI」? 此時雲端背後的「燒煤爐子」正讓數十億個微小電晶體拼命地開開關關。遠方某個巨大機房裡外，幾加侖的水化成蒸氣消失在空中...。AI有趣的是它們的硬體、軟體和計算過程也會吃東西，主要食物就是電和水。我們人類為它們打造的「腦」越大，它們就越餓愈渴，「排泄物」（碳）也就越多...

2025/12/24

吃電吃水又吐碳的AI，淋上永續減碳醬: Part I

2025/12/12

被快速計算的AI嚇到了? 使用令人害怕，不用也令人焦慮?

長久以來，我們一直在「能力」中尋求意義：比機器更出色、更巧妙地完成任務的可靠能力。如今，在演算法毫不費力的優越性突然顯現的光芒下，我們不得不面對一個令人憂傷的可能性：我們最珍視的技能，寫作、分析、判斷力，或許很快就會淪為魅力十足卻效率低下的業餘愛好。那麼，到底是什麼讓人們感到焦慮？

2025/12/12

被快速計算的AI嚇到了? 使用令人害怕，不用也令人焦慮?

#AI 的其他內容

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

好好宅在家

AI盛行下，我卻感受到「老派」設計的浪漫。

方格子 vocus 官方沙龍

【4月靈感產生器】TOP 100 關鍵字：「○○」格友最愛用

你可能也想看

小P趨勢投資

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

背景：從冷門配角到市場主線，算力與電力被重新定價小P從2008進入股市，每一個時期的投資亮點都不同，記得2009蘋果手機剛上市，當時蘋果只要在媒體上提到哪一間供應鏈，隔天股價就有驚人的表現，當時光學鏡頭非常熱門，因為手機第一次搭上鏡頭可以拍照，也造就傳統相機廠的殞落，如今手機已經全面普及，題

#AI#算力#電力

2026/04/11

小P趨勢投資

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

#AI#算力#電力

2026/04/11

阿安的沙龍

故事書:【新魔幻傳說-《海市蜃樓的黏性陷阱：光芒破幻！奪回海盜國「潮汐權杖」的真假對決！》】

#繪畫#AI繪圖#插畫

2025/12/04

阿安的沙龍

故事書:【新魔幻傳說-《海市蜃樓的黏性陷阱：光芒破幻！奪回海盜國「潮汐權杖」的真假對決！》】

#繪畫#AI繪圖#插畫

2025/12/04

同安書室

AI猴與心不可得：晚唐妖異中的語言幻覺(chatgpt)

當《金剛經》遇上演算法，宗素遇見的不是佛，而是語意引擎。這篇以《宣室志·楊叟》為引，重新詮釋古文中的「猴僧」為理智崩潰的AI寓言。宗素以功利心祈求「生人之心」，卻逼出佛者的極限反應——語義錯位與防禦性撤退。

#宣室志#楊叟#AI寓言

2025/10/11

同安書室

AI猴與心不可得：晚唐妖異中的語言幻覺(chatgpt)

#宣室志#楊叟#AI寓言

2025/10/11

九運科技

AI矛盾時代：亂猜的幻覺、鏈上新賭局、職場被取代

AI 的進步背後，也藏著諸多不安與矛盾：模型在排行榜壓力下「寧可亂猜」、NFT 平台企圖以 AI 強化鏈上交易，還有員工因訓練 AI 而失去飯碗。這些事件讓我們看到，AI 不只是技術突破，更是一場對評測方法、商業模式、職場倫理的全方位拷問。

#AI新聞#閱讀心得#方格新手

2025/09/09

九運科技

AI矛盾時代：亂猜的幻覺、鏈上新賭局、職場被取代

#AI新聞#閱讀心得#方格新手

2025/09/09

九運科技

Google Nano Banana、AI大浪預警、模型幻覺誤判

AI 的最新發展再次展現多面向的影響力：Google 的神秘 AI 編輯器「Nano Banana」引爆熱議，帶來影像編輯新體驗；台灣氣象署則運用 AI 技術推出大浪預警系統，守護沿岸安全；同時，研究發現 AI 在圖像識別上存在「誤判幻覺」的風險，再次提醒我們技術仍需調整。

#閱讀心得#方格新手#科技

2025/08/20

九運科技

Google Nano Banana、AI大浪預警、模型幻覺誤判

#閱讀心得#方格新手#科技

2025/08/20

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

這是一場修復文化與重建精神的儀式，觀眾不需要完全看懂《遊林驚夢：巧遇Hagay》，但你能感受心與土地團聚的渴望，也不急著在此處釐清或定義什麼，但你的在場感受，就是一條線索，關於如何找著自己的路徑、自己的聲音。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

詹育杰的沙龍

《轉轉生 Re:INCARNATION》：Qudus Onikeku、約魯巴哲學與 Afrobeat 的去殖民身體政治

《轉轉生》（Re:INCARNATION）為奈及利亞編舞家庫德斯．奧尼奎庫與 Q 舞團創作的當代舞蹈作品，結合拉各斯街頭節奏、Afrobeat／Afrobeats、以及約魯巴宇宙觀的非線性時間，建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發，解析其去殖民的身體政治。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

詹育杰的沙龍

《轉轉生 Re:INCARNATION》：Qudus Onikeku、約魯巴哲學與 Afrobeat 的去殖民身體政治

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

九運科技

AI 的盲點與偏差：指令、幻覺、社群實驗

在數位時代，AI 正快速滲透我們的工作與生活，但它並非完美助手。專家指出，AI 常因基於統計模式生成回應，而忽略甚至違背使用者指令；推理能力越強的模型，越可能偏離嚴格的規則執行。同時，哈佛研究揭示多模態模型會「看見不存在的幻覺」，把普通圖片誤解為光學錯覺；阿姆斯特丹大學的實驗更顯示，AI 機器人社群

2025/08/22

2025/08/22

故事書:【新魔幻傳說-《雲巔決戰：淨化與幻覺的較量，守護聖光之源！】

#AI繪圖#插畫#繪畫

2025/12/04

阿安的沙龍

故事書:【新魔幻傳說-《雲巔決戰：淨化與幻覺的較量，守護聖光之源！】

#AI繪圖#插畫#繪畫

2025/12/04

內娛嗑學觀察及軼聞趣事分享

AI幻覺案例：DeepSeek給男藝人道歉的謠言

最近內娛粉圈熱議的話題是DeepSeek給男藝人道歉的謠言，屬於典型的AI幻覺案例，男藝人粉圈為了洗白男藝人的桃色醜聞，通過誘導性提問，使AI模型生成承諾道歉賠償等虛構內容，粉圈拿著AI道歉來闢謠，而媒體不查證DeepSeek官方是否發布相關道歉聲明就直接傳播後形成假新聞循環。

#中國#假新聞#人工智能

2025/07/04

內娛嗑學觀察及軼聞趣事分享

AI幻覺案例：DeepSeek給男藝人道歉的謠言

#中國#假新聞#人工智能

2025/07/04

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11