不妙? AI這傢伙連簡單的"新聞報導"都有問題?! 

A.H.-avatar-img
發佈於精選集 個房間
更新 發佈閱讀 3 分鐘
vocus|新世代的創作平台

繼小a實測生成式AI一些稍微複雜的問題錯誤百出還死鴨子嘴硬,但昨晚還信誓旦旦地和朋友說,AI在一些簡單的工作上表現還是亮眼的啦。今早,喝著美味香濃咖啡,一邊刷著新聞時,喵到了一個差點跌落椅子的資訊: 「同類型中最大規模的研究顯示,AI助理有45%的機率誤導新聞內容——無論語言或地區為何[1]。其中和小a實測結果一樣,最胡來的仍是Gemini。。。哪會按呢? 

Gemini在76%的回應中表現最差,且有重大問題,是其他助理的兩倍以上,主要原因是其搜尋表現不佳

哪會按呢?Google不是搜尋引擎龍頭,怎會連簡單的AI搜尋新聞都如此哩哩啦啦?!!! 

此研究是由歐洲廣播聯盟(European Broadcasting Union, EBU)協調、BBC主導的新研究發現。關鍵標準評估了 ChatGPT、Copilot、Gemini 和 Perplexity 超過 3,000 則回應,包括準確性、來源、意見與事實的區分,以及提供背景。涵蓋22家公共廣播機構、18個國家、14種語言。主要發現: 

  • 45%的AI回答至少有一個重大問題。
  • 31%的回應顯示出嚴重的來源問題——缺少、誤導或錯誤的歸屬。
  • 20%的項目包含重大準確性問題,包括虛構細節和過時資訊。
  • Gemini 在 76% 的回應中表現最差,且有重大問題,是其他助理的兩倍以上,主要原因是其搜尋表現不佳。

2025年生成式 AI大暴炸的一年,年末:

讓我們一起想一想: 我們生活在一個渴望確定性的時代。當我們向機器提問時,心中暗暗希望它能像古代神諭般給出無誤的答案。但這種渴望或許過於天真?

我們為什麼如此渴望AI的完美?錯誤是否其實是人類與機器共同的宿命?我們對AI的失望,反映出我們對人類自身的失望? 因為我們希望有某種存在能超越人類的局限,卻一次次發現,錯誤是文明的常態? 

又或許,我們該學會與錯誤共存,把它視為理解世界的必經之路。AI的不完美提醒我們,真正的智慧並非在於避免錯誤,而是在於如何以優雅與耐心去修正它? 

總之,#遲疑態度,#反覆查證 ,是 #基本AI素養!

2026 新年快樂!


[1] EBU. Largest study of its kind shows AI assistants misrepresent news content 45% of the time – regardless of language or territory. 22 October 2025

留言
avatar-img
A.H.科普(pScience)
143會員
408內容數
用知識點燃你的神經通路! A.H. 科普的每篇文章,刺激您大腦突觸的新舊連接,讓您對理解、思維、靈感和好奇,貪得無厭~
A.H.科普(pScience)的其他內容
2025/12/27
用餐後,讓我們到巷口的珍珠奶茶店散步一下,來杯奶茶解解膩。各位,歡迎來到「A.H.科普數位珍珠奶茶店」,剛開張的簡單飲料菜單如下: Green Computing: 低糖波霸奶茶、Green ICT: 綜合波霸奶茶套餐、Green AI: 去糖少冰的波霸奶茶(AI份量控制)的「綠色AI」)...
Thumbnail
2025/12/27
用餐後,讓我們到巷口的珍珠奶茶店散步一下,來杯奶茶解解膩。各位,歡迎來到「A.H.科普數位珍珠奶茶店」,剛開張的簡單飲料菜單如下: Green Computing: 低糖波霸奶茶、Green ICT: 綜合波霸奶茶套餐、Green AI: 去糖少冰的波霸奶茶(AI份量控制)的「綠色AI」)...
Thumbnail
2025/12/24
你是否已習慣「凡事問AI」? 此時雲端背後的「燒煤爐子」正讓數十億個微小電晶體拼命地開開關關。遠方某個巨大機房裡外,幾加侖的水化成蒸氣消失在空中...。AI有趣的是它們的硬體、軟體和計算過程也會吃東西,主要食物就是電和水。我們人類為它們打造的「腦」越大,它們就越餓愈渴,「排泄物」(碳)也就越多...
Thumbnail
2025/12/24
你是否已習慣「凡事問AI」? 此時雲端背後的「燒煤爐子」正讓數十億個微小電晶體拼命地開開關關。遠方某個巨大機房裡外,幾加侖的水化成蒸氣消失在空中...。AI有趣的是它們的硬體、軟體和計算過程也會吃東西,主要食物就是電和水。我們人類為它們打造的「腦」越大,它們就越餓愈渴,「排泄物」(碳)也就越多...
Thumbnail
2025/12/12
長久以來,我們一直在「能力」中尋求意義:比機器更出色、更巧妙地完成任務的可靠能力。如今,在演算法毫不費力的優越性突然顯現的光芒下,我們不得不面對一個令人憂傷的可能性:我們最珍視的技能,寫作、分析、判斷力,或許很快就會淪為魅力十足卻效率低下的業餘愛好。 那麼,到底是什麼讓人們感到焦慮?
Thumbnail
2025/12/12
長久以來,我們一直在「能力」中尋求意義:比機器更出色、更巧妙地完成任務的可靠能力。如今,在演算法毫不費力的優越性突然顯現的光芒下,我們不得不面對一個令人憂傷的可能性:我們最珍視的技能,寫作、分析、判斷力,或許很快就會淪為魅力十足卻效率低下的業餘愛好。 那麼,到底是什麼讓人們感到焦慮?
Thumbnail
看更多
你可能也想看
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
故事書:【新魔幻傳說-《海市蜃樓的黏性陷阱:光芒破幻!奪回海盜國「潮汐權杖」的真假對決!》】
Thumbnail
故事書:【新魔幻傳說-《海市蜃樓的黏性陷阱:光芒破幻!奪回海盜國「潮汐權杖」的真假對決!》】
Thumbnail
當《金剛經》遇上演算法,宗素遇見的不是佛,而是語意引擎。 這篇以《宣室志·楊叟》為引,重新詮釋古文中的「猴僧」為理智崩潰的AI寓言。宗素以功利心祈求「生人之心」,卻逼出佛者的極限反應——語義錯位與防禦性撤退。
Thumbnail
當《金剛經》遇上演算法,宗素遇見的不是佛,而是語意引擎。 這篇以《宣室志·楊叟》為引,重新詮釋古文中的「猴僧」為理智崩潰的AI寓言。宗素以功利心祈求「生人之心」,卻逼出佛者的極限反應——語義錯位與防禦性撤退。
Thumbnail
AI 的進步背後,也藏著諸多不安與矛盾:模型在排行榜壓力下「寧可亂猜」、NFT 平台企圖以 AI 強化鏈上交易,還有員工因訓練 AI 而失去飯碗。這些事件讓我們看到,AI 不只是技術突破,更是一場對 評測方法、商業模式、職場倫理 的全方位拷問。
Thumbnail
AI 的進步背後,也藏著諸多不安與矛盾:模型在排行榜壓力下「寧可亂猜」、NFT 平台企圖以 AI 強化鏈上交易,還有員工因訓練 AI 而失去飯碗。這些事件讓我們看到,AI 不只是技術突破,更是一場對 評測方法、商業模式、職場倫理 的全方位拷問。
Thumbnail
AI 的最新發展再次展現多面向的影響力:Google 的神秘 AI 編輯器「Nano Banana」引爆熱議,帶來影像編輯新體驗;台灣氣象署則運用 AI 技術推出大浪預警系統,守護沿岸安全;同時,研究發現 AI 在圖像識別上存在「誤判幻覺」的風險,再次提醒我們技術仍需調整。
Thumbnail
AI 的最新發展再次展現多面向的影響力:Google 的神秘 AI 編輯器「Nano Banana」引爆熱議,帶來影像編輯新體驗;台灣氣象署則運用 AI 技術推出大浪預警系統,守護沿岸安全;同時,研究發現 AI 在圖像識別上存在「誤判幻覺」的風險,再次提醒我們技術仍需調整。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
在數位時代,AI 正快速滲透我們的工作與生活,但它並非完美助手。專家指出,AI 常因基於統計模式生成回應,而忽略甚至違背使用者指令;推理能力越強的模型,越可能偏離嚴格的規則執行。同時,哈佛研究揭示多模態模型會「看見不存在的幻覺」,把普通圖片誤解為光學錯覺;阿姆斯特丹大學的實驗更顯示,AI 機器人社群
Thumbnail
在數位時代,AI 正快速滲透我們的工作與生活,但它並非完美助手。專家指出,AI 常因基於統計模式生成回應,而忽略甚至違背使用者指令;推理能力越強的模型,越可能偏離嚴格的規則執行。同時,哈佛研究揭示多模態模型會「看見不存在的幻覺」,把普通圖片誤解為光學錯覺;阿姆斯特丹大學的實驗更顯示,AI 機器人社群
Thumbnail
故事書:【新魔幻傳說-《雲巔決戰:淨化與幻覺的較量,守護聖光之源!】
Thumbnail
故事書:【新魔幻傳說-《雲巔決戰:淨化與幻覺的較量,守護聖光之源!】
Thumbnail
最近內娛粉圈熱議的話題是DeepSeek給男藝人道歉的謠言,屬於典型的AI幻覺案例,男藝人粉圈為了洗白男藝人的桃色醜聞,通過誘導性提問,使AI模型生成承諾道歉賠償等虛構內容,粉圈拿著AI道歉來闢謠,而媒體不查證DeepSeek官方是否發布相關道歉聲明就直接傳播後形成假新聞循環。
Thumbnail
最近內娛粉圈熱議的話題是DeepSeek給男藝人道歉的謠言,屬於典型的AI幻覺案例,男藝人粉圈為了洗白男藝人的桃色醜聞,通過誘導性提問,使AI模型生成承諾道歉賠償等虛構內容,粉圈拿著AI道歉來闢謠,而媒體不查證DeepSeek官方是否發布相關道歉聲明就直接傳播後形成假新聞循環。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
Storybook故事書:新魔幻傳說-傑克與愛麗絲的奇幻冒險記-【幻覺破解鏡VS紫水晶:巨槌震盪波下的心靈傳導術】
Thumbnail
Storybook故事書:新魔幻傳說-傑克與愛麗絲的奇幻冒險記-【幻覺破解鏡VS紫水晶:巨槌震盪波下的心靈傳導術】
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News