AI搜尋真的可靠？研究實測8工具「6成都答錯」這款最糟錯9成

東森財經

2025年3月18日下午9:57

由哥倫比亞大學新聞學研究所成立的陶氏數位新聞研究中心，日前發表研究顯示，人工智慧搜尋引擎大多數時候都是錯誤的，當被問及新聞文章的正確引用時，它們會向用戶提供錯誤的資訊和答案，就連目前最受歡迎的生成式AI搜尋工具包含ChatGPT、DeepSeek等同樣表現不好，整體而言超過6成的問題答案完全錯誤。

陶氏數位新聞研究中心從20家新聞機構隨機選取200篇文章（每家10篇），確保每篇文章摘錄的內容在傳統Google搜尋中，都能在前三個結果中找到原始來源，研究人員向每個AI搜尋工具提供這些摘錄，要求識別對應文章的標題、原始發布來源、發布日期和網址，並且對準確性進行評分，結果表現並不理想。

研究顯示，目前最受歡迎的生成式AI搜尋工具普遍表現不佳，整體而言超過6成的問題答案都錯誤，受測工具共有8款，包括ChatGPT Search、Perplexity、Perplexity Pro、Gemini、DeepSeek Search、Grok-2 Search、Grok-3 Search和Copilot。

根據研究顯示，在所有測試工具當中以Perplexity表現最佳，但回答錯誤率仍有37%，表現最差的則是Grok 3，回答錯誤率高達94%。研究團隊強調，「總體來說，聊天機器人通常無法檢索到正確的文章，在不同的平台上，錯誤程度也不同。」

值得一提的是，AI工具在提供錯誤答案時，很少使用「可能」、「似乎」等詞彙，總是以斬釘截鐵的說法來提供內容，也很少坦承訊息量不足，因此可能存在誤導用戶的風險，例如ChatGPT在200個回應中，僅15次表示缺乏信心，但從未拒絕提供搜尋答案。

研究團隊還發現，某些AI搜尋工具的「付費服務」，錯誤率比免費版更高，例如付費版本Perplexity Pro（每月大約新台幣639元）或是Grok 3（每月大約新台幣1278元）雖然比免費版答對更多問題，但整體錯誤率反而更高，主因在於傾向提供明確但錯誤的答案，而非拒絕回答，因此認為付費AI模型能享受更卓越的運算能力以及精確性，這種觀念可能是錯誤的。

研究也顯示，AI搜尋工具提供的網址準確度也不佳，例如超過一半來自Gemini和Grok 3的回應引用虛構或損壞的網址，導致錯誤頁面，即使在正確識別文章時，也經常連結到虛構的網址。

根據該研究團隊說法，曾經針對報告內容聯繫過這些AI工具的開發企業，只有 OpenAI和微軟做出回應，但都沒有回應有關報告發現的問題。

（封面示意圖／Pexels）

更多東森財經新聞報導

遺傳老爸？黃仁勳女兒黃敏珊GTC演講「揪團逛夜市」

堵新青安亂象！台銀、土銀揪出逾3千違規戶

最新「老黃概念股」出爐！黃仁勳狂讚矽光子：瘋狂的科技

數位時代·
外媒實測8款AI搜尋工具，高達60％都在糊弄你！最常犯的是這三大錯誤
ChatGPT、Perplexity、Gemini、DeepSeek⋯高達6成AI工具都提供了錯誤資訊，且不要以為付費模型就很安全，錯誤答案可能更多。
Reactions14
三立新聞網 setn.com·
GTC2025／打敗ChatGPT　黃仁勳公開點讚的AI是他
2025年GTC大會，黃仁勳演講，點名了Perplexity，大力稱讚Perplexity的團隊。Perplexity以創新的AI搜尋技術顛覆傳統搜尋模式，運用生成式 AI 即時提供準確的搜尋結果並附上可靠的資料來源，提升搜尋的透明度與可信度，改變使用者的搜尋體驗。
Reactions1
品觀點·
ChatGPT 與職場革命：你會被取代，還是更強大？
當 ChatGPT 這類生成式 AI 迅速席捲全球，各行各業都開始思考：這是一場生產力革命，還是職場危機？AI會不會取代人類？答案很簡單...
中時財經即時·
不是ChatGPT 黃仁勳公開大讚「每天愛用」AI聊天機器人
輝達GTC大會受到高度關注，執行長黃仁勳在過程中大力稱讚Perplexity團隊，並公開雙方最新的合作。事實上，輝達是Perplexity的投資者之一，發展潛力受到高度肯定，黃仁勳先前也透露，Perplexity的對話式聊天機器人是每天慣用的AI搜尋引擎。
品觀點·
高師大翻轉課程全面啟動AI教育
國立高雄師範大學啟動「好AI高師大」，導入最新AI技術與課程，打造智慧學習環境，讓學生及在職進修者，都能掌握AI發展趨勢，提升未來競爭力。
工商時報·
最純AI軟體股意藍Q2轉上櫃
最純AI軟體股意藍（6925）將於第二季轉上櫃。意藍資訊總經理楊立偉表示，意藍以數據分析為主要業務，今年將推出AI模型，明年也會加入AI代理產品。該公司為標準「三高」軟體公司，雲端服務營收貢獻占比逾8成，續約率85％以上，毛利率也逾8成。
國立教育廣播電台·
教育部《和AI做朋友》超過2.7萬次下載應用
為了讓學生也能學習時下最熱門的人工智慧(AI)，教育部107年特別出版《和AI做朋友》補充教材、教案示範例，並發展數位教材，提供教師下載使用，目前已經有超過2萬7千次的下載，超過300人次的教師參
工商時報·
企業管理－提升AI技能有效解決技能短缺問題及提高人才留任率
在企業數位轉型的過程中，生成式AI正在成為驅動變革的核心力量。它不僅是技術的創新，而是一種重新定義業務流程的方式。企業可以透過建立各種智能系統來提升效率，並確保知識的傳承和管理。
時報資訊·
《基金》台股震盪高息ETF逆勢漲
【時報-台北電】近期美股重挫，台股受累近一個月跌近4％，但高股息資產受息收保護，具易漲抗跌特性，58檔台股ETF近一個月平均僅下跌2.84％，其中有19檔正報酬且平均績效1.19％，前十名皆高股息ETF，凸顯高股息資產穩健特性，在金融市場變數大、投資避險情緒升溫時，成為最佳資金避風港。台新永續高息中小ETF（00936）經理人黃鈺民表示，台灣資本市場相較於其他新興市場國家具有良好的經濟體質及產業結構，但類股輪動快速、個股波動性大，台灣高股息ETF主要集中於大型股，現階段權值股估值相對高，中小型股仍存潛在成長機會，近期台灣權值股面臨下殺壓力，中小型股表現相對有撐。群益科技高息成長ETF（00946）經理人洪祥益指出，儘管近期科技族群在先後面對DeepSeek問世，和美國關稅議題干擾而波動頻頻，但AI長期發展動能仍強勁，長期在DeepSeek這類低成本AI模型助攻下，不僅讓過往資金過於集中特定科技股的情況有所改變，部分資金移轉至先前評價較低、基本面逐步改善，且也同步受惠AI大勢的科技股布局，落後補漲行情可期，更有利於AI應用加速普及，台灣科技廠有望更為廣泛的受惠於AI成長趨勢。野村投
工商時報·
一銀辦數位共識營瞄準AI創新應用
第一銀行為凝聚經營團隊共識，強化數位轉型戰略布局，3月14日特舉辦「2025數位共識營－AI創新應用研討會」，由董事長邱月琴率領董事會成員親自參與，透過與經營團隊的對話，探討數位金融的發展趨勢，共同擘劃數位藍圖，加速金融科技應用，並邀請前Google台灣分公司董事總經理、數位轉型專家簡立峰擔任主講嘉賓，分享數位金融趨勢及金融業如何善用人工智慧（AI）驅動創新。
工商時報·
專家傳真－AIoT重塑保險：智慧核保、理賠與詐欺防範新時代
隨著AI和物聯網（IoT）技術的快速發展，台灣保險與健康照護產業正迎來數位轉型的新契機。傳統的核保與理賠流程長期依賴人工審核，過程繁瑣且效率受限，而保險詐欺問題也使產業面臨龐大的財務損失。AIoT的應用不僅提升了核保與理賠的自動化與精準度，更帶來了全新的商業模式，如動態定價、預防保險與即時理賠。對台灣的資訊服務業者而言，這是進軍智慧保險市場的關鍵時刻。

Yahoo奇摩股市·
童子賢喊核電能助台灣省N個千億...郭智輝：核電占比不高
郭智輝今日出席立法院經濟委員會，會前受訪時被問及核電賺錢、水價上漲的相關議題。郭智輝表示，核電占比沒有那麼高，核電機組恢復運轉能否讓台電賺錢仍要進一步評估，至於水價部分經濟部內部仍在研擬，會採用哪種方法討論過後大院決定。
Reactions5
Yahoo奇摩股市·
庶民指標看衰台股！股民信心創25個月新低
看衰台股了？一向有「庶民指標」之稱國泰金（2882）3月《國民經濟信心報告》今（20）早出爐，其中股市樂觀程度大幅下滑，指數由正數的9.2轉-0.6外，甚至比2023年11月的-0.4還低，創下2023年2月（元月是-20.6）以來、25月新低紀錄。風險指數也同步下滑，代表股民對股市信心大減。
Reactions4
Yahoo奇摩股市·
月捧68萬租金進駐補習班成台南東區店王
近年有「古都」美稱的台南市，成為國旅勝地之一，也造就市區店面租金持續上揚，住商機構觀察實價登錄，東區東興路一處補習班，1月以每月租金總價68萬元承租，創下台南市東區歷史最高租金總價。
FTNN新聞網·
「這價位」成鴻海關鍵支撐！分析師剖析台積電、聯電前景　聯發科有望突破困境
[FTNN新聞網]記者林廷宇／綜合報導輝達（NVIDIA）GTC大會於昨（19）日登場，市場原先預期能帶帶領AI類股能重返行情，豈料市場觀望氣氛依舊濃厚，AI類股如鴻海...
Yahoo奇摩股市·
全民普發1萬...財政部遭疑「昨是今非」財長莊翠雲回應了
針對國民黨主張普發現金1萬元，藍委林德福今日（20）質疑財政部是否「吃了秤砣鐵了心」，去年財政部曾強調普發現金是與全民共享經濟成果，不會增加舉債，如今卻改變立場，將其視為破壞財政紀律，質疑其政策立場出現「昨是今非」的矛盾。對此，財政部長莊翠雲表示，「普發現金不應該常態化」。
民視影音·
連鎖火鍋試營運首日疑爆食物中毒衛生局:勒令暫停營業
財經中心／黃富溢陳妍霖莊柏驊　台北-宜蘭報導宜蘭一家連鎖吃到飽火鍋店新開幕，才剛試營運第一天，就爆出疑似集體食物中毒事件，有民眾在臉書PO文說「一家大小共9人去吃晚餐，沒想到陸續出現上吐下瀉」，PO文一出，意外釣出不少網友回說''又吐又拉''，一樣的症狀，宜蘭縣衛生局證實，已經接獲通報，累計有15名個案，也前往稽查，勒令業者暫停營業。整個餐廳空蕩蕩，沒有客人，只剩員工，宜蘭這家連鎖吃到飽火鍋店，才剛試營運第一天，沒想到卻爆出疑似食物中毒事件。宜蘭連鎖火鍋試營運疑爆食物中毒衛生局:勒令暫停營業（圖／翻攝自''宜蘭知識+臉書''）有網友在臉書PO文說，「有沒有人跟我們一樣，15號一家大小共9人去吃晚餐，陸續出現上吐下瀉」，PO文一出，有網友說「星期六晚上有去吃，星期日太太拉肚子，看醫生說是諾羅」；也有網友說，「禮拜六中午去吃，同桌4個人不同家庭全部吐、拉、發燒」，意外釣出不少網友，原來，受害的，不只一人。受害人李先生說，我們4個人去用餐，然後當天我跟我女朋友就先拉一次啦，就是有上吐下瀉，然後跟發燒，我們4個人的共通點，就是吃那家餐廳。」另一名受害人林小姐則說「小孩子的話，是禮拜一下午，我去接他的時候，他就直接在我車上吐了，我家小孩算蠻嚴重的，因為他到現在還在拉。」還有受害人，秀出藥袋照片，說18號吐完，腹瀉，胃脹痛，今天就衝去看醫生，要證明所言不假，宜蘭縣衛生局證實，已經接獲通報，累計有15名個案。宜蘭連鎖火鍋試營運疑爆食物中毒衛生局派員稽查（圖／宜蘭縣衛生局提供）宜蘭縣衛生局副局長徐秋君指出，「有關本局於今日上午陸續接獲醫院以及民眾通報疑似食品中毒事件，而發病個案於本週六日都有到本縣的某火鍋店進行用餐，其中目前累計統計有總共15位個案，產生腸胃不適症狀，其中有3位有就醫治療，本局在第一時間已經派人前往餐廳依據食品安全衛生管理法規範準則進行環境的稽查檢核，目前查獲有關環境缺失部分已經開立現改通知單，另外為避免整個事件擴大，我們與業者即日起停業，進行環境整體的整理與清消，待本局複查合格後才可復業。」衛生局已經派員稽查，也勒令業者暫停營業，餐廳也發出聲明說，19號起全面進行環境清消，人員及食材作業高標準檢視，複查合格才會恢復營業。是食材出問題？還是諾羅病毒造成，詳細報告要一周才會出爐。原文出處：宜蘭連鎖火鍋試營運疑爆食物中毒　衛生局：勒令暫停營業更多民視新聞報導台中國小少棒隊教練性侵32男童90次　檢方求法院重判徐巧芯發文蹭剴剴案稱反廢死落實正義　網轟：妳好意思？健保30年守護人民　醫界四大健保改革主張
Yahoo奇摩房地產編輯部·
抽油煙機清洗先用吸塵器？4步內到外有效清除陳年油垢！｜居家好EZ
抽油煙機是廚房中不可或缺的清潔幫手，尤其在高油煙的烹飪過程中，它能夠有效吸走煙霧和油煙，保持廚房清新。然而長期使用後，抽油煙機內部和濾網上會積聚大量油垢，這些油垢不僅影響吸力，還可能散發異味。如何清潔這些頑固油垢呢？今天就來教你一些簡單又有效的方法。
Yahoo奇摩股市·
【Yahoo早盤】台股反彈開高分析師謝明哲曝1關鍵尾盤有望延續漲勢
美國聯準會利率決策按兵不動，預測今年仍有兩次降息，美股四大指數受到消息激勵全面收紅。台股今（20）日在台積電（2330）等權值股帶動下，開在22,171點，上漲210.17點。摩爾投顧分析師謝明哲開盤後受訪表示，估加權指數在尾盤有機會延續早盤漲勢，但目前期貨空單仍有3.6萬口，需留意今日台股反彈過程中，空單是否出現回補。
今日新聞NOWnews·
綠委要「多做少說」　郭智輝：都是斷章取義
[NOWnews今日新聞]經濟部長郭智輝近期失言頻頻，包括用「蒙古症」（現稱唐氏症）比喻台積電與美國晶圓龍頭英特爾（Intel）合資。民進黨立委賴瑞隆今（20）日質詢希望，郭智輝可以「多做少說」，畢竟...
Reactions3
Yahoo奇摩房地產編輯部·
婚後跟爸媽住不好嗎？《童話故事下集》媽寶超寫實推拖拉藉口... 網友「房價不會跌No.1原因：婆媳關係」｜房市觀點
最近超夯台劇《童話故事下集》你看了嗎？因為內容相當寫實，讓許多人看劇時很有共鳴，彷彿就是身邊人正在發生的事情，尤其女主角想搬離媽寶男家，找先生一起去看房那一段，真的是印象深刻。
Reactions2
Yahoo奇摩股市·
「6大長老」接手101股權董座賈永婕：樂觀其成
針對「6大長老」聯手承接最大股東、日商伊藤忠商社持有的台北101逾半數股權，101董座賈永婕今日（20）出席立法院財委會表示，「樂觀其成，因為公股顯然是對賈董很有信心。」
Reactions4
FTNN新聞網·
資服股群開紅花！股王零壹今除息5元完成填息　「這2檔」強勢漲停
[FTNN新聞網]記者林廷宇／綜合報導Google母公司Alphabet近期發動歷年以來最大併購案，斥資資320億美元，收購雲端資安公司Wiz。利多消息帶動台股資服股群於今...
Yahoo奇摩股市·
光學一哥股價翻黑震盪…大立光除息首日暫陷貼息
大立光（3008）今（20）日除息，每股配息57.5元，參考價為2470元，今日隨大盤開高，一度來到2505元，上漲35元，盤中股價翻黑，截至上午10時20分，跌至2465元，暫陷貼息。
EBC東森財經新聞·
外資連17賣提款5451億！他揭過往紀錄：背後肯定有故事
台股近期遭到外資大提款，自2月24日至3月19日，外資已經「連17賣」，賣超金額達5450.96億，台股也自23730點一路下跌至21960點，上週《彭博》（Bloomberg）報導也指出「台股遭到外資創紀錄的賣超」，而究竟歷史上台股遭到外資連賣最多天的紀錄為何？分析師股添樂（陳相州）也給出了答案。
財訊快報·
中國平安全年淨利潤低於預期，盤中股價挫跌3.9%
【財訊快報／劉敏夫】外電報導指出，週四中國平安股價在中港兩地下跌，因此前該公司公佈全年淨利潤低於預估。當地時間10:09，中國平安(2318 HK)下跌3.9%，A股(601318 CH)跌2.9%。摩根士丹利分析師Richard Xu在報告中表示，受第四季淨息差收縮拖累，中國平安的銀行業務表現疲弱。不過銀行業務僅占21%，預計2026年有機會恢復成長。Xu表示，中國平安的財險業務仍顯健康，且擔保風險基本消除。2024年業績表現符合市場預期，創紀錄的配息率是亮點。維持中國平安「行業首選」的評級。
中央社·
財長：普發現金不宜常態化財源運用需考量國防社福
（中央社記者張璦台北20日電）立委今天再次關切普發現金議題，財政部長莊翠雲表示，普發現金不宜常態化是政府一直以來的主張，稅收優於預期，要先減少舉債、優先還債，若有賸餘就會累積到歲計賸餘，財源運用要考慮國防、社福等施政優先順序以及國家整體發展，行政院會進行通盤考量。
Reactions1
Yahoo奇摩股市·
聯準會偏鴿！台股早盤一度漲逾300點...台積電漲21至973元
美國聯準會利率不變，且傾向維持降息基調，美股一掃陰霾，台積電ADR收紅漲0.36%，台積電台北現股（2330）今（20）日開盤後站上五日線（約22056點）重返22000點，早盤以22171點開高走高，盤中上漲逾300點；台積電上漲26元或2.73％至978元。截至上午10點13分，大盤暫時在22230點附近震盪，上漲269點，台積電上漲21元或2.21％至973元。
Reactions17
財訊快報·
加拿大輸美原油降至兩年新低，布蘭特、紐約期油電子盤追高小漲
【財訊快報／陳孟朔】關稅威脅推動後，加拿大輸美原油降至兩年新低，兩大期油在週四亞洲電子盤初追高小漲。與此同時，市場也在關注川普上任首次會見美國石油行業高層，討論如何提高產量，以平抑油價，避免通膨升溫。布蘭特5月期油最新報價為0.3美元或0.4%，報71.08美元，上日收高22美分或0.31%。紐約4月期油也漲0.3美元或0.5%，報67.46美元，上日收高26美分或0.4%。美國能源信息署(EIA)週三公布的數據顯示，上週美國商業原油進口量減少8.5萬桶/日，至540萬桶/日，為2023年3月以來的最低水平。上週美國從最大供應國加拿大的原油進口量也降至兩年來的最低水平310萬桶/日，週減54.1萬桶/日。EIA數據顯示，上週美國原油庫存增加170萬桶，達到4.37億桶，超出分析師預期的51.2萬桶的增幅。然而，包括柴油和取暖油在內的餾分油庫存上週減少280萬桶，至1.148億桶，遠超預期的30萬桶的降幅。美國總統川普將於週三在白宮會見美國石油業高層，以制定在原油價格下跌和貿易戰背景下提高國內產量的計劃。這場會議定於美國東部時間下午2時開始，將是川普自今年1月重返白宮開始第二任總統以來首
今日新聞NOWnews·
心臟爆擊！黃仁勳與小機器人互動萌翻全場
[NOWnews今日新聞]輝達「GTC2025」大會於今（19）日登場，執行長黃仁勳於台灣時間凌晨1時舉行主題演講，會中談及機器人應用即將大爆發，超萌人形機器人「Blue」化身最可愛的站台嘉賓，壓軸登...
Reactions5
財訊快報·
巴西央行連續三次升息100個基點，暗示未來步伐將放緩
【財訊快報／陳孟朔】巴西央行週三例會後，做出連續第三次升息100個基點，符合先前預告，並暗示將在下次政策會議上小幅升息，因為央行正在監測經濟放緩的跡象。巴西央行的利率制定委員會(Copom)一致決定將指標利率至14.25%，這是2016年以來的最高水準，符合所有37位經濟學家的預期。「如果情況按預期發展，委員會預計下次會議調整幅度將較小，」央行決策者在宣布利率決定的聲明中寫道。同日，美國聯準會(Fed)連續兩次按兵不動，在繼續推進降息之前評估特朗普新政府的政策。巴西央行在政策聲明中寫到，由於美國經濟政策和前景，特別是圍繞貿易政策及其影響的不確定性，全球環境仍然充滿挑戰。「決策者們一直在密切關注巴西經濟活動放緩的跡象，而經濟活動在上季的疲軟程度超出預期。不過正如央行官員在最近的講話中指出的，今年初的數據仍顯示出一定的韌性。央行將2025年的通膨預測從1月的5.2%下調至5.1%，以反映最新的經濟狀況。」

相關內容

最新報導