原標題:猜猜誰是AI辯手
大屏幕上,長相、穿戴一模一樣的兩位辯手,對涉及情感、倫理、心理學、哲學的辯題“如果能一鍵消除所有痛苦回憶,要不要按”展開激烈辯論。其中,一方辯手是真人陳銘——武漢大學教師,另一方“辯手”則是AI陳銘——上海稀宇科技(MiniMax)提供的大模型。
在7月26日舉辦的“2025中國·AI盛典”辯論賽賽后投票中,42%的觀眾把大模型認作人類,這表示該款大模型已通過了人機辯論的圖靈測試。
圖靈測試是衡量機器是否具備人類智能水平的經典標準,由被譽為“人工智能之父”的圖靈在1950年提出:如果一臺機器在自然語言對話中能“騙過”超過30%的人類參與者,那就可以被視作具有智能。
該大模型圖靈測試的成功,不僅標志著我國在AI自然語言理解和邏輯思維方面取得重大進展,也展現出上海作為全球AI高地的創新實力。科技日報記者了解到,這位“辯手”的文本大模型學習了萬億條人類數據,而其語音大模型僅需6秒聲音片段即能模擬真實人聲。辯論影像則由節目組運用AI技術統一處理,100位觀眾僅憑辯論內容、語言風格和思維邏輯判斷誰是人類。
在辯論中,AI陳銘的表現亮點眾多。例如在論點構建中,針對“人工智能是否應擁有法律人格”等辯題,其能快速檢索法律條文、倫理案例,構建多層次論證框架;在臨場應變時,面對人類辯手的即興詰問,其可在半秒內生成反駁話術,比如在“技術失業”議題中能結合制造業自動化數據提出“崗位結構轉型”新視角;在情感渲染方面,其通過語音合成技術模擬語氣變化,在“教育公平”辯論中以富有感染力的敘述引發觀眾共鳴。
賽后,曾多次獲得國際辯論賽冠軍的陳銘在社交媒體上稱:“對于推理能力的成熟程度,辯論幾乎是最佳試金石。以我這次的親身體驗來看,經過針對性訓練的推理大模型,辯論能力恐已超過90%的人類辯手。觀點、邏輯、金句,再加上極富感染力的輸出,AI流暢無比,信手拈來,在語言技術上人類幾乎已經沒有什么自留地了。”同時,他也認為AI尚未完美,“最后的榮耀,還是那些在‘大’問題的深度思考。對于根本性哲學思考的觀點突圍,AI仍力有不逮。”
上海交通大學人工智能學院院長李頡認為,該模型在辯論場景的突破為AI在政務咨詢、金融談判等強交互領域的應用提供了新范式。目前,MiniMax已與復旦大學合作,將相關技術應用于科技倫理審查智能體系統“一鑒”,實現倫理風險自動標注與合規性分析。
這場圖靈測試的意義,早已超越了簡單的“辨別人機”。中國工程院院士、之江實驗室主任王堅告訴記者:“當年的圖靈測試為人工智能定了一個極具挑戰的目標。今天我們看到,通過圖靈測試只是人工智能下一個新的開始。”