
『讀懂大模型:技術創新、商業應用與產業變革』一書的節選,由中國電信天翼智庫大模型研究團隊編寫,並於2024年8月出版。它全面概述了人工智慧(AI)和大型模型的發展歷程,從早期的規則驅動(AI 1.0)到數據驅動的深度學習(AI 2.0),以及當前以大模型為標誌的認知智慧時代(AI 3.0)。資料詳細介紹了大模型的基礎架構、微調技術、強化學習以及安全與隱私保護等核心技術,同時探討了AI未來的進化方向,包括通用人工智慧(AGI)和矽基生命的潛力。
「智慧湧現」(Emergent Abilities)被視為大型模型(大模型)發展中的一個關鍵里程碑,在一定程度上被視為人工智慧的智慧覺醒。
以下是根據來源資料對大模型智慧湧現的核心看法和特徵的闡述:核心概念與定義智慧湧現指的是大型語言模型在執行任務時展現出出乎意料的行為、思想或想法。• 驅動因素:湧現能力通常指的是系統的行為是受到隱性因素所驅動,而非透過顯式構建的方式實現。
• 新路徑:大模型的出現,特別是展現出的強大智慧湧現能力,開闢了人類邁向實現通用人工智慧(AGI)的新路徑。
• 規模門檻:大模型的某些能力,例如上下文學習、指令遵循和逐步推理等,只有在模型規模增加到一定程度時才會顯現。這表明模型規模是實現湧現能力的先決條件。湧現能力的兩大主要特徵湧現能力與傳統模型性能的線性提升不同,它表現出以下兩項核心特徵:
1. 非線性變化:隨著模型規模的擴大,模型的性能可能會發生非線性、不可預測的變化。
2. 突發性(Abruptness):湧現能力可能在模型規模擴大時突然以意外的方式顯現,無法通過簡單的線性推斷來預測。湧現的主要能力表現從已發布的大模型能力體系來看,智慧湧現普遍體現為擁有與普通人近似水準的各項能力。