作为通用人工智能的重要进展,ChatGPT的出现引起了学术界和产业界人士的广泛关注。本书系统地论述了ChatGPT的发展历程、核心技术和基本原理等内容。全书共15章。第1章介绍了ChatGPT的前世今生;第2~6章论述了ChatGPT相关的基础理论与发展应用;第7~10章论述了ChatGPT的核心技术,包括Transformer、基于人类反馈的强化学习、提示学习以及模型学习与优化;第11章和第12章论述了ChatGPT的重要应用场景;第13~15章论述了以ChatGPT为代表的通用大模型范式面临的挑战和对各行业领域的影响,并对下一代人工智能重大场景战略进行了解读。
本书内容新颖,通俗易懂,适合作为人工智能、智能科学与技术、计算机科学与技术、智能机器人技术、控制科学与工程、物联网工程等专业本科生及研究生的通识教材,也可供相关科研人员、政府工作人员参考学习。
本书具有的主要特点如下:
(1) 深入浅出,通俗易懂,可读性强。本书避免使用过于复杂的数学公式和技术术语,方便读者快速理解相关概念和应用技巧。同时,本书结合自然语言处理中的大型语言模型的基本概念、模型结构等多个方面的内容,剖析了从模型预训练到微调再到应用的全过程,针对ChatGPT的核心技术展开细致入微的论述。此外,本书还对国内外先进的视觉和多模态大模型进行了总结和分析,增强了本书的可读性。
(2) 注重理论与实践结合。本书提供的实际应用案例,涵盖了文本生成、问答系统、语言翻译、文本分类等多个领域,可以帮助读者更深入地理解ChatGPT模型的实现和应用。此外,本书也提供了大量ChatGPT应用的使用技巧和注意事项,可以帮助读者更好地了解和使用ChatGPT,在培养读者的创新能力与实践能力的同时,进一步激发读者的研究兴趣。
(3) 既突出核心技术,又与重大场景结合。本书系统且全面地介绍了以ChatGPT为代表的大模型知识体系,帮助读者掌握大模型在实践中的应用。在此基础上,本书与时代紧密结合,对国家《可解释、可通用的下一代人工智能方法》《机器人 应用行动实施方案》等政策文件进行梳理,对下一代人工智能重大应用场景进行深入分析,进而明确未来发展方向。
(4) 具有前沿性和新颖性,充分反映AI领域的最新进展。本书围绕ChatGPT及其相关技术的前沿进展进行阐述,不仅对大型语言模型的原理和技术进行了详尽的介绍和分析,还提供了许多实用的应用案例,可以帮助读者快速掌握大模型技术,具有很强的实用性、可操作性及趣味性。此外,本书对通用大模型范式面临的挑战、ChatGPT带来的社会变革与产业发展影响进行了讨论,对现有大模型发展存在的挑战和难点进行了分析,希望带给相关从业者一定的启发。