AI 将会改变我们的生活 提起 AI,也就是人工智能,想必大家都并不陌生。AI 这项技术早在 1956 年就已经出现了,而现在 在我们生活中已经很常见了。“今天天气如何?” “今天天气为晴,当前温度为 26 度。”在大部分智能手机 中,都会内置这样的语言助手,它为提供了一些便利,通过它,我们可以快速查询资料,打电话和发短 信,计算简单的数学题等。但是在大部分人的印象中,AI 一旦遇到一些比较困难的问题,就无法准确的 回答,甚至胡乱作答,因此也被戏称为“人工智障”。但现在,它还是这样吗? 工作原理 既然要说 AI,那么就先了解一下其工作原理。AI 的工作原理较为复杂,大体可以分为机器学习,深 度学习这两类。现在最流行的是深度学习。 深度学习 深度学习是机器学习的一个分支。深度学习网络通过发现经验数据中错综复杂的结构进行学习。通 过构建包含多个处理层的计算模型,深度学习网络可以创建多个级别的抽象层来表示数据。这里举一个 简单的例子,为了让 AI 认识什么是猫,就需要向 AI 提供大量猫的图片,AI 则会提取猫的不同部位的特 征,并形成一个复杂的训练集,而后 AI 就可以通过这个训练集来判断图片是否为猫。 大数据 在深度学习中,大数据尤为重要,那么,什么是大数据呢? 大数据是指在一定时间内无法被传统软件工具捕获、管理和处理的数据集合,需要新的处理 模式才能具有更强的决策力、洞察发现力和流程优化能力来适应结构化数据的高增长率和多 样化的信息资产。 ------维基百科 大家熟悉的大语言模型 ChatGPT(后文会提到) 就是使用巨量的数据训练出来的,而用户与其进行 交流时,它也会学习用户的思维方式和语言,使它能够像人类一样回应用户。另外一个例子就是短视频 平台(如抖音)能够根据用户经常点击的视频,以及停留较久的视频来推断出用户喜欢什么类型的视频, 从而优化用户体验。 大语言模型 在 AI 领域中,大语言模型的热度是最高的。那么,什么是大语言模型呢? 大语言模型(英语:large language model,简称 LLM)是一种语言模型,通常指的是参数数量在 数十亿或更多数量级的深度学习模型。它是一种通用模型,并不仅局限与某一方面,它可以进行多种不 同的任务,目前,与人类进行聊天是它最主要的作用。 典型代表---ChatGPT ChatGPT 是由 OpenAI 公司开发的一款大语言模型,于 2022 年 11 月推出,是目前最为流行的大 语言模型。ChatGPT 目前仍以文字方式交互,而除了可以用人类自然对话方式来交互,还可以用于甚为复杂的语言工作,包括自动生成文本、自动问答、自动摘要等多种任务。ChatGPT 可写出相似真人的 文章,并在许多知识领域给出详细和清晰的回答而迅速获得关注,证明了从前认为 AI 不会取代的知识型 工作它也足以胜任。 ChatGPT 也有多种局限,OpenAI 承认 ChatGPT“有时会写出看似合理但不正确或荒谬的答案”, 在大语言模型中很常见,称作人工智能幻觉[1]。训练过程中,不管实际理解或事实内容如何,审核者都会 偏好更长的答案。训练数据也有算法偏差,可能会在向 ChatGPT 问及人物描述时显现出来。有用户发现 ChatGPT 在解决较为复杂的题目时会给出错误答案,并且会在解方程式时陷入循环。 对于用户而言,要使用 ChatGPT,只需要输入一段简单的文本,ChatGPT 就会迅速给出回复,就 像与一个真人聊天一样。不过需要注意的是,AI 生成的回答不一定完全正确,需要使用者注意辨别。 百家争鸣 在 ChatGPT 出现后,各家公司也纷纷推出了自家的大语言模型,比较有代表性的是 Google 的 Gemini,Meta 的开源大模型 Llama[2],Anthropic 的 Claude 2,以百度的文心一言和阿里的通义千问。 与此同时,AI 的种类也越來越多,例如出现了用于图像生成的 DALL·E 3[3],用于视频生成的 Sora[4],用于代码生成的 Github Copilot 等。 AI 的应用 随着 AI 种类的增多,AI 在生产生活中的应用范围也不断扩大。除了开头提到的语言助手外,AI 在 其它领域也发挥了十分重要的作用,这里举几个例子。 Github Copilot 和通义灵码等 AI 可以以插件的形式集成在 IDE(集成开发环境)中,它能够根据代 码上下文并结合用户的输入来推断接下来需要做的,并自动生成代码补全。通过使用它,能够极大的提 升开发效率,并且可以免去很大一部分“造轮子”。 抖音、youtube、bilibili 等视频平台之所以能够根据用户喜好来推荐内容,背后就是强大的 AI 推荐 引擎。 在搜索引擎方面,AI 也发挥了巨大的作用。以 google 和百度为例,后台对要查询的 query 进行 NLP 解析,经过大量计算匹配出用户最感兴趣的内容;除了文字搜索,语音搜索和图像搜索也用到了 AI 技术。 Google 翻译作为最精确的机器翻译软件,在某些语言上甚至可以达到 94%的精度,这正是由于 AI 的发展所带来的。 日常生活中经常接触的外卖,快递等,从出发点到目的地,路线都是 AI 进行计算并规划出的最优路 线。 在电视台的部分节目中,使用到了 AI 进行图像和动画的生成,为其节省了很多财力和人力。 如此看来,AI 在未来一定会有更大的作用,并且在生活中变得随处可见,那么,就让我们拭目以待 吧。 参考资料 维基百科---人工智能史:https://en.wikipedia.org/wiki/History_of_artificial_intelligence Cloudflare 学习中心---大数据:https://www.cloudflare.com/zh-cn/learning/ai/big-data 相关链接 [1]人工智能幻觉:https://en.wikipedia.org/wiki/Hallucination_(artificial_intelligence) [2]Llama:https://llama.meta.com [3]DALL·E 3:https://openai.com/index/dall-e-3 [4]Sora:https://openai.com/index/sora