·“在iPhone推出超过15年之后,ChatGPT和其他生成式人工智能服务,可能很快就会成为一种新型硬件设备以及人与计算机之间完全不同类型交互的基础。”“软件是人工智能的心脏和肺,而硬件则代表人工智能的手臂和腿。”
·“老实说,随身携带手机并不是一种负担,而且仍然有很多事情比使用眼镜、手表或耳机更容易完成——无论你在它们身上喷了多少人工智能仙气。”
高通CEO安蒙在骁龙峰会上谈论人工智能。
以ChatGPT为代表的生成式人工智能(AI)正加速走向消费者的日常设备。
最近,大型科技公司紧锣密鼓地推动着在智能手机和笔记本电脑上运行生成式人工智能,一些初创企业也在开发旨在颠覆iPhone时代的全新品类设备。
对于生产商来说,好处是显而易见的。在终端设备上运行人工智能模型可以更便宜、更快、更私密。设备和芯片制造商也希望生成式AI能够帮助刺激电脑和智能手机的销售,因为这两种产品在“疫情繁荣”后都陷入了消费不景气。
在人工智能的加持下,也许在明年,消费硬件圈将走入一幅新的风景。
支持将大模型植入手机的芯片
10月26日晚,小米公司推出新款手机小米14,在最新的澎湃OS系统中使用大量基于AI大模型的功能,包括实时字幕、小爱输入助手、AI写真、AI妙画、AI搜图等。该公司称,大模型对算力和技术架构都有着极高的要求,一般都是在云端使用的,而小米澎湃OS的AI子系统支持最新的大模型NPU(嵌入式神经网络处理器)部署技术,很快就能在手机端侧直接运行。这些功能基于高通第三代骁龙8(骁龙8 Gen3)移动平台,小米14也成为全球首发骁龙8 Gen3的智能手机。
10月26日晚,小米公司在小米14发布会上宣布,在其澎湃OS系统中部署AI大模型。
仅在一天前,在夏威夷举办的2023年骁龙峰会上,高通公司宣布推出骁龙8 Gen3,支持将人工智能大模型植入手机。
高通表示,骁龙8 Gen3拥有强大的移动设备NPU,并利用AI来增强高端智能手机的内容创作、摄像、游戏、声音和连接体验。
高通展示了一款智能手机运行AI图像生成器Stable Diffusion的演示,其在不到一秒的时间内生成了图像,而在今年早些时候的演示中,类似的任务花费了15秒。他们还展示了Meta的Llama 2大模型可在智能手机和搭载骁龙芯片的笔记本电脑原型机上运行。
据科技媒体The Verge报道,在配置骁龙8 Gen3的设备上,视频功能中有一个物体橡皮擦,只需要点击,不需要的物体就会消失。还可以将自拍和后置摄像头拍摄的视频图层整合到一个视图中,该功能使用了改进的图像分割技术,删除自拍视频中的背景,接着让人物站在后置摄像头拍到的任何背景前面。
今年7月,高通技术公司产品管理高级副总裁兼AI负责人齐亚德·阿斯哈尔(Ziad Asghar)在接受澎湃科技(www.thepaper.cn)专访时表示,在数据产生的地方直接进行高效推理才是大趋势,而数据产生的地方正是在端侧,比如手机端或电脑端。
高通认为,在终端侧进行生成式人工智能的运算,最首要的原因是隐私保护。如果要通过云端进行生成式人工智能的查询,用户输入和查询的相关信息也会传送到云端,从而造成潜在的安全风险。而在端侧通过生成式人工智能进行查询,所有信息都能够保留在端侧。此外,终端侧的运算会带有丰富的情境信息,例如在手机和VR/AR(虚拟现实/混合现实)设备上,消费者本人的移动状态、个人偏好,设备上的多媒体信息等都可以被生成式AI捕捉,带来比云端更好的沉浸式体验。
更实际的好处是,不断通过互联网对服务器进行访问会增加大量成本。“因为云成本将会飙升,这些人会说,‘好吧,我将尝试找出如何在设备上做越来越多的事情’。”高级副总裁亚历克斯·卡图齐安(Alex Katouzian)25日告诉美国媒体Axios。
AI PC
在骁龙8 Gen3发布前,联想于当地时间24日在美国举行联想创新科技大会,展示了其首款AI PC(个人电脑)。这款电脑将于明年9月左右正式上市销售。
据介绍,联想AI PC建有本地知识库,能更好地了解用户。个人大模型将使用存储在设备或家庭服务器上的个人数据进行推理。除非用户授权,否则用户的个人数据永远不会被共享或发送至公有云,从而确保了个人隐私和数据安全。
联想集团董事长兼CEO杨元庆说,AI PC初期定位是高端市场,量不会很大,占比不会超过行业总销量的10%,但相信未来可能每一部电脑都是人工智能的电脑。
在2023联想创新科技大会上,联想集团董事长兼CEO杨元庆(右)和英伟达CEO黄仁勋宣布混合AI解决方案。
联想也提出了自己的混合AI框架,认为应该有个人大模型和企业级大模型,分别基于个人知识库和企业内部知识库进行推理。杨元庆认为,企业级大模型将与公用大模型和公有云并存,构成混合形态、混合部署的人工智能。该公司首席技术官、高级副总裁芮勇说,人工智能将是公共、私域和个人大模型的有机结合,而联想的“端-边-云-网-智”新IT架构将支撑这种混合AI框架。
一个多月前,另一家芯片巨头英特尔,也在高调宣传AI+PC的新组合。
当地时间9月19日,英特尔公司首席执行官帕特·基辛格(Pat Gelsinger)在2023英特尔on技术创新大会上表示,AI将通过云与PC的紧密协作,进而从根本上改变、重塑和重构PC体验,释放人们的生产力和创造力,“我们正迈向AI PC的新时代。”
英特尔宣布,将推出代号为Meteor Lake的酷睿Ultra处理器,配备英特尔首款集成的神经网络处理器(NPU),用于在PC上进行高能效的AI加速和本地推理体验。也就是说,该芯片将能够在笔记本电脑上运行生成式人工智能,而不必利用云数据中心来获取计算能力。
“我们认为AI PC是技术创新领域翻天覆地的变化。”基辛格说。
智能手机加速人工智能化
智能手机厂商同样也在关注生成式人工智能。苹果和安卓两大系统的主导者均在发力。
当地时间10月22日,彭博社资深记者马克·古尔曼(Mark Gurman)透露,苹果公司正在焦急地试图迎头赶上,计划最早在明年推出更智能的Siri版本,并将人工智能添加到尽可能多的应用程序中,包括苹果音乐(Apple Music)和生产力应用程序,意味着用户可以让大模型在手机上创建播放列表和生成文档、PPT。
今年7月有报道称,苹果已经建立了自己的框架来创建大型语言模型,被称为Ajax,在此基础上还创建了一个聊天机器人服务,被称为“苹果GPT(Apple GPT)”。下一步的关键是确定该技术是否能够应对竞争对手,以及苹果如何将其实际应用到产品中。
如今,苹果负责人工智能的高级副总裁约翰·贾南德拉(John Giannandrea)和负责软件工程的高级副总裁克雷格·费德里吉(Craig Federighi)正在带头开展这项工作。服务主管埃迪·库伊(Eddy Cue)也参与其中。目前,苹果计划每年在这项事业上花费约10亿美元。
与此同时,谷歌最新的手机发布会更是在竭尽所能地展示人工智能。其新款Pixel手机中广泛使用了设备端人工智能,尤其是在多媒体处理方面。
聊天机器人Bard被整合到语音助手Google Assistant中。让国外各大科技博主惊叹不已的“最佳拍摄”功能,则可以“完美”调节人的面部表情,无缝换脸。今年早些时候宣布的魔术编辑(Magic Editor)也正式应用在Pixel 8手机上,可以调整照片主题的位置大小。今年晚些时候才会正式推出的AI录音能够自动总结对话并生成摘要。音频魔术橡皮擦可以直接从视频中删除任何不想要的声音。
谷歌Pixel手机的“最佳拍摄”功能,可以“完美”调节人的面部表情,无缝换脸。(01:40)
谷歌设备的人工智能很大程度上依赖于其自研芯片TPU(张量处理器),这是为神经网络设计的专用芯片,用于机器学习模型的训练和推理。10月24日,谷歌还表示正在与高通合作,允许其人工智能模型在安卓设备上运行。
在国内,今年8月,华为公司和小米公司先后宣布自家手机助手接入大模型。OPPO、vivo等手机厂商也先后推出手机端十亿参数级别的“轻量版大模型”。在11月的OPPO和vivo开发者大会后,中国主要手机制造商将凑齐大模型。
无屏幕的未来交互?
距离初代iPhone发布已经过去了16年,智能手机的进化走入了一个平台期。曾经每隔几年更换一次智能手机的消费者现在可能要等待五六年才会购买新手机。制造商急需新的卖点去刺激消费和增长曲线。
与此同时,从初创公司到微软和Meta等巨头,也看到了人工智能可以帮助其摆脱对谷歌和苹果控制的潜力。智能手机市场在过去十几年中演化成了现在安卓和iOS两家独大的局面,它们控制了各自平台的主要应用商店。就在几天前,微软公司首席执行官萨提亚• 纳德拉(Satya Nadella)在采访中坦承对关闭智能手机业务感到遗憾。
生成式人工智能提供了新的机会。当地时间9月27日,Meta推出了最新一代Ray-Bans Meta智能眼镜,佩戴者可以通过Meta的AI助手Meta AI与眼镜对话,实时接收信息,并用它来直播视频片段。Meta首席执行官马克·扎克伯格说:“这将是非常疯狂的,因为有了Meta AI,你可以整天戴着眼镜和它交谈。”他认为,人工智能眼镜是迈向Meta最终目标的垫脚石:一个充满全息图的世界,你可以与之交谈。
9月27日,Meta首席执行官马克·扎克伯格宣布推出最新一代Ray-Bans Meta智能眼镜。
一天后,有消息称苹果前设计总监乔尼·艾维(Jony Ive)和开发ChatGPT的OpenAI的首席执行官山姆·奥特曼(Sam Altman)正在打造一款专用AI硬件设备,拥有“不受矩形屏幕限制的新外形”。据报道,软银首席执行官孙正义正在考虑向该项目注资10亿美元。这款神秘设备尚未正式公布,但奥特曼说:“不将智能集成到每项产品和服务中将是不可想象的”。
又过了两天,在巴黎时装周的一场时装秀上,一些模特佩戴了来自初创公司Humane的AI Pin,这是一种类似徽章的可穿戴设备,包括摄像头和扬声器,但没有屏幕。Humane的联合创始人、前苹果设计师伊姆兰·乔杜里 (Imran Chaudhri)在5月的TED演讲中展示了该设备的一系列功能,例如AI Pin能够将通话详细信息投射到他的手上、用人工智能生成的他的声音将英语翻译成法语,并汇总他错过的消息和日历邀请。
Humane的联合创始人、前苹果设计师伊姆兰·乔杜里 在5月的TED演讲中展示了AI Pin的一系列功能。(03:02)
Humane已获得微软公司和奥特曼2.3亿美元的投资,并且可能会使用ChatGPT的一个版本。最新的泄漏图显示,AI Pin似乎会通过磁性吸附在衣服上,还拥有一个“信任灯”,只要设备的摄像头、麦克风或其他传感器以某种方式记录数据,它就会亮起。这款设备预计于11月9日开始销售。
乔杜里表示,AI Pin希望创造一种隐形设备,重新想象人类与科技的互动,以便人类能够“回到真正重要的事情上”。“当你可以拿着一个物体并提出有关它的问题时,为什么还要摸手机呢?”他在5月的演讲中说,AI Pin的效果“让人几乎感觉整个世界都成了你的操作系统。”
Meta的智能眼镜、山姆·奥特曼的神秘设备和AI Pin,启发人们开始想象一个无屏幕的未来交互手段。
“机不可失,时不再来”
一些技术专家认为,人工智能驱动的个人设备可能会取代iPhone成为我们日常生活中新的首选计算设备。
“在iPhone推出超过15年之后,ChatGPT和其他生成式人工智能服务,可能很快就会成为一种新型硬件设备以及人与计算机之间完全不同类型交互的基础。”彭博社科技记者、曾为亚马逊创始人杰夫·贝索斯立传的布拉德·斯通 (Brad Stone) 本月写道。
“奥特曼、纳德拉、扎克伯格、库克(苹果公司CEO)和贾西(亚马逊CEO)都知道硬件将成为人工智能消费技术的门户。”证券公司Wedbush Securities的技术分析师丹·艾夫斯(Dan Ives)告诉科技媒体Insider,“软件是人工智能的心脏和肺,而硬件则代表人工智能的手臂和腿”,大型科技公司对这场人工智能军备竞赛的利用“机不可失,时不再来”。
但是,何时颠覆iPhone是一个持续不断的话题,并被屡屡证明时间还没到。语音助手音箱是失败的挑战者,扩展现实(包括虚拟现实、增强现实和混合现实)设备还难以普及,尽管苹果明年将上市混合现实头显Vision Pro。人们习惯于查看显示器并通过单击和打字来输入信息,这种范式是在20世纪70年代建立的,当时出现了第一台个人电脑,以及苹果公司创始人史蒂夫·乔布斯从施乐帕洛阿尔托研究中心“借来的”人机界面。
“从短期来看,人工智能趋势似乎更有可能巩固智能手机的主导地位。”美国威斯康星大学密尔沃基分校研究技术史的教授托马斯·黑格(Thomas Haigh)告诉Insider,“我认为单独类别的‘人工智能设备’不太可能长期存在”,它更像是“一个品牌而不是其他任何东西”。
“老实说,随身携带手机并不是一种负担,而且仍然有很多事情比使用眼镜、手表或耳机更容易完成——无论你在它们身上喷了多少人工智能仙气。”黑格说。
如果是这样,如何将生成式人工智能更好地植入手机等消费级设备便成了当下最值得研究的现实问题。这种技术需要消耗大量的计算能力,在设备上运行还需要大量电力,对电池寿命的影响仍有待观察。另外,即使现在所做的大部分工作可以转移到设备上,但还会有新的用例出现,需要超出笔记本电脑或手机所能提供的计算资源。为了做到运算更快,效率更高,软件的进化与硬件同样重要。这些问题都需要得到解决。高通、英特尔、苹果、谷歌、联想、小米等已经起跑了。
|