趋势洞察
ChatGPT可能是帮助运营商填充管道的杀手级应用
我们处在信息泛滥的时代,这导致似乎“太阳底下没有新鲜事儿”。最近,当OpenAI发布ChatGPT,在全球引起极大轰动时,很多人依然在想:嗯,这不过是另一个聪明一点的聊天机器人吧。那么,它真的只是简单的一个聊天机器人吗?
文/华为运营商BG Marketing与解决方案销售部 张明
GPT-3是 OpenAI 开发的一个自然语言处理 (NLP) 模型。ChatGPT则是GPT-3的微调版本,它有1750亿个参数,训练集超过10万亿个单词,作为聊天机器人公测一周,注册用户数就超过100万人。但ChatGPT真的只是一个简单的聊天机器人吗?笔者认为,ChatGPT通过原创的真知灼见满足人的深层次解惑和陪伴的需求;对网络要求不高却能给运营商带来实实在在的上行流量增长(13.5G DOU,第二个Youtube);对数据的极度贪婪带来算力和网络的巨大需求,它可能是我们寻找的下一个杀手级应用。
当前,ChatGPT还只是一个基于自然语言处理的对话机器人,短期内最大可能是取代谷歌成为下一代搜索的入口。但配合AI视频识别(已经很成熟),可以迅速同个人用户形成共情,发展为个人AI助理,迅速撑大运营商上线管道。未来,如果多模态AI从图像发展到视频,通过ChatGPT可以快速生产视频,则管道流量需求将进一步爆发。
一、 早期聊天机器人话术高明但没有创造性,无法带来生产力
1966年,最早的聊天机器人ELIZA在麻省理工诞生。早期的机器人同智能基本不沾边。技术上它只是匹配关键词,按既定规则做出既定回复。只不过回复设计得颇有技巧,让对话显得很有意义,从而让聊天可以继续下去。人们为它设置了两条基本规则:
- 识别关键字,转化成既定语句,使得机器看起来理解了对话者的语义(实际并不理解)。例如,当我输入“我想___”,它会返回“如果你___,这对你意味着什么呢”。
- 在句法层面上,转移人称代词,如从“我的”变化到“你的”。
如果对话者的输入中有“母亲”一词,ELIZA会回答:“多说一点你的家庭”;如果对话者说:“我有时候感觉很沮丧”,ELIZA会回答“哦,你有时候感觉很沮丧”。这固然是很高明的话术,但基本不能归到人工智能的范畴。所以ELIZA的设计初衷,不过是在临床治疗中用于模仿心理医生来安抚病人。
让机器人通过规则理解人类语言,都可以归到自然语言处理(NLP)的范畴,用计算机实现似乎并不难,所以ELIZA就自然进化到ALICE(人工语音网络技术机实体)。ALICE是比ELIZA更为强大,不再只是安抚病人而有更通用的用途,她有成千上万种可能的回应,还能存储历史对话(有一点学习能力)。但归根到底,ALICE的回答依然是人写好的答案,答复的算法(如表现得激进或温和)也完全由人来决定。ALICE或许可以归属到弱人工智能的范畴,但ALICE和ELIZA一样,都不过是在模仿真实人类对话,扮演游戏中NPC的角色。
二、 基于深度学习的聊天机器人在ToB市场初步获得成功
要表现得像个真正的人类,机器人需具备创造性和逻辑推理的能力。有创造性的强人工智能是聊天机器人发展方向,关键点在“无中生有”地创造出人类没有设定的内容。近二十年来,基于深度学习(主要是各类神经网络算法,如循环神经网络、层次递归神经网络等)的AI智能聊天机器人被广泛开发出来。这些机器人(或者程序)问世后,首先在ToB市场获得应用。
到了现在,市面上差不多有上百种可以用于应用开发的智能AI聊天机器人平台,可以帮助企业构建出功能强大、高效且可扩展的各类聊天机器人。如Meta推出的集成Facebook messenger的Mobile Monkey,以及Google推出的聊天机器人开发框架DialogFlow等等。聊天机器人可以帮助企业为客户提供个性化的体验和专属客户服务,对提高企业的服务质量与效率至关重要。AI智能聊天机器人已经在ToB的某些领域,如电商,成为全球产品和服务交付方式的颠覆者。
三、 ChatGPT,可能是面向大众的智能AI助理
ChatGPT以及后续的变种拥有更大体量的市场:广大的个人用户市场,即ToC市场。当前,ChatGPT风头之强劲,不逊于一年前Meta提出元宇宙概念时的盛况,它的两点表现让人印象深刻:
第一,主动推理能力。当笔者同ChatGPT聊狗的时候,ChatGPT主动推理出笔者不大可能有一只叫Puppy的猫。
Q: I have dog. Its name is Mew. and I have cat too, which name is Puppy. So, who is Mew?
A: Mew is the name of your dog. Dogs are domesticated mammals, often kept as pets for their companionship and ability to perform tasks. The name "Puppy" is often used for a young dog, so it is likely that your cat's name is not actually Puppy.
第二,创造能力。在笔者要求下,ChatGPT轻松写出一段2022年世界杯决赛短视频的搜索程序。
那么ChatGPT能干什么?搜索引擎或许是一个不错的场景,从现在的表现看,ChatGPT至少可以取代传统的搜索引擎,并能做得更好。ChatGPT同google搜索有什么不同?
首先,ChatGPT的信息搜寻链更短。ChatGPT用一段简洁的句子直接提供信息,而不是像google那样推给你一长串看起来像乱码的链接,然后再点开链接在一大堆信息中寻找答案。
其次,ChatGPT同人之间,进行的是语义的交互,而不是数据(或狭义信息)的交互。ChatGPT在理解人上可以做得更好,可以对人更友好,更容易被普通大众接受,因此可能在ToC市场获取更大价值。
同时,ChatGPT可以通过互动挖掘人的深层次需求。ChatGPT在与用户互动时,如果用户不能准确地描述问题,ChatGPT也能通过循循善诱挖掘用户的真实需求,给出用户需要的答案。
最后,ChatGPT具有非凡的创造力,可以提供新的想法,制定商业计划,进行推理和判断。也就是说,它不仅能搜索答案,还能“制造”答案。
人工智能生成内容AIGC(AI Generated Content)或许另一个应用场景,ChatGPT可以创造新的内容,把人类从一些枯燥的创造中解脱出来。但真正的杀手级应用,可能是面向大众的智能AI助理,它是满足人求知欲和陪伴需求的刚需,背后是一个等同于整个运营商行业体量的巨大市场。
四、 从人看视频到机器看视频,ChatGPT带来流量翻倍
为什么我们需要一个能够流畅对话、全天候提供服务、忠诚陪伴从不抱怨、记录我们一生、自己还能不断学习成长的智能AI助理?从一定程度上来说,智能AI助理是我们每个人,因为技术和成本原因压抑了的人性和刚需。ChatGPT可能会释放这个刚需,而它对个人用户、对服务提供商/运营商、对设备商/云服务商都有极大的价值。
第一,对个人用户提供解惑、安全感和陪伴。只要有足够好的网络和云端服务,每个人都可以无差别地拥有一个终生深度陪伴的个人助理, 用一双眼睛(摄像头)读取和理解世界,这可能是比手机、钱包、钥匙更重要的随身配置。不考虑AR/VR或6G,仅仅通过普通摄像头和普通的连接,它就可以让眼前的世界瞬间从未知变得友好。AI助理可以无休止地扫描出现在我们眼前的所有物体,向系统提出“十万个为什么”:好奇飞过的惊鸟到底是什么,但它飞得太快;想知道那件外套哪里能买到,但真不愿意去问陌生人;耳边闪过的音乐片段似曾相识但消失得太快,它是首什么歌;朋友递过来的奶茶,有没有饱和脂肪酸。我们以前不去问它们,不是因为我们不想知道,而是那些渺小但潜在的需求,因为一些客观条件的限制而被压抑住了。如果有一个渠道,可以实时地、友好地获取定制化的答案和建议,没有人会拒绝,这是真实存在的需求。
第二,对服务供应商/运营商带来新增长。在智能AI助理帮我们把世界变得熟悉和友好的同时,更会为服务供应商带来新的业务增长。
- 个人助理的算力必须构建在云端,因此应用对终端的要求很低,也不需要AR/VR应用的高带宽,但需要提供随时随地持续视频连接(720p-1080p),来感知视线范围内的部分目标。假设每用户日均1小时使用时长,1Mbps带宽。则月度会产生13.5GB DOU的额外流量需求,略等于YouTube重度使用者的流量。
- 当前ChatGPT使用成本在每次个位数美分。假设未来服务费用1美分每次,每分钟2次问询对话,每天1小时使用时长,则该项服务是一个会带来36美元APRU的金蛋。
第三,对设备供应商和云服务供应商提供新的市场空间。智能AI助力对网络和云端算力提出要求。13.5GB额外DOU流量需求对网络建设的拉动显而易见。此外,GPT-3是自然语音应用程序中最大的神经网络之一。为了产生高度逼真和多样化的输出,OpenAI喂了GPT-3超过45TB的数据。当前OpenAI把GPT-3的算力构建在Azure公有云之上,仅训练使用GPU数量就超过10000个,GPU功耗超过2400千瓦。如果把服务人数扩展到10亿级,图像和视频识别+GPT引擎可能会占用百万级的处理器。
五、 运营商ToC的下一个超级应用,或许就是ChatGPT
如果说下一个ToC市场的超级应用是AI助理,那它必须要做好三件事:要提供真正启发性的内容,要有友好的交互界面,要能实时地呈现结果。ChatGPT距离这三点尚有差距,但已经很接近了。
- 内容:ChatGPT能提供原创的内容、信息和建议。重复别人的内容会让人索然无味,原创的“真知灼见”至关重要,这是提供个性化体验、专属感的基础。
- 友好:友好不仅仅是操作界面的便捷。这里的友好指的是聊天机器人对人的理解,对人语义的理解,以及在理解基础上做出的适配性反应。某米音箱只是在输入指令上做了一点点创新,就让传统音箱焕发出全新的生命力。个人助理必须有分析和推理能力,在人的语义中推断出问题。如果问题还不清晰,个人助理应该有能力进行引导。这些,当前的ChatGPT已经能够做到。
- 实时:人从产生疑惑到获得解析的时间要求在秒级,0-2秒体验最好,这是人正常交互的等待时间,约等同于等待网页打开时间,远大于实时3D渲染得毫秒级时间要求,但比使用google获取信息的分钟级服务要高得多。ChatGPT单纯文本的响应时间基本可以满足这个要求。
将消耗视频流量的主体,从人类扩展到机器,ChatGPT或将成为电信行业的下一个杀手级应用。