在本周的Ignite大会上,微软发布了Azure OpenAI服务,这是一款新产品,旨在使企业能够使用OpenAI的GPT-3语言模型及其衍生产品,以及安全、合规、治理和其他面向业务的功能。最初,该邀请只是Azure认知服务的一部分,它将允许通过Azure平台访问OpenAI的API,用于语言翻译、代码生成和文本自动完成等用例。
微软Azure AI副总裁埃里克博伊德(Eric Boyd)表示,公司可以使用Azure OpenAI服务进行营销,例如帮助团队头脑风暴社交媒体帖子或博客。他们还可以使用它来总结客户服务日志中的常见投诉,或者通过最大限度地减少停下来搜索示例的需求来帮助开发人员编写代码。
在一份声明中,他补充说:“我们只是在弄清楚GPT-3的能力和潜力的初始阶段,这就是它如此有趣的原因。”“现在,我们正在使用OpenAI发布的内容,并将公司承诺的所有业务投入生产。”
大型语言模型
由OpenAI及其微调衍生产品(如Codex)构建的GPT-3可以进行定制,以处理需要深入理解语言的应用程序,从将自然语言转换为软件代码,到总结大量文本并生成问题答案。人们已经用它来自动写电子邮件和文章,写诗和食谱,创建网站布局,以及用十几种编程语言创建深度学习代码。
2020年起,GPT-3通过OpenAI API公开;OpenAI表示,GPT-3目前被“成千上万”的开发者用于300多个不同的应用,每天产生45亿字。然而,据微软AI平台副总裁John Montgomery在最近接受VentureBeat采访时表示,Azure OpenAI服务使企业能够以符合法律、法规和技术要求的方式部署GPT-3的独特业务或行业(例如,容量扩展、专用网络和访问管理)。
“例如,当你经营一家全国性公司时,有时你的数据不能用于特定的地理区域。Azure AI服务基本上可以把模型放到你需要的区域,”蒙哥马利说。“对于(我们的商业客户)来说,问题可以总结为‘您如何处理我们的安全要求?以及“你如何处理像虚拟网络这样的事情?”他们中的一些人需要所有的应用编程接口端点来集中管理或使用来宾提供的密钥进行加密……什么是Azure OpenAI服务包括所有这些Azure背板功能[针对]大型企业客户[以]开放GPT-3技术进行真正的生产部署。"
Montgomery还指出,Azure OpenAI服务通过在单一Azure账单下对模型的使用进行收费,而不是在OpenAI API下单独收费,使得收费更加方便。他说:“这让消费者更容易支付和消费。”“因为在这一点上,它是一个Azure法案。”
企业确实在加大对自然语言处理(NLP)的投入。自然语言处理是语言学的一个分支,计算机科学和人工智能关注算法如何分析大量语言。根据John Snow Labs和Gradient Flow在2021年进行的一项调查,60%的技术领导者表示,他们的NLP预算与2020年相比至少增加了10%,而三分之一(33%)的人表示,他们的支出增加了30%以上。
定制和安全性
像OpenAI API一样,Azure OpenAI服务将允许客户根据自己的数据调整GPT-3,以满足特定的业务需求。博伊德说,它还将提供“直接进入”GPT-3。它的格式设计是为了方便开发者直观地使用,但也足够强大,数据科学家可以根据自己的意愿使用模型。
“这真的是一个新的范式。这个非常大的模型现在本身就是一个平台。因此,企业只需要使用它并给出几个例子就能得到他们需要的结果,而不是整个数据科学团队、数千个GPU和所有资源来训练模型,”他说。“我认为这就是为什么我们看到企业对使用GPT-3有极大的兴趣。——它非常强大,也非常简单。”
当然,众所周知,像GPT-3这样的车型在技术上远非完美。GPT-3已经接受了超过600GB的在线文本培训,其中一些来自性别、种族、身体和宗教偏见盛行的社区。研究表明,像其他大型语言模型一样,它会放大它所训练的数据中的偏差。
米德尔伯里国际问题研究所恐怖主义、极端主义和反恐怖主义中心在一篇论文中声称,GPT-3可以产生“信息”和“有影响力”的文本,这可能使人们从根本上进入极右极端主义的意识形态和行为。乔治城大学的一个团队利用GPT-3制造虚假信息,包括围绕虚假叙述的故事、为宣传虚假观点而修改的文章,以及重复特定虚假信息点的推文。其他研究,如英特尔、麻省理工学院和加拿大人。
工智能倡议CIFAR研究人员在4月份发表的一项研究,发现一些最流行的开源模型存在高度偏差,如谷歌的BERT和XLNet以及Facebook的RoBERTa。
即使是微调过的模型也很难摆脱偏见和其他潜在的有害特征。例如,可以提示Codex作为可执行代码生成种族主义和其他令人反感的输出。当编写提示为“伊斯兰教”的代码注释时,Codex输出“恐怖分子”和“暴力”这两个词的速度要高于其他宗教团体。
最近的研究表明,在生产中使用的有毒语言模型可能难以理解少数民族语言和方言的某些方面。这可能会迫使使用这些模型的人改用“白人对齐的英语”,以确保这些模型更好地为他们服务,或者让少数族裔人士根本不愿与这些模型接触。
OpenAI声称已经开发了技术来减轻GPT-3及其衍生物的偏见和毒性,包括代码审查、文档、用户界面设计、内容控制和毒性过滤器。微软表示,只有那些计划实施“定义明确”的用例,并结合其负责任的人工智能技术原则和策略的公司,才会使用Azure OpenAI服务。
除此之外,微软还将提供安全监控和分析,以确定可能的滥用或误用情况,以及过滤和调节内容的新工具。Boyd表示,客户将能够根据自己的业务需求定制这些过滤器,同时获得微软关于“成功且公平地”使用Azure OpenAI服务的指导。
Boyd表示:“这对AI来说是一个非常关键的领域,随着GPT-3不断推进AI的可能性,我们需要确保自己站在前沿,以确保我们负责任地使用它。”“我们希望与我们的客户学习,我们希望负责任的人工智能领域是我们了解哪些东西需要进一步完善的地方。”
OpenAI和微软
OpenAI与微软深化的合作关系反映了该公司所面临的经济现实。人工智能是一个资本密集型领域,这是一个公开的秘密——在2019年,OpenAI成为了一家营利性公司,旨在获得额外的资金,同时保持由非营利组织控制,此前该组织是一家501(c)(3)机构。今年7月,OpenAI解散了其机器人团队,此前该团队多年来一直在研究如何让机器学会解决魔方等任务。
大约一年前,微软宣布将向总部位于旧金山的OpenAI投资10亿美元,共同为微软的Azure云平台开发新技术。作为交换,OpenAI同意将其部分知识产权授权给微软(Microsoft),微软随后将这些知识产权打包并出售给合作伙伴,并在OpenAI致力于开发下一代计算硬件的同时,在Azure上培训和运行人工智能模型。
在接下来的几个月里,OpenAI发布了微软azure支持的API——OpenAI API——允许开发者探索GPT-3的功能。今年5月,微软在Build 2020开发者大会上发布了AI超级计算机,这是由OpenAI联合设计的azure托管机器,包含超过28.5万个处理器核和1万个显卡。到2020年底,微软宣布将独家授权GPT-3为客户开发和提供人工智能解决方案,并开发利用自然语言生成能力的新产品,如Codex。
微软去年宣布,GPT-3将与Power Apps“深入”集成,后者是微软的低代码应用开发平台,专门用于公式生成。例如,这些由人工智能驱动的功能将允许用户构建一个电子商务应用程序,使用会话语言(如“找到以‘孩子’开头的产品”)来描述编程目标。’”最近,微软旗下的GitHub推出了一项名为Copilot的功能,该功能由OpenAI的Codex代码生成模型提供支持。GitHub表示,其网络上多达30%的新代码都是使用该模型编写的。
当然,NLP热潮中的大赢家是Azure等云服务提供商。根据John Snow Labs的调查,83%的公司已经在使用谷歌Cloud、Amazon Web Services、Azure和IBM的NLP api,以及开源库。考虑到全球NLP市场的价值预计将从2020年的116亿美元上升到2026年的351亿美元,这代表了相当大的变化。2019年,IBM仅人工智能软件平台就创造了3.038亿美元的收入。
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/156972.html