从亚马逊的初期,机器学习(ML)发挥了我们带给客户的价值至关重要的作用。大约20年前中,我们使用机器学习在我们的推荐引擎,为客户创造个性化推荐。今天,有成千上万的机器学习科学家和在不同的地方将机器学习开发商,从建议欺诈检测,从库存水平书分类滥用审核检测。必威体育精装版app官网在有些情况下我们使用ML广泛的更多的应用领域:搜索,自主无人机,在履行中心,文本处理和语音识别(如Alexa的)等机器人

在机器学习算法,一类算法称为深度学习来代表那些可以在数据中吸收大量的数据和学习优雅和有用的模式算法:里面照片上的面孔,一个文本的意义,或意图的超过20年的发展中,这些机器学习和深入学习上面列出的算法和最终用户服务必威体育精装版app官网的语音word.After,我们了解了机器学习的科学家都社区是构建这些机器学习算法以及谁使用它们的应用程序开发者的需求。我们也有机器学习技术,可以造福机器的科学家和开发商亚马逊以外工作的很大。必威体育精装版app官网上周,我写了一个博客关于帮助机器学习科学家社区中很多我们的支持选择在AWS上如MxNet,TensorFlow,来自Caffe权等深学习框架

今天,我要专注于帮助谁选择发​​展自己在AWS上的应用程序,并在过去开发了一必威体育精装版app官网些我们这个时代在AWS上的开创性的应用程序,比如Netflix公司,制作的Airbnb,或Pinterest的或创建的互联网连接设备的供电的应用程序开发人员通过AWS如Alexa和Dropcam。许多应用程序开发人必威体育精装版app官网员已经被Alexa和他们看到正在提供或通过亚马逊使用,并希望我们在开发能听到,看到的,说话和理解他们周围的世界自己的神奇的应用程序帮助其他AI动力产品的魔力吸引。

例如,他们希望我们帮助他们开发出理解自然语言,为移动应用构建的Alexa式对话必威体育精装版app官网的经验聊天机器人,动态无需使用昂贵的配音演员产生的讲话,承认在图像概念和面,而不需要人工注释。然而,直到现在,很少有开发商已经能够构建,部署和广泛应用规必威体育精装版app官网模与AI功能,因为这样做所需的专门知识(在ML Ph.D.s和神经网络)和访问大量数据。Effectively applying AI involves extensive manual effort to develop and tune many different types of machine learning and deep learning algorithms (e.g. automatic speech recognition, natural language understanding, image classification), collect and clean the training data, and train and tune the machine learning models. And this process must be repeated for every object, face, voice, and language feature in an application.

今天,我很高兴地宣布,我们正在推出三个新亚马逊AI服务,消除了所有这些繁重的工作,使得AI广泛所有应用程序开发人员可以访问通过提供亚马逊的强大和成熟的深学习算法和技术的全面管理服务,通过API调用或任何开发人员可以访问AWS管理控制必威体育精装版app官网台中点击几下。这些服务亚马逊莱克斯亚马逊波莉亚马逊Rekognition这将有助于AWS应用程序开发人员构建这些下一代必威体育精装版app官网神奇,智能应用程序。亚马逊AI服务使Amazon的自然语言理解的全部功能,语音识别,文本语音转换,并可以在任何规模的图像分析技术,对于任何应用,任何设备上随时随地。

亚马逊莱克斯

此次推出的Alexa的技能套件(ASK)后,顾客喜爱的能力来构建语音机器人或技能Alexa的。他们也开始要求我们给他们访问技术,力量Alexa的,让他们可以添加一个会话接口(使用语音或文本)到他们的移动应用。他们还希望在能力将发布像Facebook Messenger和松弛聊天服务的机器人。

亚马逊莱克斯是建设使用语音和文本会话接口的新服务。同样的对话引擎,权力的Alexa现已向任何开发,因此很容易对新的和现有的应用程序带来复杂的,自然语言“聊天机器人”。必威体育精装版app官网Alexa的在每个开发人员的手中的权力,而不必知道深度学习技术,如语音识别,拥有全必威体育精装版app官网新类别的产品和服务的创新火花的潜力。必威体育精装版app官网开发人员现在可以建立快速,方便地强大对话界面,在任何规模上运作,在任何设备上。

语音识别和自然语言理解技术背后亚马逊莱克斯和Alexa是由经过培训的海量数据的深度学习模式供电。必威体育精装版app官网开发者可以简单地指定完成用户的任务需要几个样品的短语和信息,并建立莱克斯深学习基于意图的模式,引导谈话,并且执行使用了AWS LAMBDA的业务逻辑。必威体育精装版app官网开发人员可以构建,测试,并直接从AWS管理控制台部署聊天机器人。这些聊天机器人可以在任何地方进行访问:从Web应用程序,聊天和信使应用程序,如Facebook的使者(与出口Alexa的技能Kit和松弛的支撑即将支持),或连接的设备。必威体育精装版app官网开发者也可以毫不费力地用新的会话机器人功能包括他们的亚马逊莱克斯机器人在自己的iOS和Android移动应用AWS移动枢纽

最近,几个选定的客户参加了亚马逊莱克斯的内测。他们为我们提供了宝贵的反馈意见,我们四舍五入亚马逊莱克斯的预览发布。我兴奋地从我们的试用客户HubSpot和Capital One公司分享一些反馈。

HubSpot,市场营销和销售软件的领导者,使用一个名为GrowthBot,帮助营销人员和销售人员聊天机器人是通过提供相关数据和服务效率。Dharmesh沙阿,HubSpot首席技术官和创始人,告诉我们,亚马逊莱克斯启用了GrowthBot先进的自然语言处理能力,为客户提供更直观的用户界面。Hubspot可以利用亚马逊莱克斯提供先进的AI和ML功能,而无需编写代码的算法。

第一资本通过各种渠道提供金融产品和服务提供给消费者,小型企业和商业客户的广泛。Firoze Lafeer,CTO Capital One公司实验室,告诉我们,亚马逊莱克斯使客户能够查询信息,通过自然语言语音或文本,并获得关键洞察他们的帐户。由于亚马逊莱克斯由Alexa的技术提供支持,它提供了一个资本具有高度的信心,客户的互动是准确的,便于部署和机器人的缩放。

亚马逊波莉

计算机能够与人类般的声音追溯到几乎只要ENIAC(第一电子可编程计算机)讲的概念。“太空漫游2001”与HAL-9000或星际迷航电脑争锋数据,其定义计算机生成的语音感知的概念已经被许多流行的科幻电影和电视节目,如探索。

文本 - 语音转换(TTS)系统已经在很大程度上在各种现实生活场景采用如用自动语音应答或帮助视觉或言语障碍的人的电话系统。教授斯蒂芬·霍金的声音可能是用来帮助残疾人合成语音的最有名的例子。

TTS系统不断通过过去几十年演变,都是时下能够提供一个相当自然声音讲话。今天,TTS是在大量的各种使用情况下使用,并且变成的用户接口的无处不在的元素。Alexa和其TTS语音又是朝着建设遵循人类沟通的方式直观和自然语言界面的另一个步骤。

亚马逊波莉,我们正在用于构建Alexa的声音AWS客户的一致TTS技术。这是现在可供任何开发旨在功率他们的应用程序提供高品质的必威体育精装版app官网语音输出。

为了模仿人类的语言,我们需要解决各种各样的挑战。我们需要学习如何解释各种文本结构,如字,缩写,数字,或同形词(字拼写相同但发音不同而具有不同的含义)。例如:

听说欧蓝德是一个很好的,虽然我还没有还没完成, 要么

要么
圣玛丽教堂是226玛丽的

最后但并非最不重要的,因为TTS的质量越来越好,我们期待一个自然的语调匹配合成文本的语义。传统的以规则为基础的模型和ML技术,如分类和回归树(CART)和隐马尔可夫模型(HMM)目前限制建模的这一过程的复杂性。深学习已经显示出其在表示在不同水平的语音合成方法的复杂的非线性关系的能力。背后亚马逊波利TTS技术充分利用了数据使用了大量的训练模式,转换字母的声音双向长短期记忆(LSTM)网络和预测语调轮廓。这项技术使高自然度的,一致的语调和文本的精确处理。

亚马逊波利客户已确认产生的语音质量高为他们的使用情况。听歌使用亚马逊波莉声音的语言学习应用中,质量是关键。塞韦林黑客,听歌的CTO,承认亚马逊波利的声音不只是质量高,但不如教语言的自然人类语言。

盲人皇家国立使用亚马逊的TTS技术,支持通过他们最大的英国书图书馆视障人士。约翰·沃斯福尔德,在RNIB解决方案实施经理证实,亚马逊波莉的令人难以置信的逼真的声音吸引,搞RNIB读者。

亚马逊Rekognition

我们生活在一个以极快的速度进行数字化改造的世界。这方面的一个重要结果是生成和不同细分和行业应用和服务所消耗的图像的爆炸性增长。无论是照片共享或打印,或在媒体和新闻机构,或过滤图像档案图像为公共安全组织消费者应用程序,需要从图像的视觉内容中获取洞察力继续增长迅速。

有创建并存储的图像的数量,并捕获可从这些图像中导出的洞察的能力之间存在固有的间隙。简单地说,最形象店是不可搜索的,有组织的,可操作的或。虽然有一些解决方案,客户告诉我们,他们不能很好地扩展,是不可靠的,过于昂贵,依靠复杂的管道来注释,验证和处理的训练和测试算法的数据量庞大,需要一个团队高度专业化和熟练的数据科学家,以及需要昂贵的和高度专业化的硬件。对于已经成功地构建了图像分析管道公司,维持,提高,保持了在这一领域研究的过程中被证明是高摩擦。亚马逊Rekognition解决了这些问题。

亚马逊Rekognition是完全托管,深学习型图像分析服务,通过我们的计算机视觉科学家建立与已经每天分析了亚马逊的照片数十亿图像相同的成熟技术。亚马逊Rekognition民主化深学习技术来检测物体,场景,概念和面孔您的图像,两幅图像之间比较的面孔,在数百万的面部特征向量执行搜索功能,您的企业可以与亚马逊Rekognition存储应用。亚马逊Rekognition的易于使用的API,这与Amazon S3和AWS LAMBDA整合,带来了深刻的学习到你的对象存betway88体育官网储。

入门Rekognition很简单。Rekognition的让我们通过一些核心的功能,帮助您打造强大的搜索,筛选,组织和图片验证应用。

对象与场景检测

给定一个图像,亚马逊Rekognition检测对象,场景和概念,然后生成标签,每一个信心评分。企业可以使用该元数据来创造社会共享和打印应用程序,分类为新闻和媒体影像档案,或进行有针对性的广告过滤搜索的索引。如果你上传图片到Amazon S3,很容易以调用传递图像到Amazon betway88体育官网Rekognition的AWS lambda函数与信心分数标签坚持到Elasticsearch指数。

面部分析

对于任何给定的图像,你现在可以侦测脸部存在,并从中获得脸部属性,如人口统计信息,情操,从表面主要地标。有了这个快速,准确的API,零售企业可以向他们的客户在网上或商店立即通过提供有针对性的广告做出回应。此外,这些属性可以被存储在亚马逊的红移来生成自己的客户更深刻的见解。

人脸识别

亚马逊Rekognition的脸比较和脸搜索功能,可以为企业提供基于面的验证,身份验证,并检测图像集合在一个特定的人的存在的能力。目前使用两个图像CompareFaces API,或通过调用亚马逊Rekognition的IndexFace API创建面的集合是否简单地比较面孔,企业可以依靠我们的专注于安全和隐私,因为没有图像是由Rekognition存储。每个检测到的面部被转化为不可逆的矢量表示,和该特征矢量(而不是底层图像本身)用于比较和搜索。

我很高兴地分享一些从我们的测试用户的正反馈。

雷德芬是使用现代技术来帮助人们购买和出售的房屋提供全方位服务的经纪公司。黄勇,大数据和分析,雷德芬主任告诉我们,雷德芬用户喜欢浏览他们的网站和移动应用程序性能的图像,他们希望更容易为他们的用户通过数以亿计的上市和图像的筛选。他还补充说,亚马逊Rekognition产生直接性的图像丰富的标签。这使得它相对简单的为他们构建一个智能搜索功能,可帮助用户根据自己的具体需求发现房子。而且,由于亚马逊Rekognition接受Amazon S3的URL,这是一个巨betway88体育官网大的节省时间为他们检测对象,场景和面孔,而无需左右移动图像。

总结这一切

我们是在机器学习和人工智能的早期。正如我们在亚马逊说,我们仍然在1日然而,我们已经看到了巨大的价值和神奇经历亚马逊AI可以给日常应用。我们希望使所有类型的开发者构建智能到他们的应用程序。必威体育精装版app官网对于数据的科学家,他们可以使用我们的P2的情况下,亚马逊EMR星火MLLib,深学习的AMI,MxNet和亚马逊ML建立自己的ML车型。对于应用程序开发必威体育精装版app官网人员,我们相信这三位亚马逊AI服务,使他们能够构建新一代应用听到的,看到的,与人类和我们周围的世界说话。

我们也将举办一个学习机“联盟的州“覆盖所有三个新AmazonAI服务今天宣布与摩托罗拉解决方案和俄亥俄州卫生演示沿 - 头以上幻影(!因为我们增加了更多的座位)同时,我们有一系列的分组会议使用MXNet在AWS回复:幻影酒店在拉斯维加斯11月30日创造。

评论

博客评论由Disqus