图木舒克网首页|网站导航

设为首页|加入收藏

您的位置:首页> 深度

手机看新闻

微软将开源数据集 提高机器的阅读理解能力

2019/11/7 11:37:19 zwb262302.cn

微软将开源数据集 提高机器的阅读理解能力。12 月 19 日消息,据外媒报道,微软将发布免费的数据集来帮助机器创建更多的对话。

undefined

该数据集名为微软机器阅读理解数据集(简称 MS MARCO),包含有 10 万条英文查询及对应回答。用来帮助人工智能系统更好地理解人类语言。

微软合作伙伴集团项目经理 Rangan Majumder 在周五的一篇博客中提到,微软将免费开放 MS MARCO,并希望能够与其他机构合作来更好地提高机器的阅读理解能力。

数据集中的资料来源于必应搜索和 Cortana,并做相应的匿名处理。对问题的回答则是基于互联网、人类手工编写以及经过验证的信息。这些查询和回复将用于建立深度学习模型。

当前,该数据集将对非商业用途的用户提供免费下载。同其他人工智能数据集开源计划类似,微软也将采用同样的方式开源 MS MARCO。

其中的一项是 ImageNet,可用于训练图像识别算法的图片标记数据库。微软此前在开发图片识别技术时用到 ImageNet,现在又用该数据库来强化微软计算机视觉 API 等产品。如果想了解更多有关 MS MARCO 的信息,可下载其研发团队发表的论文。该团队还在进行另外一项挑战,用 MARCO 的数据来评估训练模型,而评估脚本也还在研发中。

这项开源计划也是微软进一步发展其人工智能的举重要措。微软一直以来都在打造基于机器学习和人工智能的 Azure 云平台,同时在 Office 和 Windows 中也加入了一些人工智能的特性。本周早些时候,微软推出了 QnA Maker 云服务,用于降低开发者研制问答聊天机器人的难度。


相关阅读:
康奈尔大学申请条件 http://m.liuxue.com/

关于图木舒克网 | 广告服务 | 法律顾问 | 联系我们 | 网站声明 | 本网招聘 | 本网动态

增值电信业务经营许可证:苏B2-20040074 视听节目许可证号:1004072 广播电视节目制作经营许可证编号:苏字第471号

版权所有:图木舒克网·图木舒克网络传播有限公司 版权声明 Copyright@2002-2015 Inc.All Rights Reserved.

网络违法犯罪举报网站 | 12321网络不良与垃圾信息举报受理中心12300电信用户申诉受理中心 | 12318全国文化市场举报网站