欢迎光临
我们一直在努力
您的位置:首页>资讯 >

艾伦人工智能研究所的顶级人工智能和机器学习创新

微软联合创始人保罗艾伦于 2014 年创立了艾伦人工智能研究所,通过构建具有推理、学习和阅读能力的人工智能系统来实现科学突破。多年来,私人研究机构和创业孵化器推动了人工智能和机器学习的前沿。

我们在这里列出了他们的主要创新。

艾伦NLP

AllenNLP建立在PyTorch 之上,是一个开源模型。深度学习库支持实验的管理和开发后的评估。它为 NLP 模型提供高级抽象和 API,以及运行和管理这些实验的可扩展框架。它被大量组织使用,例如 Facebook Research、Airbnb 和 Amazon Alexa。

AllenNLP提供以下功能:

用于训练 PyTorch 模型的命令行工具

收集预训练模型以进行预测

做可复制科学的实验框架

常见NLP模型的可读参考实现

阿里斯托

Aristo 是艾伦人工智能研究所的宠物项目。它旨在构建集成阅读、学习、解释和推理技术的系统,以展示对世界的深刻理解。2019 年,Aristo 软件显示它可以在多项选择测试中获得超过 90% 的八年级学生的分数,并在高中生的测试中表现优于 80%。考虑到人工智能程序在 2016 年 8 万美元的艾伦人工智能科学挑战赛中的糟糕表现,阿里斯托在短短三年内取得的成就确实是一个杰作。

Aristo 项目结合了自然语言处理、信息提取、知识表示、机器推理和常识知识。到目前为止,该项目已部署在多跳推理、动作推理、语言模型探测推理等研究领域。

梅洛

艾伦人工智能研究所与华盛顿大学合作开发了多模态神经脚本知识模型 (Merlot)。该系统在数百万个带有转录语音的 YouTube 视频上进行了训练,以帮助它学习将视频中的图像与单词进行匹配,并随着时间的推移在全球范围内跟踪事件。这是一个无监督模型,视频没有标记或分类。

精灵

艾伦人工智能研究所、耶路撒冷希伯来大学和华盛顿大学创建了 GENIE,这是一个用于对文本生成进行人机循环评估的排行榜。迄今为止,排行榜的采用仅限于具有自动评估的设置。需要自然语言生成的开放式任务,如语言翻译,缺乏能够可靠和自动评估模型质量的技术。

GENIE 修复这些问题并将模型预测发布到众包平台,在该平台上,人工注释者根据预定参数对其进行评估。此外,GENIE 还结合了 BLEU 和 ROGUE 等流行指标,以显示它们与人类评估分数的相关性。

S2ORC 和 TLDR

语义学者开放研究语料库是 810 万篇英语学术论文的集合。根据这个大型语料库背后的团队的说法,该资源是最大的公开可用的机器可读学术文本集合之一,其中包括丰富的元数据、论文摘要、参考书目和开放获取论文的全文。此外,全文使用自动检测到的图、引文、表格等的内联提及进行注释,每个都链接到其相应的论文对象。

2020 年,S2ORC 为搜索结果激活了免费工具 TLDR(“太长,没读”的通用互联网首字母缩写词)。该工具可以将包含超过 5,000 个单词的文档平均用 21 个单词汇总,压缩比为 238。

艾伦法案

AllenAct是一个平台,旨在促进具身AI 的可重复研究,重点是模块化和灵活性。它通过预训练模型、实时可视化和其他教程支持多种训练环境和算法。它通过分离任务和环境来解决与嵌入式 AI 相关的挑战,例如数据复制、启动时间和培训成本。它还确保与涉及训练例程序列的专用算法的兼容性。AllenAct 的可视化可以与 TensorBoard 集成。

免责声明:本网站图片,文字之类版权申明,因为网站可以由注册用户自行上传图片或文字,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。