开源AI可解释性研究工具Tracr

开源AI可解释性研究工具Tracr 2023-03-01 13:44:37 1320

DeepMind的研究人员开源了TRAnsformer Compiler for RASP(Tracr),这是一种将程序转换为神经网络模型的编译器。Tracr 旨在研究转换器 AI 模型(如 GPT-3)的机械可解释性。

Tracr 是限制访问序列处理 (RASP) 语言的编译器,该语言的开发是为了推理基于变压器的神经网络的运行方式;特别是解释为什么他们会产生他们所做的结果。Tracr允许研究人员在RASP中开发程序,然后将其编译成可运行的神经网络模型。目标是为评估AI可解释性工具提供“基本事实”模型。

随着深度学习模型变得越来越大和复杂,解释它们如何以及为什么产生特定的输出变得越来越困难。对人工智能可解释性技术的研究正在进行中,并寻求多种途径。DeepMind团队开发了Tracr来帮助实现机械可解释性,它试图对深度学习模型进行“逆向工程”。编程中的类比是从二进制可执行文件对高级源代码进行逆向工程。

因此,Tracr的类比是提供一种评估机制解释器的方法,方法是从高级源代码开始并将其编译为二进制文件。如果解释器可以复制原始源代码,则证明解释器结果是可信的。

易百纳社区

Tracr源代码类比

这个类比非常贴切,因为实际上Tracr是一种高级编程语言RASP的编译器。RASP 是一种用于指定转换器模型计算图的语言;RASP 基元映射到转换器组件,例如嵌入和注意力。RASP的开发旨在通过抽象计算的细节来允许研究人员“像变压器一样思考”。

继续编程类比,DeepMind团队为变形金刚创建了一个称为craft的“汇编语言”。模型在电路级别在工艺中指定;也就是说,完整神经网络的子图。Tracr编译器将模型的RASP规范转换为工艺,然后从工艺转换为具有具体权重的最终模型。

为了演示Tracr的使用,该团队实现了几个模型。虽然仅解码器的转换器模型通常用于自然语言处理(NLP)任务,如文本摘要或问答,但DeepMind研究人员使用Tracr创建模型更简单的任务:计算输入序列中的标记数量,对数字序列进行排序,并检查平衡括号。

除了用作测试可解释性工具的工具外,研究人员还指出了Tracr的其他潜在应用。例如,可以编译模型部分的手动编码实现,并用于替换由传统训练方法生成的模型部分;这可能会提高整体模型性能。

声明:本文内容由易百纳平台入驻作者撰写,文章观点仅代表作者本人,不代表易百纳立场。如有内容侵权或者其他问题,请联系本站进行删除。
红包 点赞 收藏 评论 打赏
评论
0个
内容存在敏感词
手气红包
    易百纳技术社区暂无数据
相关专栏
置顶时间设置
结束时间
删除原因
  • 广告/SPAM
  • 恶意灌水
  • 违规内容
  • 文不对题
  • 重复发帖
打赏作者
易百纳技术社区
您的支持将鼓励我继续创作!
打赏金额:
¥1易百纳技术社区
¥5易百纳技术社区
¥10易百纳技术社区
¥50易百纳技术社区
¥100易百纳技术社区
支付方式:
微信支付
支付宝支付
易百纳技术社区微信支付
易百纳技术社区
打赏成功!

感谢您的打赏,如若您也想被打赏,可前往 发表专栏 哦~

举报反馈

举报类型

  • 内容涉黄/赌/毒
  • 内容侵权/抄袭
  • 政治相关
  • 涉嫌广告
  • 侮辱谩骂
  • 其他

详细说明

审核成功

发布时间设置
发布时间:
是否关联周任务-专栏模块

审核失败

失败原因
备注
拼手气红包 红包规则
祝福语
恭喜发财,大吉大利!
红包金额
红包最小金额不能低于5元
红包数量
红包数量范围10~50个
余额支付
当前余额:
可前往问答、专栏板块获取收益 去获取
取 消 确 定

小包子的红包

恭喜发财,大吉大利

已领取20/40,共1.6元 红包规则

    易百纳技术社区