下面的正文是用户使用TibetanQA数据集须遵守的通用公共许可协议条款。用户下载、使用TibetanQA数据集,即表示用户接受本协议的所有条款。所有违反本条款的行为都将被视为对国家语言资源监测与研究少数民族语言中心知识产权的侵犯。接受本文件,并获得TibetanQA数据集的个人或单位在下文中称为"受益者"。
为推动藏语信息处理研究的发展,国家语言资源监测与研究少数民族语言中心公开发布TibetanQA数据集供研究人员做相关研究。
1. 免费使用TibetanQA数据集。
2. 向国家语言资源监测与研究少数民族语言中心提出关于数据收集方式、方法的改进建议。
3. 开展基于TibetanQA数据集的研究,形成自有知识产权的成果。
4. 基于TibetanQA数据集的研究结果与国家语言资源监测与研究少数民族语言中心进行合作,推出新的研究成果。
1. 尊重信息原始来源个人的隐私权,国家语言资源监测与研究少数民族语言中心只鼓励受益者使用TibetanQA数据集进行与藏语相关的统计特性与行为分析研究,这些研究可以针对特定人群,但不得针对特定人或导致对特定人的关注。
2. 在利用TibetanQA数据集进行深入研究而获得的成果中,需指明数据的提供方(国家语言资源监测与研究少数民族语言中心),并引用论文:
孙媛,刘思思,陈超凡,旦正错,赵小兵,面向机器阅读理解的高质量藏语数据集构建,第二十届中国计算语言学大会(The Twentieth China National Conference on Computational Linguistics, CCL 2021),2021.(https://aclanthology.org/2021.ccl-1.20/)
3. 禁止将TibetanQA数据集提供给第三方使用,第三方如有需要可直接访问本网站下载或提出介质(硬盘、光盘)拷贝申请。
4. 数据使用方有义务将使用数据获得的成果(项目、论文等)主动告知国家语言资源监测与研究少数民族语言中心;若国家语言资源监测与研究少数民族语言中心自行发现,也有权利将该成果名称列入该部分数据的成果列表。国家语言资源监测与研究少数民族语言中心不具有分享成果的权利。
5.TibetanQA数据集不得用于商业目的。
6. 数据使用协议条款内容如有变化,以线上最新版本为准。
国家语言资源监测与研究少数民族语言中心
2021年11月